Mistral Medium 3 昨天釋出,將該模型定位為對企業人工智慧部署經濟性的直接挑戰。
這家成立於2023年的巴黎初創公司,由前谷歌DeepMind和Meta AI研究員創立,釋出了據稱在運營成本上僅為可比較模型八分之一的前沿效能模型。
"Mistral Medium 3提供前沿效能,同時成本低一個數量級,"該公司表示。
該模型是Mistral AI迄今最強大的專有產品,區別於包括Mistral 7B、Mixtral、Codestral和Pixtral在內的開源產品組合。
每百萬輸入代幣0.4美元,每百萬輸出代幣2美元,Medium 3顯著低於競爭對手的價格,同時保持效能平衡。獨立評估機構Artificial Analysis將該模型定位為"非推理模型中的領先模型,Medium 3可與Llama 4 Maverick、Gemini 2.0 Flash和Claude 3.7 Sonnet相媲美"。
該模型在專業領域表現尤為出色。
人工評估顯示在程式設計任務中有卓越表現,Mistral AI代表Sophia Yang指出:"Mistral Medium 3在程式設計領域表現出色,整體效能遠超其規模更大的競爭對手。"
基準測試結果表明,Medium 3在多個測試類別中的表現與Anthropic的Claude Sonnet 3.7相當或更高,在程式設計和推理等專業領域顯著優於Meta的Llama 4 Maverick和Cohere的Command A。
該模型的上下文視窗為128,000代幣,多模態功能使其能夠處理40種語言的文件和視覺輸入。
但與使Mistral聞名的模型不同,使用者將無法修改或在本地執行它。
目前,開源愛好者最佳選擇是Mixtral-8x22B-v0.3,這是一個由8個每個220億引數的專家模型組成的混合模型。除了Mixtral,該公司還有十多個不同的開源模型可用。
它最初僅面向企業部署,而非透過Mistral的聊天機器人介面LeChat進行國內使用。Mistral AI強調了模型的企業適應能力,支援持續預訓練、全面微調,並可整合到企業知識庫中用於特定領域的應用。
金融服務、能源和醫療保健行業的測試版客戶正在測試該模型,用於客戶服務增強、業務流程個性化和複雜資料集分析。
API將立即在Mistral La Plateforme和Amazon Sagemaker上推出,並計劃後續整合到IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex。
這一公告在社交媒體平臺引發了廣泛討論,人工智慧研究人員讚揚了成本效率的突破,同時指出專有性質可能是一個限制。
該模型的閉源狀態與Mistral此前的開放權重產品不同,儘管公司暗示將來會有新的釋出。
Mistral開發者關係負責人Sophia Yang在公告中暗示:"隨著3月份Mistral Small和今天的Mistral Medium的釋出,我們接下來幾周將推出'大型'模型已不是秘密。考慮到我們的中型模型已經明顯優於Llama 4 Maverick等旗艦開源模型,我們對即將推出的內容感到興奮。"
Mistral比平均模型更不容易產生幻覺,這對於其規模來說是個好訊息。
它優於Meta Llama-4 Maverick、Deepseek V3和Amazon Nova Pro等。目前,產生幻覺最少的模型是谷歌最近推出的Gemini 2.5 Pro。
儘管自去年釋出Mistral Large 2以來一直保持低調,但這家巴黎公司的業務增長仍令人印象深刻。
Mistral最近推出了企業版Le Chat聊天機器人,可與Microsoft SharePoint和Google Drive整合,CEO Arthur Mensch告訴路透社,他們"在過去100天內將業務增長了兩倍,尤其是在歐洲和美國以外地區"。
這家估值60億美元的公司正在展示其技術獨立性,透過運營自己的計算基礎設施並減少對美國雲提供商的依賴,這一戰略舉措在特朗普總統對科技產品徵收關稅後的歐洲關係緊張背景下引起共鳴。
Mistral聲稱以消費者友好的價格實現企業級效能的說法是否能在實際部署中成立,尚待驗證。
但就目前而言,Mistral已將Medium 3定位為在一個通常認為更大(且更貴)就意味著更好的行業中的一個引人注目的中間選擇。
編輯:Josh Quittner和Sebastian Sinclair




