Mistral Medium 3 昨天发布,将该模型定位为对企业人工智能部署经济性的直接挑战。
这家成立于2023年的巴黎初创公司,由前谷歌DeepMind和Meta AI研究员创立,发布了据称在运营成本上仅为可比较模型八分之一的前沿性能模型。
"Mistral Medium 3提供前沿性能,同时成本低一个数量级,"该公司表示。
该模型是Mistral AI迄今最强大的专有产品,区别于包括Mistral 7B、Mixtral、Codestral和Pixtral在内的开源产品组合。
每百万输入代币0.4美元,每百万输出代币2美元,Medium 3显著低于竞争对手的价格,同时保持性能平衡。独立评估机构Artificial Analysis将该模型定位为"非推理模型中的领先模型,Medium 3可与Llama 4 Maverick、Gemini 2.0 Flash和Claude 3.7 Sonnet相媲美"。
该模型在专业领域表现尤为出色。
人工评估显示在编程任务中有卓越表现,Mistral AI代表Sophia Yang指出:"Mistral Medium 3在编程领域表现出色,整体性能远超其规模更大的竞争对手。"
基准测试结果表明,Medium 3在多个测试类别中的表现与Anthropic的Claude Sonnet 3.7相当或更高,在编程和推理等专业领域显著优于Meta的Llama 4 Maverick和Cohere的Command A。
该模型的上下文窗口为128,000代币,多模态功能使其能够处理40种语言的文档和视觉输入。
但与使Mistral闻名的模型不同,用户将无法修改或在本地运行它。
目前,开源爱好者最佳选择是Mixtral-8x22B-v0.3,这是一个由8个每个220亿参数的专家模型组成的混合模型。除了Mixtral,该公司还有十多个不同的开源模型可用。
它最初仅面向企业部署,而非通过Mistral的聊天机器人界面LeChat进行国内使用。Mistral AI强调了模型的企业适应能力,支持持续预训练、全面微调,并可集成到企业知识库中用于特定领域的应用。
金融服务、能源和医疗保健行业的测试版客户正在测试该模型,用于客户服务增强、业务流程个性化和复杂数据集分析。
API将立即在Mistral La Plateforme和Amazon Sagemaker上推出,并计划后续集成到IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex。
这一公告在社交媒体平台引发了广泛讨论,人工智能研究人员赞扬了成本效率的突破,同时指出专有性质可能是一个限制。
该模型的闭源状态与Mistral此前的开放权重产品不同,尽管公司暗示将来会有新的发布。
Mistral开发者关系负责人Sophia Yang在公告中暗示:"随着3月份Mistral Small和今天的Mistral Medium的发布,我们接下来几周将推出'大型'模型已不是秘密。考虑到我们的中型模型已经明显优于Llama 4 Maverick等旗舰开源模型,我们对即将推出的内容感到兴奋。"
Mistral比平均模型更不容易产生幻觉,这对于其规模来说是个好消息。
它优于Meta Llama-4 Maverick、Deepseek V3和Amazon Nova Pro等。目前,产生幻觉最少的模型是谷歌最近推出的Gemini 2.5 Pro。
尽管自去年发布Mistral Large 2以来一直保持低调,但这家巴黎公司的业务增长仍令人印象深刻。
Mistral最近推出了企业版Le Chat聊天机器人,可与Microsoft SharePoint和Google Drive集成,CEO Arthur Mensch告诉路透社,他们"在过去100天内将业务增长了两倍,尤其是在欧洲和美国以外地区"。
这家估值60亿美元的公司正在展示其技术独立性,通过运营自己的计算基础设施并减少对美国云提供商的依赖,这一战略举措在特朗普总统对科技产品征收关税后的欧洲关系紧张背景下引起共鸣。
Mistral声称以消费者友好的价格实现企业级性能的说法是否能在实际部署中成立,尚待验证。
但就目前而言,Mistral已将Medium 3定位为在一个通常认为更大(且更贵)就意味着更好的行业中的一个引人注目的中间选择。
编辑:Josh Quittner和Sebastian Sinclair


