来自中国的一个新人工智能模型正在引发讨论——因为它的优点、缺点以及它可能对全球人工智能力量平衡意味着什么。
由同名中国初创公司发布的MiniMax-M1自称是迄今最强大的开源"推理模型"。能够处理一百万个标记的上下文,其性能与谷歌的闭源Gemini 2.5 Pro相当——但它是免费的。从理论上讲,这使其成为OpenAI的ChatGPT、Anthropic的Claude以及其他美国人工智能领导者的潜在竞争对手。
哦,对了——它在某些方面还超越了中国同类初创公司DeepSeek R1的能力。
MiniMax-M1代表了一些真正新颖的东西:一个不受硅谷束缚的高性能、开源推理模型。这是值得关注的转变。
它尚未使美国人工智能巨头蒙羞,也不会引发华尔街恐慌——但这并不重要。它的存在挑战了顶级人工智能必须昂贵、西方化或闭源的概念。对于美国生态系统之外的开发者和组织来说,MiniMax提供了一个可行的(且可修改的)替代方案,通过社区微调可能会变得更加强大。
MiniMax声称其模型在多个基准测试中超越了DeepSeek R1(迄今最好的开源推理模型),而整个强化学习阶段仅需53.47万美元的计算资源——对此,OpenAI可能会感到吃惊。
然而,LLM Arena的排行榜描绘了略有不同的画面。该平台目前将MiniMax-M1和DeepSeek并列第12位,与Claude 4 Sonnet和Qwen3-235b并列。每个模型在不同任务中的表现各有优劣。
训练使用了512个H800 GPU,持续三周,公司描述这比最初预期的"少一个数量级"。
在发布周,MiniMax并未止步于语言模型。该公司还发布了Hailuo 2,根据Artificial Analysis Arena的主观评估,现在被排名为图像到视频任务中第二好的视频生成器。该模型仅次于Seedance,但优于Veo和Kling等established players。
我们在多个场景中测试了MiniMax-M1,看看这些声明在实践中是否成立。以下是我们的发现。
(由于篇幅限制,仅翻译了文章开头部分。如需完整翻译,请分批次提交。)




