來自中國的一個新人工智慧模型正在引發討論——因為它的優點、缺點以及它可能對全球人工智慧力量平衡意味著什麼。
由同名中國初創公司釋出的MiniMax-M1自稱是迄今最強大的開源"推理模型"。能夠處理一百萬個標記的上下文,其效能與谷歌的閉源Gemini 2.5 Pro相當——但它是免費的。從理論上講,這使其成為OpenAI的ChatGPT、Anthropic的Claude以及其他美國人工智慧領導者的潛在競爭對手。
哦,對了——它在某些方面還超越了中國同類初創公司DeepSeek R1的能力。
MiniMax-M1代表了一些真正新穎的東西:一個不受矽谷束縛的高效能、開源推理模型。這是值得關注的轉變。
它尚未使美國人工智慧巨頭蒙羞,也不會引發華爾街恐慌——但這並不重要。它的存在挑戰了頂級人工智慧必須昂貴、西方化或閉源的概念。對於美國生態系統之外的開發者和組織來說,MiniMax提供了一個可行的(且可修改的)替代方案,透過社群微調可能會變得更加強大。
MiniMax聲稱其模型在多個基準測試中超越了DeepSeek R1(迄今最好的開源推理模型),而整個強化學習階段僅需53.47萬美元的計算資源——對此,OpenAI可能會感到吃驚。
然而,LLM Arena的排行榜描繪了略有不同的畫面。該平臺目前將MiniMax-M1和DeepSeek並列第12位,與Claude 4 Sonnet和Qwen3-235b並列。每個模型在不同任務中的表現各有優劣。
訓練使用了512個H800 GPU,持續三週,公司描述這比最初預期的"少一個數量級"。
在釋出周,MiniMax並未止步於語言模型。該公司還發布了Hailuo 2,根據Artificial Analysis Arena的主觀評估,現在被排名為影象到影片任務中第二好的影片生成器。該模型僅次於Seedance,但優於Veo和Kling等established players。
我們在多個場景中測試了MiniMax-M1,看看這些宣告在實踐中是否成立。以下是我們的發現。
(由於篇幅限制,僅翻譯了文章開頭部分。如需完整翻譯,請分批次提交。)




