據報道,DeepSeek計劃在2月中旬左右發佈其V4模型,如果內部測試結果可信,硅谷的人工智能巨頭們應該感到緊張。
據The Information報道,這家位於杭州的人工智能初創公司可能計劃在 2 月 17 日左右(農曆新年)發佈一款專門針對編碼任務設計的模型。直接瞭解該項目的人士稱,V4 在內部基準測試中表現優於 Anthropic 的 Claude 和 OpenAI 的 GPT 系列,尤其是在處理超長代碼提示時。
當然,目前尚未公開任何基準測試數據或關於該模型的信息,因此無法直接驗證這些說法。DeepSeek 也未證實這些傳聞。
不過,開發者社區並沒有等待官方消息。Reddit 上的 r/DeepSeek 和 r/LocalLLaMA 版塊已經熱鬧起來,用戶們紛紛囤積API 點數,X 平臺上的愛好者們也迅速分享了他們的預測:V4 版本可能會鞏固 DeepSeek 作為一家不屈不撓、不願遵循硅谷十億美元規則的“黑馬”的地位。
這並非DeepSeek首次顛覆市場。該公司於2025年1月發佈R1推理模型時,曾引發全球市場1萬億美元的拋售潮。
原因何在?DeepSeek 的 R1 模型在數學和推理基準測試中與 OpenAI 的 o1 模型不相上下,而據報道其開發成本僅為 600 萬美元——比競爭對手的成本低了約 68 倍。其 V3 模型後來在 MATH-500 基準測試中達到了 90.2% 的準確率,遠超 Claude 的 78.3%,而最近的更新“ V3.2 Speciale ”進一步提升了其性能。
V4 的編碼重點將是一項戰略性轉變。R1 側重於純粹的推理——邏輯、數學、形式化證明——而 V4 則是一種混合模型(推理和非推理任務),目標市場是企業級開發者市場,在這個市場中,高精度的代碼生成能夠直接轉化為收入。
為了確立主導地位,V4 需要超越 Claude Opus 4.5,後者目前保持著 SWE-bench 驗證準確率 80.9% 的記錄。但如果 DeepSeek 以往的發佈經驗可以作為參考,那麼即使中國人工智能實驗室面臨諸多限制,實現這一目標也並非不可能。
假設傳言屬實,這個小型實驗室是如何取得如此成就的?
該公司的秘密武器可能就藏在其1月1日發表的研究論文中:流形約束超連接(Manifold-Constrained Hyper-Connections,簡稱mHC)。這篇由創始人梁文峰參與撰寫的論文,旨在解決大型語言模型擴展過程中的一個根本性問題——如何在不導致模型不穩定或崩潰的情況下擴展其容量。
傳統人工智能架構強制所有信息通過單一狹窄的路徑傳遞。mHC 將這條路徑拓寬為多條信息流,使信息能夠自由交換而不會導致訓練崩潰。
Counterpoint Research 的人工智能首席分析師魏孫在接受Business Insider採訪時稱 mHC 是一項“驚人的突破”。她表示,這項技術表明,即使由於美國出口限制而難以獲得先進芯片,DeepSeek 也能“繞過計算瓶頸,實現智能的飛躍”。
Omdia首席分析師蘇連傑指出,DeepSeek願意公開其方法,這表明“人們對中國人工智能產業重拾信心”。該公司的開源模式使其深受開發者喜愛,開發者們認為它體現了OpenAI在轉向封閉模型和進行數十億美元融資之前的初衷。
並非所有人都信服。一些開發者在Reddit上抱怨DeepSeek的推理模型在簡單任務上浪費計算資源,而批評者則認為該公司的基準測試無法反映現實世界的複雜性。一篇題為“DeepSeek太爛了——我再也不假裝它好”的Medium文章在2025年4月迅速走紅,文章指責這些模型生成“充滿bug的樣板代碼”和“不切實際的庫”。
DeepSeek也揹負著一些包袱。隱私問題一直困擾著這家公司,一些政府甚至封禁了DeepSeek的原生應用。該公司與中國的聯繫以及其模型中存在的審查問題,都為技術層面的爭論增添了地緣政治的摩擦。
儘管如此,發展勢頭依然不容忽視。Deepseek 在亞洲已被廣泛採用,如果 V4 版本能夠兌現其編碼方面的承諾,那麼西方企業也可能會跟進採用。
還有時機問題。 據路透社報道,DeepSeek 最初計劃在 2025 年 5 月發佈 R2 型號,但由於創始人梁志強對其性能不滿意,因此延長了發佈時間。如今,V4 據稱計劃於 2 月發佈,R2 可能緊隨其後在 8 月發佈,該公司目前的推進速度表明其既急於求成,又信心十足。或許兩者兼而有之。





