DeepSeek V4 拒絕輝達 找華為!阿里、字節跳動、騰訊搶買昇騰950PR晶片

家中國最大的科技公司,同時在搶同一張晶片的貨。阿里巴巴、字節跳動、騰訊已向華為批次採購昇騰 950PR,合計訂單達數十萬顆。這批晶片本月剛開始量產,華為全年出貨目標約 75 萬顆。三家巨頭的集中採購,已推動 950PR 價格在近幾週上漲 20%。

這場搶貨潮的觸發點是 DeepSeek V4。三家公司計畫在 V4 正式發布後,透過旗下雲端服務將模型分發給企業和開發者,並整合至各自的 AI 應用。

950PR 的定價約 5 萬人民幣(約 6,900 美元),搭載 HBM 記憶體的高階版則漲至 7 萬人民幣,但即便如此,仍擋不住這波採購潮。

DeepSeek V4 拒絕輝達,搶先讓華為適配

這波訂單背後,還有一個更大的戰略訊號。據 Reuters 2 月 25 日的獨家報導,DeepSeek 在 V4 發布前,只開放提前接觸視窗給華為等中國晶片公司,明確拒絕了輝達(NVIDIA)和 AMD 的參與。

通常的慣例是在大型模型正式發布前,晶片公司可以提前取得模型,以便準備配套軟體和最佳化工具。DeepSeek 這次的選擇,讓華為在 V4 公開發布前就取得了軟體適配先機,而輝達則完全被排除在外。

DeepSeek 還一直與華為和晶片設計公司寒武紀合作,推進 V4 的硬體最優化工作。

DeepSeek V4 規格亮點

DeepSeek V4 採用 MoE(Mixture-of-Experts)架構,總引數量約 1 兆個,但每次推理僅啟用約 370 億個引數,有效維持低延遲與低成本。模型支援文字、圖片和程式碼的多模態輸入,上下文視窗達 100 萬 token,SWE-bench 程式碼基準測試分數超過 80%。

根據 NxCode 的估算,V4 API 定價預估約為每百萬 input tokens 0.14 美元,比西方前沿模型便宜 20 到 50 倍。

V4 原定 2026 年 2 月發布,但因為從輝達架構遷移到華為晶片需要重寫底層程式碼,一再延期。目前 DeepSeek 還在開發兩個額外的 V4 變體,各自針對不同能力維度最佳化,均為中國晶片架構設計。

V4 預計在數週內發布。

加入動區 Telegram 頻道

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
50
收藏
10
評論