DeepSeek V4 拒绝辉达 找华为!阿里、字节跳动、腾讯抢买升腾950PR晶片

家中国最大的科技公司,同时在抢同一张晶片的货。阿里巴巴、字节跳动、腾讯已向华为批次采购升腾 950PR,合计订单达数十万颗。这批晶片本月刚开始量产,华为全年出货目标约 75 万颗。三家巨头的集中采购,已推动 950PR 价格在近几周上涨 20%。

这场抢货潮的触发点是 DeepSeek V4。三家公司计划在 V4 正式发布后,透过旗下云端服务将模型分发给企业和开发者,并整合至各自的 AI 应用。

950PR 的定价约 5 万人民币(约 6,900 美元),搭载 HBM 记忆体的高阶版则涨至 7 万人民币,但即便如此,仍挡不住这波采购潮。

DeepSeek V4 拒绝辉达,抢先让华为适配

这波订单背后,还有一个更大的战略讯号。据 Reuters 2 月 25 日的独家报导,DeepSeek 在 V4 发布前,只开放提前接触视窗给华为等中国晶片公司,明确拒绝了辉达(NVIDIA)和 AMD 的参与。

通常的惯例是在大型模型正式发布前,晶片公司可以提前取得模型,以便准备配套软体和最佳化工具。DeepSeek 这次的选择,让华为在 V4 公开发布前就取得了软体适配先机,而辉达则完全被排除在外。

DeepSeek 还一直与华为和晶片设计公司寒武纪合作,推进 V4 的硬体最优化工作。

DeepSeek V4 规格亮点

DeepSeek V4 采用 MoE(Mixture-of-Experts)架构,总引数量约 1 兆个,但每次推理仅启用约 370 亿个引数,有效维持低延迟与低成本。模型支援文字、图片和程式码的多模态输入,上下文视窗达 100 万 token,SWE-bench 程式码基准测试分数超过 80%。

根据 NxCode 的估算,V4 API 定价预估约为每百万 input tokens 0.14 美元,比西方前沿模型便宜 20 到 50 倍。

V4 原定 2026 年 2 月发布,但因为从辉达架构迁移到华为晶片需要重写底层程式码,一再延期。目前 DeepSeek 还在开发两个额外的 V4 变体,各自针对不同能力维度最佳化,均为中国晶片架构设计。

V4 预计在数周内发布。

加入动区 Telegram 频道

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
50
收藏
10
评论