Nvdia Rubin CPX上线推迟,基底订单未能实现 去年9月,英伟达推出了Rubin CPX的设计蓝图,预期会在2026年底上线。 但是在今年3月的GTC中,Rubin CPX 加速器完全没有出现在任何幻灯片或议程中,引发市场对其取消的猜测。NVIDIA 副总裁 Ian Buck 随后向 ComputerBase 确认 Rubin CPX 已被"延后",并定位到 Feynman 世代(预计 2028 年推出)。 CPX 经济性的本质——它本来就是 GDDR/HBM 价差套利产物,用便宜大容量内存承担 compute-bound 但带宽要求没那么极致的 prefill 工作。 当 GDDR7 绝对价格被卷进 DRAM 涨价周期(消费级 DRAM Q1 涨 75-80%,Q2 再 45-50%),这个卖点确实受损。 NVIDIA 官方给的取消原因:是工作负载结构变了 Ian Buck 原话:CPX 只改善 TTFT,不改善实际 token 速度,而 prefill 在整体工作负载里占比并不大。 在 agent-to-agent、400-500K KV context、1000 tokens/sec 的新场景下,瓶颈从 prefill 延迟转移到 decode 吞吐。 thelec.net/news/articleView.ht...…

相关赛道:
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享





