Nvdia Rubin CPX上線推遲,基底訂單未能實現 去年9月,英偉達推出了Rubin CPX的設計藍圖,預期會在2026年底上線。 但是在今年3月的GTC中,Rubin CPX 加速器完全沒有出現在任何幻燈片或議程中,引發市場對其取消的猜測。NVIDIA 副總裁 Ian Buck 隨後向 ComputerBase 確認 Rubin CPX 已被"延後",並定位到 Feynman 世代(預計 2028 年推出)。 CPX 經濟性的本質——它本來就是 GDDR/HBM 價差套利產物,用便宜大容量內存承擔 compute-bound 但帶寬要求沒那麼極致的 prefill 工作。 當 GDDR7 絕對價格被捲進 DRAM 漲價週期(消費級 DRAM Q1 漲 75-80%,Q2 再 45-50%),這個賣點確實受損。 NVIDIA 官方給的取消原因:是工作負載結構變了 Ian Buck 原話:CPX 只改善 TTFT,不改善實際 token 速度,而 prefill 在整體工作負載裡佔比並不大。 在 agent-to-agent、400-500K KV context、1000 tokens/sec 的新場景下,瓶頸從 prefill 延遲轉移到 decode 吞吐。 thelec.net/news/articleView.ht...

相关赛道:
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論