Bài viết này được dịch máy
Xem bản gốc

Ra mắt Nvidia Rubin CPX đã bị trì hoãn do không đáp ứng đủ các đơn đặt hàng sản phẩm cơ bản. Tháng 9 năm ngoái, Nvidia đã công bố lộ trình thiết kế cho Rubin CPX, với ra mắt năm 2026. Tuy nhiên, accelerator Rubin CPX hoàn toàn không xuất hiện trong bất kỳ slide hay chương trình nghị sự nào tại GTC vào tháng 3 năm nay, làm dấy lên suy đoán rằng nó đã bị hủy bỏ. Phó chủ tịch NVIDIA, Ian Buck, sau đó đã xác nhận với ComputerBase rằng Rubin CPX đã bị "trì hoãn" và được định vị cho thế hệ Feynman (dự kiến ​​ra mắt vào năm 2028). Về bản chất, mô hình kinh tế của CPX là sản phẩm của sự chênh lệch giá giữa GDDR và ​​HBM, sử dụng bộ nhớ dung lượng cao, giá rẻ để thực hiện công việc điền dữ liệu trước cho các tác vụ tính toán chuyên sâu mà không yêu cầu băng thông quá cao. Khi giá tuyệt đối của GDDR7 bị ảnh hưởng bởi chu kỳ tăng giá của DRAM (DRAM dành cho người tiêu dùng đã tăng 75-80% trong quý 1 và thêm 45-50% trong quý 2), lợi thế cạnh tranh này thực sự bị ảnh hưởng. Lý do chính thức mà NVIDIA đưa ra cho việc hủy bỏ là do thay đổi cấu trúc khối lượng công việc. Nguyên văn lời của Ian Buck: CPX chỉ cải thiện TTFT, chứ không phải tốc độ thực tế của token, và chiếm tỷ lệ một tỷ lệ nhỏ trong tổng khối lượng công việc. Trong kịch bản mới về giao tiếp giữa các tác nhân, với ngữ cảnh 400-500K KV và tốc độ 1000 token/giây, điểm nghẽn chuyển từ độ trễ điền trước sang thông lượng giải mã. thelec.net/news/articleView.ht...

Khu vực:
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận