Ba trong số các công ty công nghệ lớn nhất Trung Quốc đang cạnh tranh nhau để sở hữu cùng một con chip. Alibaba, ByteDance và Tencent đã đặt hàng lần chip Ascend 950PR từ Huawei, với tổng số hàng trăm nghìn chiếc. Việc sản xuất hàng loạt các chip này chỉ mới bắt đầu trong tháng này, và mục tiêu bán ra hàng năm của Huawei là khoảng 750.000 chiếc. Việc tập trung mua hàng của ba gã khổng lồ này đã đẩy giá của chip 950PR tăng 20% trong những tuần gần đây.
Nguyên nhân dẫn đến cơn sốt mua sắm này chính là DeepSeek V4. Ba công ty này dự định phân phối các mô hình cho doanh nghiệp và nhà phát triển thông qua dịch vụ đám mây của họ sau khi V4 chính thức ra mắt, và tích hợp chúng vào các ứng dụng AI tương ứng.
Phiên bản 950PR có giá khoảng 50.000 RMB (khoảng 6.900 USD), trong khi phiên bản cao cấp trang bị bộ nhớ HBM có giá lên tới 70.000 RMB, nhưng dù vậy, nó vẫn không thể ngăn cản làn sóng mua hàng này.
DeepSeek V4 từ chối Nvidia và ưu tiên khả năng tương thích với Huawei.
Đằng sau làn sóng đơn đặt hàng này là một tín hiệu chiến lược lớn hơn. Theo một báo cáo độc quyền của Reuters ngày 25 tháng 2, DeepSeek chỉ mở cửa sổ truy cập sớm cho các công ty sản xuất chip Trung Quốc như Huawei trước khi phát hành V4, từ chối rõ ràng sự tham gia của NVIDIA và AMD.
Thông thường, các công ty sản xuất chip sẽ có được mô hình sản xuất quy mô lớn trước khi ra mắt chính thức để chuẩn bị phần mềm hỗ trợ và các công cụ tối ưu hóa. Lần này, việc DeepSeek lựa chọn phương án này đã mang lại cho Huawei lợi thế về khả năng thích ứng phần mềm trước khi V4 được phát hành rộng rãi, trong khi Nvidia hoàn toàn bị loại trừ.
DeepSeek cũng đang hợp tác với Huawei và công ty thiết kế chip Cambricon để thúc đẩy tối ưu hóa phần cứng cho V4.
Thông số kỹ thuật nổi bật của DeepSeek V4
DeepSeek V4 sử dụng kiến trúc MoE (Mixture-of-Experts), với tổng số khoảng 1 nghìn tỷ tham chiếu, nhưng chỉ sử dụng khoảng 37 tỷ tham chiếu lần lần suy luận, duy trì hiệu quả độ trễ thấp và chi phí thấp. Mô hình hỗ trợ đầu vào đa phương thức bao gồm văn bản, hình ảnh và mã, với cửa sổ ngữ cảnh lên đến 1 triệu token, và đạt điểm số vượt quá 80% trong chuẩn mã SWE-bench.
Theo ước tính của NxCode , API V4 có giá khoảng 0,14 đô la cho mỗi triệu token đầu vào, rẻ hơn từ 20 đến 50 lần so với các mô hình hàng đầu của phương Tây.
Ban đầu, V4 dự kiến ra mắt vào tháng 2 năm 2026, nhưng đã liên tục bị trì hoãn do cần phải viết lại mã nguồn khi chuyển đổi từ kiến trúc NVIDIA sang chip Huawei. DeepSeek hiện đang phát triển thêm hai phiên bản V4 khác, mỗi phiên bản được tối ưu hóa cho các khả năng khác nhau và cả hai đều được thiết kế cho kiến trúc chip của Trung Quốc.
Phiên bản V4 dự kiến sẽ được phát hành trong vài tuần tới.






