Ý tưởng của 链研社

Bài viết này được dịch máy

Xem bản gốc

"Cuộc cách mạng hiệu quả" về tỷ lệ băm của Trung Quốc hiệu quả hơn việc mở rộng dây chuyền sản xuất bằng cách tăng dung lượng lưu trữ. Một thực tế trái ngược với trực giác là các công ty AI của Trung Quốc đang đạt được kết quả tương tự với ít bộ nhớ hơn, và các bài báo đều là mã nguồn mở. Điều này có thể làm giảm chi phí suy luận của ba công ty lớn ở nước ngoài là OpenAI, Anthropic và Gemini xuống một bậc, tăng lợi nhuận gộp của họ, đồng thời giảm yêu cầu về bộ nhớ xuống một bậc. Lấy kiến trúc MLA của DeepSeek, tối ưu hóa bộ nhớ đệm KV và các công nghệ lượng tử hóa mô hình khác nhau làm ví dụ, những hành động này trực tiếp và đáng kể làm giảm mức sử dụng bộ nhớ GPU và yêu cầu băng thông trong giai đoạn suy luận, dẫn đến sự sụt giảm mạnh chi phí tạo ra một token duy nhất. Chi phí suy luận tốc độ cực cao của Zhipu và chi phí bộ nhớ đệm của Qianwen (Alibaba và Xiaomi) đã giảm xuống còn một phần mười. Bản chất của những hành động này là gì? Tất cả đều tập trung vào việc cải thiện hiệu quả nén thuật toán và tối đa hóa việc sử dụng tỷ lệ băm. Tuy nhiên, thị trường đang sử dụng những bản đồ cũ để tìm ra những con đường mới. Các công ty AI của Mỹ vẫn đang đổ mạnh vốn đầu tư, đặt trước một lượng lớn năng lực sản xuất và tỷ lệ băm. 700 tỷ đô la chi phí đầu tư đủ để toàn bộ Chuỗi ngành công nghiệp AI, từ thượng nguồn đến hạ nguồn, đều ăn mừng. Logic này là đúng; nhu cầu về tỷ lệ băm và bộ nhớ thực sự vẫn rất lớn và tăng trưởng nhanh chóng. Nhưng vấn đề là nó bỏ qua một khía cạnh khác: tiềm năng cải thiện hiệu quả tối ưu hóa tỷ lệ băm của Trung Quốc cũng đáng kinh ngạc không kém. Ai cũng tin rằng những người bán nước sẽ tiếp tục kiếm được tiền, nhưng không ai nhận ra rằng những người khai thác vàng đột nhiên đã học được cách tái chế nước. Nếu các công ty AI Trung Quốc tiếp tục giảm hiệu quả sử dụng bộ nhớ xuống 50%, liệu luận điểm về cổ phiếu lưu trữ, vốn đang được nâng đỡ bởi dòng vốn, có còn đúng nữa không? Lợi nhuận khổng lồ hiện nay trong Chuỗi ngành công nghiệp phần cứng AI phần lớn dựa trên sự phụ thuộc tuyệt đối vào bộ nhớ HBM (High Bandwidth Memory) cao cấp. Nếu nhu cầu về bộ nhớ từ các mô hình giảm, điều này có thể trực tiếp phá vỡ thế độc quyền của các nhà sản xuất hàng đầu hiện tại, và logic cơ bản của cổ phiếu lưu trữ và tỷ lệ băm, vốn dựa vào chi phí đầu tư để hỗ trợ định giá, sẽ bị lung lay. Dường như không ai trên thị trường thực sự tính toán xem cuộc cách mạng hiệu quả ở lớp thuật toán của Trung Quốc có thể tiết kiệm được bao nhiêu bộ nhớ. Tuy nhiên, xét một cách khách quan, nếu chi phí suy luận và mức sử dụng bộ nhớ giảm 50%, điều đó có thể dẫn đến sự gia tăng đột biến các cuộc gọi API tần suất cao từ các tác nhân AI suốt ngày đêm và sự bùng nổ mạnh mẽ trong các ứng dụng AI. Ngay cả khi lượng dữ liệu được sử dụng cho mỗi lần ít hơn, nếu tổng tần suất gọi tăng gấp mười lần, nhu cầu tuyệt đối về bộ nhớ và tỷ lệ băm vẫn sẽ tăng vọt. Tỷ lệ băm của Trung Quốc hiệu quả hơn so với việc mở rộng dây chuyền sản xuất thiết bị lưu trữ, và có thể phá vỡ thế độc quyền của các nhà sản xuất hàng đầu trước đây. Đây là rủi ro cần được chú ý hiện nay, cũng như việc liệu hiệu quả tỷ lệ băm có thể tiến xa đến đâu và liệu nó có thể tiếp tục được cải thiện và tối ưu hóa hay không. Điều không chắc chắn là khoảng thời gian "chưa định giá" này sẽ kéo dài bao lâu. Có thể ba tháng, cũng có thể một năm.

Từ Twitter

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan