Tác giả: Giá trị của Chuỗi Carbon
Xu hướng phát triển của Ai+Crypto dường như đang diễn ra nhanh chóng. Chỉ là cách thức diễn ra lần này hơi khác với những gì mọi người tưởng tượng trước đó. Đó là theo cách làm sụp đổ lẫn nhau. Ai trước tiên sụp đổ thị trường vốn truyền thống, sau đó sụp đổ thị trường Crypto.
Vào ngày 27 tháng 1, mô hình Ai lớn của Trung Quốc DeepSeek đột nhiên nổi lên, số lượng tải xuống lần đầu tiên vượt qua ChatGPT. Đứng đầu bảng xếp hạng APP Store của Mỹ. Gây chấn động toàn ngành công nghệ, giới đầu tư và thậm chí cả giới truyền thông.

Sự kiện này không chỉ khiến mọi người liên tưởng đến khả năng cấu trúc phát triển công nghệ Trung - Mỹ bị thay đổi trong tương lai. Nó cũng truyền tải một cảm giác hoảng loạn tạm thời đến thị trường vốn Mỹ. Chịu ảnh hưởng của điều này, Nvidia giảm 5,3%, ARM giảm 5,5%, Broadcom giảm 4,9%, TSMC giảm 4,5%, cũng như Micron, AMD, Intel đều có mức giảm tương ứng. Thậm chí, hợp đồng tương lai Nasdaq 100 giảm xuống -400 điểm. Có khả năng lập kỷ lục giảm mạnh nhất trong một ngày kể từ ngày 18 tháng 12. Theo ước tính không đầy đủ, thị trường chứng khoán Mỹ có thể bốc hơi hơn 1 nghìn tỷ USD về giá trị vốn hóa trong phiên giao dịch thứ Hai. Giảm một phần ba tổng giá trị thị trường tiền mã hóa.
Thị trường tiền mã hóa, cùng với diễn biến của thị trường chứng khoán Mỹ, cũng xuất hiện hiện tượng sụp đổ do DeepSeek. Trong đó, Bitcoin giảm xuống dưới 10.500 USD, giảm 4,48% trong 24 giờ. ETH giảm xuống dưới 3.200 USD, giảm 3,83% trong 24 giờ. Nhiều người vẫn còn đang lúng túng suy nghĩ tại sao thị trường tiền mã hóa lại xuất hiện sự sụt giảm nhanh chóng như vậy? Có thể liên quan đến kỳ vọng về việc Cục dự trữ liên bang Hoa Kỳ giảm lãi suất hoặc các yếu tố vĩ mô khác.
Vậy thì cảm giác hoảng loạn của thị trường đến từ đâu? DeepSeek không phải là công ty được phát triển bằng cách tích lũy nguồn vốn và số lượng card đồ họa khổng lồ như OpenAI, Meta hay Googel. OpenAI được thành lập 10 năm trước, có 4.500 nhân viên, cho đến nay đã huy động được 6,6 tỷ USD. Meta đã chi 60 tỷ USD để phát triển một trung tâm dữ liệu trí tuệ nhân tạo gần bằng kích thước Manhattan. Ngược lại, DeepSeek được thành lập chưa đến 2 năm, có 200 nhân viên, chi phí phát triển dưới 10 triệu USD. Họ không tốn kém để tích lũy card GPU của Nvidia.
Không ít người không khỏi tự hỏi: Họ sẽ làm thế nào để cạnh tranh với DeepSeek?
Những gì DeepSeek đã phá vỡ không chỉ là lợi thế về chi phí vốn/kỹ thuật, mà còn là những quan niệm và ý thức hệ truyền thống mà mọi người vẫn nắm giữ.
Phó chủ tịch sản phẩm của DropBox đã than thở trên mạng xã hội X rằng, DeepSeek là một câu chuyện về sự lật đổ truyền thống. Các doanh nghiệp hiện tại đều đang cải thiện các quy trình hiện có, trong khi những kẻ lật đổ lại suy nghĩ lại về các phương pháp cơ bản. DeepSeek đã đặt câu hỏi: Nếu chúng ta làm việc này một cách thông minh hơn, thay vì đầu tư thêm phần cứng, thì sẽ như thế nào?
Cần biết rằng, hiện nay, chi phí đào tạo các mô hình trí tuệ nhân tạo hàng đầu là cực kỳ đắt đỏ. Các công ty như OpenAI, Anthropic chỉ tính riêng về tính toán đã tốn hơn 100 triệu USD. Họ cần phải trang bị các trung tâm dữ liệu lớn với hàng nghìn card GPU trị giá 40.000 USD. Giống như cần cả một nhà máy điện để vận hành một nhà máy vậy.
Công ty DeepSeek đột nhiên xuất hiện và nói: "Nếu chúng tôi chỉ cần 5 triệu USD để làm điều này, thì sao?". Họ không chỉ nói suông, mà thực sự đã làm được. Mô hình của họ ở nhiều nhiệm vụ tương đương hoặc thậm chí vượt trội hơn GPT-4 và Claude. Họ làm được như thế nào? Họ đã hoàn toàn suy nghĩ lại mọi thứ từ đầu. Trí tuệ nhân tạo truyền thống giống như viết mỗi số bằng 32 bit. DeepSeek như "Nếu chúng ta chỉ sử dụng 8 bit thì sao? Nó vẫn đủ chính xác!". Bộ nhớ cần thiết giảm 75%.
Phó chủ tịch sản phẩm của DropBox nói, kết quả gây sửng sốt là chi phí đào tạo đã giảm từ 100 triệu USD xuống còn 5 triệu USD. Số lượng GPU cần thiết từ 100.000 xuống còn 2.000. Chi phí API giảm 95%. Có thể chạy trên GPU game, không cần phần cứng trung tâm dữ liệu. Quan trọng hơn, họ còn là mã nguồn mở. Đây không phải là phép màu, chỉ là kỹ thuật khéo léo đến không thể tin nổi.
Một số người còn cho rằng, Deepseek đã hoàn toàn lật đổ những quan niệm truyền thống trong lĩnh vực trí tuệ nhân tạo:
Trung Quốc chỉ biết làm công nghệ đóng mã nguồn/chuyên quyền.
Thung lũng Silicon là trung tâm phát triển trí tuệ nhân tạo toàn cầu, với lợi thế vượt trội.
OpenAI có hệ thống bảo vệ không thể vượt qua.
Bạn cần phải chi hàng tỷ hoặc hàng trăm tỷ USD để phát triển các mô hình SOTA.
Giá trị của mô hình sẽ tiếp tục tích lũy (giả thuyết mô hình béo).
Giả thuyết về khả năng mở rộng có nghĩa là hiệu suất của mô hình tỷ lệ tuyến tính với chi phí đầu vào (tính toán, dữ liệu, GPU). Tất cả những quan niệm truyền thống này, ngay cả khi chưa bị lật đổ hoàn toàn trong một đêm, cũng đã bị lung lay.
Công ty đầu tư cổ phần nổi tiếng của Mỹ Archerman Capital đánh giá về DeepSeek trong một bản tin rằng, trước hết, DeepSeek đại diện cho một chiến thắng của mã nguồn mở so với công nghệ độc quyền, sự đóng góp của họ cho cộng đồng sẽ nhanh chóng chuyển thành sự phát triển sôi nổi của toàn bộ cộng đồng mã nguồn mở, tôi tin rằng bao gồm cả Meta, các lực lượng mã nguồn mở sẽ tiếp tục phát triển các mô hình mã nguồn mở trên cơ sở này.
Thứ hai, con đường làm phép màu của OpenAI tạm thời có vẻ đơn giản và thô bạo, nhưng cũng không排除khi đạt đến một mức độ nhất định sẽ xuất hiện sự thay đổi về chất, lúc đó khoảng cách giữa mã nguồn mở và mã nguồn đóng lại sẽ mở rộng, điều này cũng khó nói trước. Dựa trên lịch sử phát triển của trí tuệ nhân tạo trong 70 năm qua, tỷ lệ băm là vô cùng quan trọng, có thể trong tương lai vẫn là như vậy.
Sau đó, DeepSeek đã khiến các mô hình mã nguồn mở và mã nguồn đóng trở nên tương đương, thậm chí hiệu quả hơn, nhu cầu phải mua API của OpenAI đã giảm, việc triển khai riêng và tự điều chỉnh sẽ mang lại nhiều không gian phát triển hơn cho các ứng dụng hạ nguồn, trong vòng một hoặc hai năm tới, hầu như chắc chắn sẽ chứng kiến nhiều sản phẩm chip suy luận phong phú hơn, sinh thái ứng dụng LLM sôi động hơn.
Cuối cùng, nhu cầu về tỷ lệ băm sẽ không giảm, có một định luật Jevons nói rằng trong thời kỳ cách mạng công nghiệp lần thứ nhất, việc cải thiện hiệu quả của máy hơi nước lại khiến tổng lượng tiêu thụ than tăng lên. Tương tự, từ thời kỳ điện thoại di động lớn đến thời kỳ phổ biến điện thoại Nokia, chính vì rẻ hơn nên mới có thể phổ biến, và vì phổ biến nên tổng lượng tiêu thụ thị trường tăng lên.





