Tác giả bài viết: BUBBLE
Vào tháng 1 năm 2025, sự ra đời của DeepSeek R 1 đã gây ra một cơn sóng lớn trong giới AI, đồng thời nó cũng thực sự thay đổi sinh thái Crypto AI. Trong một chu kỳ trước đó, Crypto AI chủ yếu xoay quanh AI Agent, nhưng DeepSeek R 1 và chiến lược mã nguồn mở của nó đã hoàn toàn thay đổi luật chơi: chi phí đào tạo cực thấp, phương pháp đào tạo thích ứng đột phá, khiến tầm nhìn phi tập trung hóa của ngành công nghiệp AI không còn là lời nói suông mà trở thành hiện thực trong tầm tay. Sự thay đổi này có ảnh hưởng sâu rộng, tổng giá trị thị trường Crypto AI đã giảm đáng kể, nhiều token AI trải qua đợt điều chỉnh hồi 70%, nhưng đây có thực sự là một cuộc khủng hoảng hay đây là dấu hiệu của một cuộc lột xác triệt để của Crypto AI?
Sự phát triển mạnh mẽ của DeepSeek
Sự phát triển của DeepSeek có thể truy ngược lại đến năm 2021. Vào thời điểm đó, quỹ phòng hộ tập trung vào giao dịch định lượng Vạn Phương bắt đầu tuyển dụng quy mô lớn các nhân tài AI, việc các công ty định lượng chuyển sang AI không phải là điều phổ biến, và những người họ tuyển dụng chủ yếu là những nhà nghiên cứu AI khám phá các hướng tiên phong, bao gồm các lĩnh vực như mô hình ngôn ngữ lớn (LLM) và mô hình tạo hình ảnh. Mặc dù có tin đồn rằng Vạn Phương đã chuyển đổi để tận dụng tốt hơn các tài nguyên GPU nhàn rỗi của công ty, nhưng phần lớn lý do vẫn là để chiếm lĩnh các công nghệ AI tiên phong như mô hình lớn.
Đến cuối năm 2022, Vạn Phương đã thu hút được ngày càng nhiều nhân tài AI hàng đầu, chủ yếu là sinh viên từ Đại học Thanh Hoa và Đại học Bắc Kinh. Được kích thích bởi ChatGPT, CEO Vạn Phương Lương Văn Phong quyết định tiến vào lĩnh vực trí tuệ nhân tạo tổng quát và thành lập DeepSeek vào đầu năm 2023. Tuy nhiên, sự bùng nổ nhanh chóng của các công ty AI như Trí Tuệ, Mặt Trăng Tối và Bách Xuyên Thông Minh đã khiến DeepSeek, với tư cách là một tổ chức nghiên cứu thuần túy và thiếu những nhà sáng lập nổi tiếng, gặp khó khăn lớn trong việc huy động vốn độc lập. Do đó, Vạn Phương quyết định tách DeepSeek ra khỏi công ty mẹ và tài trợ toàn bộ cho sự phát triển của nó, mặc dù quyết định này rất rủi ro, nhưng DeepSeek không cần phải chịu áp lực về lợi nhuận hoặc định giá từ các nhà tài trợ. Đồng thời, nó có một lượng tài nguyên GPU tương đối dồi dào, cho phép nhóm tập trung vào các bước đột phá về công nghệ, một nhóm những người trẻ đầy sáng tạo có thể tung hoành trên một miền đất màu mỡ, lúc này DeepSeek giống như một viện nghiên cứu hơn là một công ty.
Giống như OpenAI những ngày đầu, không ai nghĩ rằng một công ty nghiên cứu về robot chơi rubik's cube sẽ cuối cùng phát triển ra ChatGPT, cũng không ai nghĩ rằng Vạn Phương, một công ty làm định lượng, lại có thể sử dụng DeepSeek để phá vỡ bong bóng AI hiện tại, với 7 năm cho trường hợp trước và chỉ 2 năm cho trường hợp sau. Vào tháng 11 năm 2023, DeepSeek đã ra mắt mô hình ngôn ngữ lớn DeepSeek LLM với 67 tỷ tham số, có hiệu suất gần với GPT-4, vào tháng 5 năm 2024 ra mắt DeepSeek-V2, và vào tháng 12 cùng năm, DeepSeek-V3 đã đạt kết quả tương đương với GPT-4 và Claude 3.5 Sonnet trong các bài kiểm tra chuẩn. Sự tiến bộ công nghệ nhanh chóng của DeepSeek không phải do sức tài chính của công ty hay bằng cấp cao, mà là do một điểm công nghệ đột phá xảy ra sau "ảnh hưởng của ChatGPT đến ngành công nghiệp AI", các điểm đột phá nhỏ liên tiếp xảy ra trên bất kỳ nền tảng nào có thể đáp ứng được trí tưởng tượng, cho đến khi xuất hiện một điểm đột phá then chốt tiếp theo.

Cuối cùng, vào tháng 1 năm 2025, DeepSeek đã vượt qua điểm đột phá, sử dụng mô hình lớn thế hệ đầu tiên có khả năng lập luận DeepSeek-R 1 do họ nuôi dưỡng, với chi phí đào tạo thấp hơn nhiều so với ChatGPT-O 1 và hiệu suất vượt trội, mở ra cánh cửa ấy.
Sử dụng mã nguồn mở để phân phối chìa khóa mở cửa vũ trụ cho toàn thế giới
Chỉ một ngày sau khi DeepSeek R 1 được phát hành và công bố mã nguồn mở, Tổng thống Mỹ Donald Trump đã chính thức tuyên bố bắt đầu một kế hoạch "Cổng Vũ Trụ" với khoản đầu tư khổng lồ 500 tỷ USD tại họp báo Nhà Trắng. Một liên doanh có tên Stargate được thành lập bởi OpenAI, SoftBank, Oracle và công ty đầu tư MGX, nhằm xây dựng cơ sở hạ tầng trí tuệ nhân tạo mới cho OpenAI tại Mỹ.
Quy mô đầu tư này thậm chí còn vượt xa "Dự án Manhattan", có vẻ như muốn huy động toàn lực quốc gia, sử dụng các tầng lớp thuật toán để đẩy mạnh AI đóng cửa, độc quyền hóa thị trường AI, đảm bảo vị thế dẫn đầu của ngành công nghiệp AI trong nước. Nhưng khi kế hoạch này được công bố, họ chắc chắn không thể ngờ rằng chỉ vài ngày sau, mô hình mã nguồn mở từ bên kia Đại Tây Dương sẽ trực tiếp không mở cửa, không chỉ mang theo một cái búa để đập vào tường, mà còn đang phát búa cho những người khác.

DeepSeek, với tư cách là một mô hình mã nguồn mở có thể so sánh với các mô hình đóng cửa hàng đầu, đã gây ra một phản ứng dây chuyền với kiến trúc đào tạo hoàn toàn mới của mình, khiến các AI đóng cửa gặp khó khăn trong việc di chuyển, thậm chí các mô hình đóng cửa không thể theo kịp DeepSeek R 1 sẽ bị thị trường vốn loại bỏ trực tiếp, thậm chí Marc Andreessen, nhà sáng lập của A16z - "nhà đầu tư của OpenAI", cũng công khai tuyên bố cần tập trung nhiều hơn vào AI mã nguồn mở thay vì chú trọng vào AI đóng cửa. Trong ngành, không phân biệt ủng hộ khả năng xuất hiện AGI hay chỉ ủng hộ AI như một phiên bản nâng cấp của ngành dịch vụ phần mềm, đều nhận thấy rằng những tác hại của AI đóng cửa vượt xa lợi ích của nó, bất kể đó là hộp đen, độc quyền ngành, an ninh thông tin hay kiểm soát vốn, bất kỳ khía cạnh nào cũng đều là hướng phát triển rất nguy hiểm.
Mặc dù một số người trong ngành nghi ngờ về việc công nghệ "Mô hình Chuyên gia Hỗn Hợp (MoE)" của V3 cần một tập dữ liệu khổng lồ, nghi ngờ rằng nó đang sử dụng các mô hình của OpenAI để chưng cất, và về phương pháp học tăng cường (RL) trong R 1 cần nhiều tài nguyên phần cứng, nghi ngờ rằng họ đã gian lận về số lượng chip sử dụng trong quá trình đào tạo, nhưng điều này không ảnh hưởng đến sự cải cách cấu trúc ngành mà nó mang lại.
Việc mã nguồn mở của DeepSeek R 1 đã phá vỡ logic kinh doanh của các mô hình lớn đóng cửa của OpenAI, sử dụng logic tự tiến hóa của mô hình để tránh sự đầu tư lớn vào năng lực tính toán và gán nhãn dữ liệu truyền thống, mặc dù mô hình vẫn là hộp đen, nhưng chi phí hộp đen đã giảm đáng kể.
Ở cấp độ phần cứng AI, việc mã nguồn mở của DeepSeek V3 còn trực tiếp thách thức vị trí thống lĩnh thị trường của Nvidia, lợi thế cạnh tranh của GPU Nvidia chủ yếu là do nền tảng tính toán song song ở lớp dưới và mô hình lập trình CUDA, hệ sinh thái rộng lớn và số lượng nhà phát triển đủ lớn khiến việc sử dụng các chip không phải của Nvidia trong quá trình đào tạo có chi phí học tập quá cao, trong khi điều kiện mua hàng khắt khe và các hạn chế chính trị đã tạo ra sự phân mảnh trong sự phát triển của AI toàn cầu.
Đối với chúng ta, trong ngắn hạn, AI trên thị trường chứng khoán Mỹ sẽ co lại mạnh, tổng giá trị thị trường Crypto AI sẽ gần như bị chặt đứt, thị trường bước vào giai đoạn thị trường gấu. Nhưng trong dài hạn, con đường phát triển được công nhận nhiều nhất của ngành công nghiệp AI là hướng đi mã nguồn mở, minh bạch, phi tập trung. Dưới bất kỳ góc độ nào, sự kết hợp giữa Crypto và AI cũng sẽ trở nên ăn khớp hơn.
Sự cứu rỗi của Crypto AI, tiến lên! Tiến lên! Tiến lên không cần lựa chọn
Trong giai đoạn bong bóng của Crypto AI vừa vỡ, nhiều token khái niệm AI đã chịu đựng mức điều chỉnh hồi 70%, thị trường Crypto AI co lại đáng kể, có người châm biếm rằng "550.000 USD cũng có thể đào tạo ra một mô hình lớn, những token AI có giá trị thị trường cao như vậy, còn mua gì Crypto AI nữa". Quả thực, Crypto chỉ là một thị trường do vốn chi phối, chứ không
Hiện tại đã có nhiều Crypto AI hoặc sẽ sớm tích hợp DeepSeek, hoặc cập nhật trên kiến trúc của họ, bao gồm ElizaOS, Argo, Myshell, Build, Hyperbolic, Nillion Network, infraX và nhiều dự án khác. Một số dự án đã trực tiếp tối ưu hóa sản phẩm thông qua DeepSeek.
Myshell
Myshell đã tích hợp các mô hình V3, R 1 và thậm chí là mô hình tạo hình ảnh Janus-Pro vào quy trình sản xuất trợ lý trò chuyện và ứng dụng plugin, và đội ngũ kỹ thuật của Myshell đã hoàn thành việc tích hợp mô hình trong vòng nửa ngày. Myshell là một trong những dự án hiếm hoi trong blockchain vẫn kiên định cải thiện sản phẩm, thậm chí đã gây được tiếng vang trong các sản phẩm Web2 AI nhưng vẫn chưa muốn phát hành token. Việc DeepSeek mã nguồn mở sẽ mang lại tin vui về chi phí cho người dùng Myshell, giảm chi phí sẽ thu hút thêm nhiều nhà phát triển Agent cho sản phẩm đã hoàn thiện của Myshell.

Argo
Nhà phát triển Argo, Sam Gao, đã tích hợp DeepSeek vào các chức năng quan trọng của Argo ngay từ đầu khi thiết kế sản phẩm. Với tư cách là một hệ thống luồng công việc (workflow), Argo đã tích hợp LLM như một tiêu chuẩn DeepSeek R 1 và giao việc tạo ra luồng công việc ban đầu cho DeepSeek R 1. Do đặc thù của Workflow, việc tiêu thụ Token và lượng thông tin ngữ cảnh sẽ rất lớn, trung bình >= 10k Token. Argo cũng đã tích hợp CoT (Chain-of-Thought) vào quy trình tư duy Workflow. Sau khi DeepSeek mã nguồn mở, không chỉ giảm chi phí sản phẩm Workflow, mà người dùng còn có thể triển khai LLM cục bộ, đảm bảo an ninh và quyền riêng tư.

Trước khi DeepSeek R 1 ra mắt, Argo đã tích hợp logic huấn luyện mô hình sơ bộ Chain-of-Thought (CoT) vào quy trình tạo Agent Workflow. Đặc biệt là đối với các nhiệm vụ như giao dịch meme và phân tích xu hướng thị trường, Argo đã tùy chỉnh quy trình công việc của mình bằng Graph-of-Thought (GoT), đây là một phương pháp mới, xây dựng quá trình suy luận dưới dạng một đồ thị, trong đó các nút đại diện cho "Ý tưởng LLM" và các cạnh thể hiện mối quan hệ phụ thuộc giữa những ý tưởng này.
Vì Argo đã chọn GoT (hiện là dự án Crypto AI Workflow duy nhất sử dụng mô hình này), do đó đã đạt được quy trình đáng tin cậy và minh bạch hơn. Phương pháp sáng tạo này trực tiếp ảnh hưởng đến tính an toàn và độ tin cậy của các giao dịch trên nền tảng Argo. Tích hợp sơ đồ tư duy (GoT) vào các đại lý Web3 AI, khiến Argo đứng đầu trong lĩnh vực giao dịch tiền mã hóa AI. Cấu trúc suy luận của CoT không chỉ tăng cường an ninh cho các giao dịch tài chính, mà còn đảm bảo tính minh bạch, đáng tin cậy trong quá trình ra quyết định, điều này rất quan trọng trong tài chính phi tập trung (DeFi).

Đáng chú ý, nhà phát triển cốt lõi của Argo, Sam, đã hợp tác với Shaw viết một bài báo về "EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers", về cách loại bỏ các khái niệm không mong muốn từ các mô hình lan truyền văn bản đến hình ảnh mà không ảnh hưởng đến hiệu suất tổng thể của mô hình, và đã nhận được sự trợ giúp từ nhà nghiên cứu DeepSeek, XingchaoLiu.
Hyperbolic
Hyperbolic Labs cũng là một trong những dự án đầu tiên công bố việc lưu trữ mô hình DeepSeek-R 1 trên nền tảng GPU của họ, cho phép người dùng thuê tài nguyên GPU của Hyperbolic để chạy mô hình DeepSeek-R 1 tại địa phương hoặc trung tâm dữ liệu được chỉ định, mà không cần gửi dữ liệu nhạy cảm lên máy chủ của DeepSeek. Phương thức này vừa bảo vệ quyền riêng tư dữ liệu, vừa tận dụng được khả năng suy luận xuất sắc của mô hình DeepSeek, đồng thời thông qua mạng lưới tính toán phi tập trung của Hyperbolic, người dùng có thể tiếp cận năng lực suy luận hiệu quả của mô hình DeepSeek với chi phí thấp hơn, đây sẽ là một giải pháp cạnh tranh đối với các công ty khởi nghiệp, cá nhân kinh doanh hoặc những người sử dụng AI hiệu quả.

Đợt bong bóng vừa qua đã gây thiệt hại nặng nề cho thị trường Crypto AI, nhiều Token AI đã mất giá trị đầu cơ. Tuy nhiên, bản chất DeepSeek không phải là xóa sổ Crypto AI, mà là thúc đẩy thị trường tiến hóa nhanh hơn. Sau DeepSeek R 1, tương lai của Crypto AI sẽ không chỉ dựa vào đầu cơ, mà phải xoay quanh các hướng như tính toán AI phi tập trung, cơ chế kích thích kinh tế cho việc huấn luyện mô hình, phân phối tài nguyên AI công bằng, và các sản phẩm thực dụng. Thách thức thực sự là liệu Crypto có thể tận dụng được cuộc cách mạng công nghệ do DeepSeek mang lại để xây dựng một hệ sinh thái AI có giá trị thực, chứ không chỉ tạo ra các khái niệm và đầu cơ.
Đây không phải là kết thúc, mà là sự tiến hóa. Crypto AI cần phải tiến nhanh hơn, mạnh mẽ hơn. / Tăng tốc





