Tác giả: BUBBLE, BlockBeats
Vào tháng 1 năm 2025, sự ra đời của DeepSeek R1 đã gây chấn động trong lĩnh vực trí tuệ nhân tạo (AI), đồng thời nó cũng thực sự thay đổi sinh thái Crypto AI. Trong một chu kỳ trước đó, Crypto AI chủ yếu xoay quanh AI Agent, nhưng DeepSeek R1 và chiến lược mã nguồn mở của nó đã hoàn toàn thay đổi luật chơi: chi phí đào tạo cực thấp, phương pháp đào tạo thích ứng đột phá, khiến tầm nhìn phi tập trung hóa ngành công nghiệp AI không còn là lời nói suông mà trở thành hiện thực trong tầm tay. Sự thay đổi này có ảnh hưởng sâu rộng, tổng giá trị thị trường Crypto AI đã giảm đáng kể, nhiều token AI trải qua đợt điều chỉnh hồi 70%, nhưng đây có thực sự là một cuộc khủng hoảng hay đây là dấu hiệu của một cuộc lột xác triệt để của Crypto AI?
Sự phát triển mạnh mẽ của DeepSeek
Sự phát triển của DeepSeek có thể truy ngược đến năm 2021. Vào thời điểm đó, quỹ phòng hộ tập trung vào giao dịch định lượng Vạn Phương bắt đầu tuyển dụng quy mô lớn các nhân tài AI, việc các công ty định lượng chuyển sang AI không phải là điều phổ biến, và những người họ tuyển dụng chủ yếu là những nhà nghiên cứu AI khám phá các hướng tiên phong, bao gồm các lĩnh vực như mô hình ngôn ngữ lớn (LLM) và mô hình tạo hình ảnh. Mặc dù có tin đồn rằng Vạn Phương đã chuyển đổi để tốt hơn sử dụng các tài nguyên GPU nhàn rỗi của công ty, nhưng phần lớn lý do vẫn là để chiếm lĩnh vị thế tiên phong trong các công nghệ AI tiên tiến như mô hình ngôn ngữ lớn.
Đến cuối năm 2022, Vạn Phương đã thu hút ngày càng nhiều nhân tài AI hàng đầu, chủ yếu là sinh viên từ Đại học Thanh Hoa và Đại học Bắc Kinh. Được kích thích bởi ChatGPT, Giám đốc điều hành Vạn Phương Lương Văn Phong quyết định tiến vào lĩnh vực trí tuệ nhân tạo tổng quát và thành lập DeepSeek vào đầu năm 2023. Tuy nhiên, sự bùng nổ nhanh chóng của các công ty AI như Trí Tuệ, Mặt Trăng Tối và Bách Xuyên Thông Minh đã khiến DeepSeek, với tư cách là một tổ chức nghiên cứu thuần túy và thiếu những nhà sáng lập nổi tiếng, gặp rất nhiều khó khăn trong việc huy động vốn độc lập. Do đó, Vạn Phương quyết định tách DeepSeek ra khỏi công ty mẹ và tài trợ toàn bộ cho sự phát triển của nó, mặc dù quyết định này rất rủi ro, nhưng DeepSeek không cần phải chịu áp lực về lợi nhuận hoặc định giá từ các nhà tài trợ. Đồng thời, nó có nguồn tài nguyên GPU tương đối dồi dào, cho phép nhóm tập trung vào các bước đột phá về công nghệ, một nhóm những người trẻ đầy sáng tạo có thể tung hoành trên một miền đất màu mỡ, lúc này DeepSeek giống như một viện nghiên cứu hơn là một công ty.
Giống như thời kỳ đầu của OpenAI, không ai nghĩ rằng một công ty nghiên cứu về robot chơi rubik's cube sẽ cuối cùng phát triển ra ChatGPT, cũng không ai nghĩ rằng Vạn Phương, một công ty làm định lượng, lại có thể sử dụng DeepSeek để phá vỡ bong bóng AI hiện tại, với 7 năm cho trường hợp trước và chỉ 2 năm cho trường hợp sau. Vào tháng 11 năm 2023, DeepSeek đã ra mắt mô hình ngôn ngữ lớn DeepSeek LLM với 67 tỷ tham số, có hiệu suất gần với GPT-4, vào tháng 5 năm 2024 ra mắt DeepSeek-V2, và vào tháng 12 cùng năm, DeepSeek-V3 đã đạt kết quả tương đương với GPT-4 và Claude 3.5 Sonnet trong các bài kiểm tra chuẩn. Sự tiến bộ công nghệ nhanh chóng của DeepSeek không phải do sức mạnh tài chính của công ty hay bằng cấp cao, mà là do một điểm nhấn công nghệ đã xảy ra, "ảnh hưởng của ChatGPT đến ngành công nghiệp AI", những điểm nhấn công nghệ lớn và nhỏ liên tục xảy ra trên bất kỳ mảnh đất nào có thể đáp ứng được trí tưởng tượng, cho đến khi xuất hiện một điểm nhấn then chốt tiếp theo.

Cuối cùng, vào tháng 1 năm 2025, DeepSeek đã vượt qua điểm nhấn đó, sử dụng mô hình ngôn ngữ lớn thế hệ đầu tiên có khả năng lý luận của họ, DeepSeek-R1, với chi phí đào tạo thấp hơn nhiều so với ChatGPT-O1 và hiệu suất vượt trội, mở ra cánh cửa đó.
Sử dụng mã nguồn mở để phân phối chìa khóa mở cửa vũ trụ cho toàn thế giới
Chỉ một ngày sau khi DeepSeek R1 được phát hành và công bố mô hình mã nguồn mở, Tổng thống Mỹ Donald Trump đã chính thức tuyên bố bắt đầu một kế hoạch "Cổng vũ trụ" với quy mô đầu tư khổng lồ 500 tỷ USD tại họp báo Nhà Trắng. Một liên doanh có tên Stargate được thành lập bởi OpenAI, SoftBank, Oracle và công ty đầu tư MGX, nhằm xây dựng cơ sở hạ tầng trí tuệ nhân tạo mới cho OpenAI tại Mỹ.
Mức đầu tư này thậm chí còn vượt xa "Dự án Manhattan", có vẻ như muốn sử dụng toàn lực quốc gia, xếp chồng các thuật toán để đẩy mạnh AI đóng cửa, độc quyền hóa thị trường AI, đảm bảo vị thế dẫn đầu của ngành công nghiệp AI trong nước. Nhưng khi kế hoạch này được công bố, họ chắc chắn không nghĩ rằng chỉ vài ngày sau, mô hình mã nguồn mở từ bên kia Đại Tây Dương sẽ trực tiếp không mở cửa, không chỉ mang theo một cái búa để đập vào tường, mà còn đang phát những cái búa cho người khác.

DeepSeek, với tư cách là một mô hình mã nguồn mở có thể so sánh với các mô hình đóng cửa hàng đầu, đã gây ra một phản ứng dây chuyền với kiến trúc đào tạo hoàn toàn mới của mình, khiến cho AI đóng cửa gặp nhiều khó khăn, thậm chí những mô hình đóng cửa không thể so kịp với DeepSeek R1 sẽ bị thị trường vốn loại bỏ trực tiếp, ngay cả Marc Andreessen, nhà sáng lập của a16z - nhà đầu tư của OpenAI, cũng công khai tuyên bố cần tập trung nhiều hơn vào AI mã nguồn mở thay vì chú trọng vào AI đóng cửa. Trong ngành, không phân biệt ủng hộ khả năng xuất hiện của AGI hay ủng hộ AI chỉ là phiên bản nâng cấp của ngành dịch vụ phần mềm, đều cho rằng những tác hại của AI đóng cửa vượt xa lợi ích của nó, bất kể đó là hộp đen, độc quyền ngành, an ninh thông tin hay kiểm soát vốn, bất kỳ khía cạnh nào cũng đều rất nguy hiểm.
Mặc dù một số người trong ngành nghi ngờ về việc công nghệ chuyên gia lai "MoE" của V3 cần một tập dữ liệu khổng lồ, nghi ngờ rằng nó đã sử dụng mô hình của OpenAI để làm ấm lại, và về phương pháp học tăng cường "RL" trong R1 cần nhiều tài nguyên phần cứng, nghi ngờ rằng họ đã gian lận về số lượng chip được sử dụng trong quá trình đào tạo. Nhưng điều này không ảnh hưởng gì đến sự cải cách cấu trúc ngành mà nó mang lại.
Việc mã nguồn mở của DeepSeek R1 đã phá vỡ logic kinh doanh của mô hình ngôn ngữ lớn đóng cửa của OpenAI, sử dụng logic tự tiến hóa mô hình để tránh sự đầu tư lớn vào năng lượng tính toán và gán nhãn dữ liệu truyền thống, mặc dù mô hình vẫn là hộp đen, nhưng chi phí hộp đen đã giảm đáng kể.
Ở cấp độ phần cứng AI, việc mã nguồn mở của DeepSeek V3 còn trực tiếp thách thức vị trí thống lĩnh thị trường của Nvidia, rào cản bảo vệ của GPU Nvidia chủ yếu là nền tảng tính toán song song ở lớp cơ bản và mô hình lập trình CUDA, hệ sinh thái rộng lớn và số lượng nhà phát triển đủ lớn khiến việc sử dụng các chip không phải của Nvidia để đào tạo có chi phí học tập quá cao, trong khi điều kiện mua hàng khó khăn và các hạn chế về mặt chính trị đã gây ra sự chia rẽ trong sự phát triển của AI toàn cầu.
Đối với chúng ta, trong ngắn hạn, AI trên thị trường chứng khoán Mỹ sẽ co lại mạnh, tổng giá trị thị trường Crypto AI gần như bị chặt đứt, thị trường bước vào giai đoạn thị trường gấu. Nhưng trong dài hạn, ngành công nghiệp AI được công nhận nhiều nhất đang hướng tới một con đường phát triển mã nguồn mở, minh bạch và phi tập trung. Dưới bất kỳ góc độ nào, sự kết hợp giữa Crypto và AI cũng sẽ trở nên ăn khớp hơn.
Sự cứu rỗi của Crypto AI, tiến lên! Tiến lên! Tiến lên không cần lựa chọn
Trong giai đoạn bong bóng của Crypto AI vừa vỡ, nhiều token khái niệm AI đã chịu đựng mức điều chỉnh hồi 70%, thị trường Crypto AI co lại đáng kể, có người châm biếm rằng "550 triệu USD cũng có thể đào tạo ra một mô hình lớn, những token AI có giá trị thị trường vượt xa, còn mua gì Crypto AI nữa". Quả thực, Crypto chỉ là một thị trường do v
Hiện nay đã có nhiều Crypto AI hoặc sẽ sớm tích hợp DeepSeek, hoặc cập nhật trên kiến trúc của họ, bao gồm ElizaOS, Argo, Myshell, Build, Hyperbolic, Mạng Nillion, infraX và nhiều dự án khác. Một số dự án đã tối ưu hóa sản phẩm thông qua DeepSeek.
Myshell
Trong quy trình tạo ra chatbot và ứng dụng plug-in, Myshell đã tích hợp các mô hình V3, R1 và thậm chí là mô hình tạo ảnh Janus-Pro, nhân viên kỹ thuật của Myshell đã hoàn thành việc tích hợp mô hình trong vòng nửa ngày, là một trong những dự án ít ỏi trong blockchain luôn kiên định cải thiện sản phẩm, thậm chí đã gây tiếng vang trong các sản phẩm Web2AI nhưng vẫn chưa muốn phát hành token, và lần này việc mã nguồn mở của DeepSeek sẽ mang lại tin vui về chi phí cho người dùng Myshell, chi phí thấp hơn sẽ thu hút thêm nhiều nhà phát triển Agent cho Myshell đã hoàn thiện sản phẩm.

Argo
Nhà phát triển Argo, Sam Gao, đã thực hiện DeepSeek hóa các chức năng quan trọng của Argo ngay từ đầu khi thiết kế sản phẩm, với tư cách là một hệ thống luồng công việc (workflow), Argo đã tích hợp LLM làm DeepSeek R1 tiêu chuẩn và giao việc tạo ra luồng công việc ban đầu cho DeepSeek R1 thực hiện. Cũng chính vì lý do Luồng Công việc mà việc tiêu thụ Token và lượng thông tin ngữ cảnh sẽ rất lớn "trung bình> = 10k Token", và Argo cũng đã kết hợp CoT "Chuỗi Suy nghĩ" vào quy trình suy nghĩ Luồng Công việc. Sau khi DeepSeek mã nguồn mở, không chỉ giảm chi phí của sản phẩm luồng công việc, mà còn có thể triển khai LLM tại chỗ trong Argo, quyền riêng tư và an ninh của người dùng cũng được đảm bảo.

Trước khi DeepSeek R1 ra mắt, Argo đã tích hợp logic huấn luyện mô hình sơ bộ "Chuỗi Suy nghĩ" (CoT) vào quy trình tạo Agent Workflow của mình. Đặc biệt là đối với các nhiệm vụ như giao dịch meme và phân tích xu hướng thị trường, Argo đã sử dụng Graph-of-Thought (GoT) để tùy chỉnh quy trình công việc của mình, đây là một phương pháp mới, xây dựng suy luận dưới dạng một đồ thị, trong đó các nút đại diện cho "Ý tưởng LLM" và các cạnh thể hiện mối quan hệ phụ thuộc giữa những ý tưởng này.
Vì vậy, Argo đã chọn GoT (hiện là dự án Crypto AI Workflow duy nhất sử dụng mô hình này), từ đó đạt được quy trình đáng tin cậy và minh bạch hơn. Phương pháp sáng tạo này trực tiếp ảnh hưởng đến tính an toàn và độ tin cậy của các giao dịch trên nền tảng Argo. Tích hợp sơ đồ tư duy (GoT) vào các đại lý Web3 AI, khiến Argo đứng đầu trong lĩnh vực giao dịch tiền mã hóa AI. Cấu trúc suy luận của CoT không chỉ tăng cường an ninh cho các giao dịch tài chính mà còn đảm bảo tính minh bạch, đáng tin cậy trong việc ra quyết định, điều này rất quan trọng trong tài chính phi tập trung (DeFi).

Đáng chú ý là nhà phát triển cốt lõi của Argo, Sam, đã hợp tác với Shaw viết một bài báo "EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers" về cách loại bỏ các khái niệm không mong muốn khỏi các mô hình lan truyền từ văn bản đến hình ảnh mà không làm suy giảm hiệu suất tổng thể của mô hình, và đã nhận được sự trợ giúp của nhà nghiên cứu DeepSeek, XingchaoLiu.
Hyperbolic
Hyperbolic Labs cũng là một trong những dự án đầu tiên công bố lưu trữ mô hình DeepSeek-R1 trên nền tảng GPU của họ, người dùng có thể thuê tài nguyên GPU phi tập trung của Hyperbolic để chạy mô hình DeepSeek-R1 tại địa phương hoặc trung tâm dữ liệu được chỉ định, mà không cần gửi dữ liệu nhạy cảm lên máy chủ của DeepSeek. Cách tiếp cận này vừa bảo vệ quyền riêng tư dữ liệu, vừa tận dụng được khả năng suy luận xuất sắc của mô hình DeepSeek, đồng thời thông qua mạng lưới tính toán phi tập trung của Hyperbolic, người dùng có thể có được khả năng suy luận hiệu quả của mô hình DeepSeek với chi phí thấp hơn, đây sẽ là một giải pháp cạnh tranh đối với các công ty khởi nghiệp, cá nhân kinh doanh siêu nhỏ hoặc những người chỉ cần sử dụng AI một cách hiệu quả.

Đợt bong bóng này đã gây thiệt hại nặng nề cho thị trường Crypto AI, nhiều Token AI đã mất giá trị đầu cơ. Tuy nhiên, bản chất, DeepSeek không phải là để tiêu diệt Crypto AI, mà là để buộc thị trường phải tiến hóa nhanh hơn. Sau DeepSeek R1, tương lai của Crypto AI sẽ không chỉ phụ thuộc vào đầu cơ nữa, mà phải xoay quanh các hướng như tính toán AI phi tập trung, cơ chế khích lệ đào tạo mô hình, phân phối tài nguyên AI công bằng, sản phẩm thực dụng, v.v. Thách thức thực sự là liệu Crypto có thể tận dụng được cuộc cách mạng công nghệ do DeepSeek mang lại để xây dựng một hệ sinh thái AI có giá trị thực sự, chứ không chỉ tạo ra các khái niệm và đầu cơ.
Đây không phải là kết thúc, mà là sự tiến hóa. Crypto AI cần phải tiến nhanh hơn, mạnh mẽ hơn. / Tăng tốc



