Sự ra đời của DeepSeek là một phước lành hay một lời nguyền cho Crypto AI?

02-10

Bài viết này được dịch máy

Xem bản gốc

Tác giả: BUBBLE, BlockBeats

Vào tháng 1 năm 2025, sự ra đời của DeepSeek R1 đã gây chấn động trong giới AI, đồng thời nó cũng thực sự thay đổi sinh thái Crypto AI. Trong một chu kỳ trước đó, Crypto AI chủ yếu xoay quanh AI Agent, nhưng DeepSeek R1 và chiến lược mã nguồn mở của nó đã hoàn toàn thay đổi luật chơi: chi phí đào tạo cực thấp, phương pháp đào tạo thích ứng đột phá, khiến tầm nhìn phi tập trung hóa của ngành công nghiệp AI không còn là lời nói suông mà trở thành hiện thực trong tầm tay. Cuộc cách mạng này có ảnh hưởng sâu rộng, tổng giá trị thị trường Crypto AI giảm mạnh, nhiều token AI trải qua đợt điều chỉnh hồi 70%, nhưng đây có thực sự là một cuộc khủng hoảng hay đây là dấu hiệu của một cuộc lột xác triệt để của Crypto AI?

Sự phát triển mạnh mẽ của DeepSeek

Sự phát triển của DeepSeek có thể truy ngược đến năm 2021. Vào thời điểm đó, quỹ phòng hộ tập trung vào giao dịch định lượng Vạn Phương bắt đầu tuyển dụng quy mô lớn các nhân tài AI, việc các công ty định lượng chuyển sang AI không phải là điều phổ biến, và những người họ tuyển dụng chủ yếu là những nhà nghiên cứu AI khám phá các hướng tiên phong, bao gồm các lĩnh vực như mô hình ngôn ngữ lớn (LLM) và mô hình tạo hình ảnh. Mặc dù có tin đồn rằng Vạn Phương đã chuyển đổi để tận dụng tốt hơn các tài nguyên GPU nhàn rỗi của công ty, nhưng phần lớn lý do khác là để chiếm lĩnh vị trí chiến lược trong các công nghệ AI tiên phong như mô hình ngôn ngữ lớn.

Đến cuối năm 2022, Vạn Phương đã thu hút được ngày càng nhiều nhân tài AI hàng đầu, chủ yếu là sinh viên từ Đại học Thanh Hoa và Đại học Bắc Kinh. Được kích thích bởi ChatGPT, CEO Vạn Phương Lương Văn Phong quyết định tiến vào lĩnh vực trí tuệ nhân tạo tổng quát và thành lập DeepSeek vào đầu năm 2023. Tuy nhiên, sự bùng nổ nhanh chóng của các công ty AI như Trí Tuệ, Mặt Trăng Tối và Bách Xuyên Thông Minh đã khiến DeepSeek, với tư cách là một tổ chức nghiên cứu thuần túy và thiếu những nhà sáng lập nổi tiếng, gặp rất nhiều khó khăn trong việc huy động vốn độc lập. Do đó, Vạn Phương quyết định tách DeepSeek ra khỏi công ty mẹ và tài trợ toàn bộ cho sự phát triển của nó, mặc dù quyết định này mang rất nhiều rủi ro, nhưng DeepSeek không cần phải chịu áp lực về lợi nhuận hoặc định giá từ các nhà tài trợ. Đồng thời, nó có nguồn tài nguyên GPU tương đối dồi dào, cho phép nhóm tập trung vào các bước đột phá về công nghệ, một nhóm những người trẻ đầy sáng tạo có thể thoải mái phát triển trong một miền đất màu mỡ, lúc này DeepSeek giống như một viện nghiên cứu hơn là một công ty.

Giống như thời kỳ đầu của OpenAI, không ai nghĩ rằng một công ty nghiên cứu về robot chơi rubik's cube sẽ cuối cùng phát triển ra ChatGPT, cũng không ai nghĩ rằng Vạn Phương, một công ty làm định lượng, lại có thể sử dụng DeepSeek để phá vỡ bong bóng AI hiện tại, với 7 năm cho trường hợp trước và chỉ 2 năm cho trường hợp sau. Vào tháng 11 năm 2023, DeepSeek đã ra mắt mô hình ngôn ngữ lớn DeepSeek LLM với 67 tỷ tham số, có hiệu suất gần với GPT-4, vào tháng 5 năm 2024 ra mắt DeepSeek-V2, và vào tháng 12 cùng năm, DeepSeek-V3 đã đạt kết quả tương đương với GPT-4o và Claude 3.5 Sonnet trong các bài kiểm tra chuẩn. Sự tiến bộ công nghệ nhanh chóng của DeepSeek không phải do sức mạnh tài chính của công ty hay bằng cấp cao, mà là do sự xuất hiện của một điểm công nghệ đột phá sau "ảnh hưởng của ChatGPT đến ngành công nghiệp AI", những điểm đột phá nhỏ liên tiếp xảy ra trên bất kỳ mảnh đất nào có thể đáp ứng được trí tưởng tượng, cho đến khi xuất hiện một điểm đột phá then chốt tiếp theo.

Cuối cùng, vào tháng 1 năm 2025, DeepSeek đã vượt qua điểm đột phá, sử dụng mô hình ngôn ngữ lớn thế hệ đầu tiên có khả năng lý luận, DeepSeek-R1, với chi phí đào tạo thấp hơn nhiều so với ChatGPT-O1 và hiệu suất vượt trội, mở ra cánh cửa ấy.

Sử dụng mã nguồn mở để phân phối chìa khóa mở cửa vũ trụ cho toàn thế giới

Chỉ một ngày sau khi DeepSeek R1 được phát hành và công bố mã nguồn mở, Tổng thống Mỹ Donald Trump đã chính thức tuyên bố bắt đầu một kế hoạch "Cổng vào Vũ trụ" với quy mô đầu tư khổng lồ 500 tỷ USD tại họp báo Nhà Trắng. Một liên doanh có tên Stargate được thành lập bởi OpenAI, SoftBank, Oracle và công ty đầu tư MGX, nhằm xây dựng cơ sở hạ tầng trí tuệ nhân tạo mới cho OpenAI tại Mỹ.

Quy mô đầu tư này thậm chí còn vượt xa "Dự án Manhattan", có vẻ như muốn huy động toàn lực quốc gia, sử dụng chồng chất các thuật toán để đẩy mạnh AI đóng cửa, độc quyền hóa thị trường AI, để đảm bảo vị thế dẫn đầu của ngành công nghiệp AI trong nước. Nhưng vào thời điểm công bố kế hoạch này, họ chắc chắn không ngờ rằng chỉ vài ngày sau, mô hình mã nguồn mở từ bên kia Đại Tây Dương sẽ trực tiếp không mở cửa, không chỉ mang theo chiếc búa để đập vào tường, mà còn đồng thời phân phát búa cho những người khác.

DeepSeek, với tư cách là một mô hình mã nguồn mở có thể so sánh với các mô hình đóng cửa hàng đầu, đã gây ra một phản ứng dây chuyền với kiến trúc đào tạo hoàn toàn mới của mình, khiến các mô hình AI đóng cửa gặp nhiều khó khăn, thậm chí các mô hình đóng cửa không thể theo kịp DeepSeek R1 sẽ bị thị trường vốn loại bỏ trực tiếp, ngay cả Marc Andreessen, nhà sáng lập của a16z - nhà đầu tư của OpenAI, cũng công khai tuyên bố cần tập trung nhiều hơn vào AI mã nguồn mở thay vì chú trọng vào AI đóng cửa. Trong ngành, không phân biệt ủng hộ khả năng xuất hiện của AGI hay chỉ ủng hộ AI như một phiên bản nâng cấp của ngành SaaS, đều công nhận rằng những tác hại của AI đóng cửa xa lớn hơn nhiều so với AI mã nguồn mở, bất kể đó là hộp đen, độc quyền ngành, an ninh thông tin hay kiểm soát vốn, bất kỳ khía cạnh nào cũng đều là hướng phát triển rất nguy hiểm.

Mặc dù một số người trong ngành nghi ngờ về việc công nghệ "Mô hình Chuyên gia Hỗn hợp (MoE)" của V3 cần một tập dữ liệu khổng lồ, nghi ngờ rằng nó đang sử dụng mô hình của OpenAI để cô đặc, cũng như nghi ngờ rằng phương pháp học tăng cường (RL) trong R1 cần nhiều tài nguyên phần cứng, nghi ngờ rằng họ đã gian lận về số lượng chip sử dụng trong quá trình đào tạo, nhưng điều này không hề ảnh hưởng đến sự cải cách cấu trúc ngành mà nó mang lại.

Việc mã nguồn mở của DeepSeek R1 đã phá vỡ logic kinh doanh của các mô hình ngôn ngữ lớn đóng cửa của OpenAI, sử dụng logic tự tiến hóa của mô hình để tránh đầu tư quá lớn vào năng lực tính toán và gán nhãn dữ liệu truyền thống, mặc dù mô hình vẫn là hộp đen, nhưng chi phí hộp đen đã giảm đáng kể.

Ở cấp độ phần cứng AI, việc mã nguồn mở của DeepSeek V3 còn trực tiếp thách thức vị trí thống lĩnh thị trường của Nvidia, lợi thế cạnh tranh của GPU Nvidia chủ yếu nằm ở nền tảng tính toán song song ở lớp cơ bản và mô hình lập trình CUDA, cùng với hệ sinh thái rộng lớn và đủ nhiều nhà phát triển, khiến việc sử dụng các chip không phải của Nvidia để đào tạo có chi phí học tập quá cao, trong khi điều kiện mua hàng khắt khe và các hạn chế về mặt chính trị đã tạo ra sự chia rẽ trong sự phát triển của AI toàn cầu.

Đối với chúng ta, trong ngắn hạn, AI của Phố Wall sẽ co lại mạnh, tổng giá trị thị trường Crypto AI sẽ gần như bị chặt đứt, thị trường bước vào giai đoạn thị trường gấu. Nhưng trong dài hạn, ngành công nghiệp AI được công nhận nhiều nhất đang hướng tới một con đường phát triển mã nguồn mở, minh bạch và phi tập trung. Dưới bất kỳ góc độ nào, sự kết hợp giữa Crypto và AI cũng sẽ trở nên ăn khớp hơn.

Sự cứu rỗi của Crypto AI, tiến lên! Tiến lên! Tiến lên bằng mọi giá!

Trong giai đoạn bong bóng của Crypto AI vừa vỡ, nhiều token khái niệm AI đã chịu đựng mức điều chỉnh hồi 70%, thị trường Crypto AI co lại đáng kể, có người châm biếm rằng "550 triệu USD cũng có thể đào tạo ra một mô hình lớn, những token AI

Nói trực tiếp, DeepSeek mang lại cho crypto là mô hình đào tạo phi tập trung, làm cho các dự án như Depin có thể hợp lý hơn, khiến quy trình đào tạo và cung cấp thông tin trở nên minh bạch hơn, và cơ chế thưởng cho những người đóng góp tập dữ liệu cũng hợp lý hơn, giúp việc thanh toán giữa các bên cung và cầu trong việc đào tạo mô hình dễ dàng hơn. Sự phát triển hoàn thiện của hệ sinh thái xung quanh ngành công nghiệp AI với quy mô lớn hơn 100 lần đã làm cho ngành Crypto AI trở nên phong phú hơn. Khi đủ nhiều sản phẩm có tính cạnh tranh và sáng tạo xuất hiện trên thị trường, chỉ cần một trong số chúng thực sự phá vỡ thì vốn bên ngoài sẽ tự nhiên chảy vào Crypto. Thị trường đã chịu đựng PVP quá lâu, sau TrumpCoin là một loạt đồng xu của các nhân vật nổi tiếng, điều này đã phá vỡ sự cân bằng giữa thanh khoản dồi dào và phản hồi tích cực trong thị trường AI, do đó bong bóng bị DeepSeek đâm vỡ thực ra là một tin tốt lành hơn.

Hiện nay, đã có nhiều Crypto AI hoặc sẽ sớm tích hợp DeepSeek, hoặc cập nhật trên kiến trúc của nó, bao gồm ElizaOS, Argo, Myshell, Build, Hyperbolic, Nillion Network, infraX và nhiều dự án khác. Và một số dự án trong số đó đã trực tiếp tối ưu hóa sản phẩm thông qua DeepSeek.

Myshell

Trong quy trình tạo ra chatbot và ứng dụng plug-in, Myshell đã tích hợp các mô hình V3, R1 và thậm chí là mô hình tạo hình ảnh Janus-Pro, nhân viên kỹ thuật của Myshell đã hoàn thành việc tích hợp mô hình trong vòng nửa ngày, là một trong những dự án hiếm hoi trong blockchain luôn kiên định cải thiện sản phẩm, thậm chí đã gây tiếng vang trong các sản phẩm Web2AI mà vẫn chưa muốn phát hành token, và lần này việc mã nguồn mở của DeepSeek sẽ mang lại phúc lợi về chi phí cho người dùng Myshell, chi phí thấp hơn sẽ thu hút thêm nhiều nhà phát triển Agent cho Myshell, sản phẩm đã hoàn thiện.

Argo

Nhà phát triển Argo, Sam Gao, đã tích hợp DeepSeek vào các chức năng quan trọng của Argo ngay từ đầu khi thiết kế sản phẩm. Với tư cách là một hệ thống luồng công việc (workflow), Argo đã tích hợp LLM như một DeepSeek R1 tiêu chuẩn và giao việc tạo ra luồng công việc cho DeepSeek R1 thực hiện. Và do đặc tính của Workflow, việc tiêu thụ Token và lượng thông tin ngữ cảnh sẽ rất lớn, trung bình >= 10k Token, Argo cũng đã tích hợp CoT "Chuỗi Suy Nghĩ" vào quy trình tư duy Workflow. Sau khi DeepSeek trở nên mã nguồn mở, không chỉ giảm chi phí cho sản phẩm Workflow, mà người dùng còn có thể triển khai LLM cục bộ trong Argo, quyền riêng tư và an ninh của người dùng cũng được đảm bảo.

Trước khi DeepSeek R1 ra đời, Argo đã tích hợp logic đào tạo mô hình sơ bộ của nó, Chuỗi Suy Nghĩ "CoT", vào quy trình tạo ra Workflow của Agent. Đặc biệt là đối với các nhiệm vụ như giao dịch meme và phân tích xu hướng thị trường, Argo đã tùy chỉnh quy trình công việc của mình bằng Graph-of-Thought (GoT), đây là một phương pháp mới, xây dựng suy luận dưới dạng một đồ thị, trong đó các nút đại diện cho "Ý tưởng LLM" và các cạnh thể hiện mối quan hệ phụ thuộc giữa những ý tưởng này.

Vì Argo đã chọn GoT (hiện là dự án Crypto AI Workflow duy nhất sử dụng mô hình này), do đó đã đạt được quy trình đáng tin cậy và minh bạch hơn. Phương pháp sáng tạo này trực tiếp ảnh hưởng đến tính an toàn và độ tin cậy của các giao dịch trên nền tảng Argo. Tích hợp sơ đồ tư duy (GoT) vào các tác nhân Web3 AI đã đưa Argo lên đầu ngành giao dịch AI crypto. Cấu trúc suy luận của CoT không chỉ tăng cường an ninh cho các giao dịch tài chính, mà còn đảm bảo tính minh bạch, đáng tin cậy trong việc ra quyết định, điều này rất quan trọng trong tài chính phi tập trung (DeFi).

Đáng chú ý là nhà phát triển cốt lõi của Argo, Sam, đã hợp tác với Shaw viết một bài báo về "EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers", về cách xóa các khái niệm không mong muốn khỏi các mô hình lan truyền từ văn bản lớn đến hình ảnh mà không ảnh hưởng đến hiệu suất tổng thể của mô hình, và đã nhận được sự trợ giúp từ nhà nghiên cứu DeepSeek, XingchaoLiu.

Hyperbolic

Hyperbolic Labs cũng là một trong những người đầu tiên công bố lưu trữ mô hình DeepSeek-R1 trên nền tảng GPU của họ, người dùng có thể thuê tài nguyên GPU phi tập trung của Hyperbolic để chạy mô hình DeepSeek-R1 tại địa phương hoặc trung tâm dữ liệu được chỉ định, mà không cần gửi dữ liệu nhạy cảm lên máy chủ của DeepSeek. Phương thức này vừa bảo đảm quyền riêng tư dữ liệu, vừa có thể tận dụng hiệu suất suy luận xuất sắc của mô hình DeepSeek, đồng thời thông qua mạng lưới tính toán phi tập trung của Hyperbolic, người dùng có thể có được khả năng suy luận hiệu quả của mô hình DeepSeek với chi phí thấp hơn, đây sẽ là một giải pháp cạnh tranh đối với các công ty khởi nghiệp, cá nhân kinh doanh hoặc đơn giản là những người sử dụng AI hiệu quả.

Đợt bong bóng vỡ này thực sự đã gây thiệt hại nặng nề cho thị trường Crypto AI, nhiều Token AI đã mất giá trị đầu cơ. Nhưng về cơ bản, DeepSeek không phải là để tiêu diệt Crypto AI, mà là để buộc thị trường phải tiến hóa nhanh hơn. Sau DeepSeek R1, tương lai của Crypto AI sẽ không chỉ dựa vào đầu cơ nữa, mà phải xoay quanh các hướng như tính toán AI phi tập trung, cơ chế khích lệ kinh tế trong việc đào tạo mô hình, phân bổ công bằng tài nguyên AI, và các sản phẩm thực dụng. Thách thức thực sự là liệu Crypto có thể tận dụng được cuộc cách mạng công nghệ do DeepSeek mang lại để xây dựng một hệ sinh thái AI có giá trị thực sự, chứ không chỉ là tạo ra các khái niệm và đầu cơ.

Đây không phải là kết thúc, mà là sự tiến hóa. Crypto AI cần phải tiến nhanh hơn, mạnh mẽ hơn. / Tăng tốc

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan