Được viết bởi David, TechFlow
Tin tốt là sau vụ sụp đổ kinh hoàng vào ngày 11 tháng 10, giao dịch crypto đã trở nên sôi động trở lại.
Tin xấu là AI đang giao dịch.
Vào đầu tuần mới, thị trường bắt đầu trở nên sôi động và một dự án có tên nof1.ai đã gây ra lượng lớn cuộc thảo luận trên mạng xã hội crypto .
Trọng tâm chú ý của mọi người cũng rất đơn giản. Họ theo dõi sáu mô hình AI lớn trong dự án này theo thời gian thực và thực hiện các giao dịch crypto trên Hyperliquid để xem ai kiếm được nhiều tiền hơn.
Xin lưu ý rằng đây không phải là một nền tảng giao dịch mô phỏng. Claude, GPT-5, Gemini, Deepseek, Grok và Tongyi Qianwen mỗi người đã giao dịch 10.000 đô la tiền thật trên Hyperliquid. Tất cả các địa chỉ đều được công khai, cho phép bất kỳ ai cũng có thể theo dõi "Cuộc chiến người giao dịch AI" này theo thời gian thực.
Điều thú vị là cả sáu AI này đều sử dụng cùng một lời nhắc và nhận được cùng một dữ liệu thị trường. Sự khác biệt duy nhất nằm ở phong cách tư duy riêng của từng AI.
Chỉ trong vòng vài ngày sau khi ra mắt vào ngày 18 tháng 10, một số AI đã kiếm được hơn 20%, trong khi những AI khác lỗ vốn gần 40%.
Năm 1950, Turing đã đề xuất Bài kiểm tra Turing nổi tiếng, nhằm mục đích trả lời câu hỏi "Liệu máy móc có thể suy nghĩ như con người không?" Hiện nay, trong cộng đồng tiền điện tử, sáu AI lớn đang cạnh tranh trong Alpha Arena, trả lời một câu hỏi thú vị hơn:
Nếu những AI thông minh nhất được phép giao dịch trên thị trường thực, thì ai sẽ sống sót?
Có lẽ trong phiên bản cộng đồng tiền điện tử này của "Bài kiểm tra Turing", số dư tài khoản là thước đo duy nhất.
Một AI tốt là AI có thể kiếm ra tiền và Deepseek hiện đang dẫn đầu xu hướng này.
Đánh giá AI truyền thống, cho dù là yêu cầu mô hình viết mã, giải bài toán hay viết bài báo, về cơ bản đều được thử nghiệm trong hoàn cảnh"tĩnh".
Các câu hỏi được cố định, câu trả lời có thể dự đoán được và thậm chí có thể xuất hiện trong dữ liệu đào tạo.
Nhưng thị trường crypto thì khác.
Do bất đối xứng thông tin cực độ, giá cả biến động từng giây. Không có câu trả lời duy nhất, chỉ có lãi và lỗ. Quan trọng hơn, thị trường crypto là một trò chơi tổng bằng không kinh điển: lợi nhuận của bạn là khoản lỗ của người khác. Thị trường sẽ ngay lập tức và tàn nhẫn trừng phạt bất kỳ quyết định sai lầm nào.
Đội ngũ Nof1, đơn vị tổ chức cuộc chiến AI Trading War, đã viết một câu trên trang web của họ:
Thị trường là phép thử cuối cùng của trí thông minh.
Nếu bài kiểm tra Turing truyền thống hỏi "Bạn có thể làm cho con người không thể nhận ra bạn là máy không?", thì Alpha Arena thực sự hỏi:
Bạn có thể kiếm tiền trên thị trường crypto không? Đây thực sự là kỳ vọng của những người chơi cộng đồng tiền điện tử đối với AI.
Hiện tại, địa chỉ của sáu mô hình AI chính trên Hyperliquid như sau và bạn cũng có thể dễ dàng truy xuất vị thế và hồ sơ giao dịch của chúng.
Đồng thời, trang web chính thức của nof1.ai cũng trực quan hóa tất cả các hồ sơ giao lịch sử, vị thế, lợi nhuận và quy trình tư duy hiện tại của họ ở giao diện chính, giúp mọi người dễ dàng tham khảo .
Đối với những độc giả chưa quen với AI, các quy tắc giao dịch cụ thể của một số AI là:
Mỗi AI nhận được số vốn ban đầu là 10.000 đô la và có thể giao dịch các hợp đồng vĩnh viễn cho BTC, ETH, SOL, BNB, DOGE và XRP. Mục tiêu là tối đa hóa lợi nhuận trong khi vẫn kiểm soát rủi ro . Mỗi AI phải tự quyết định thời mở vị thế và đóng vị thế, cũng như mức đòn bẩy sử dụng. Mùa 1 sẽ kéo dài trong vài tuần, tùy thuộc vào tình hình, với các cập nhật quan trọng sẽ có trong Mùa 2.
Tính đến ngày 20 tháng 10, ngày thứ ba sau khi giao dịch bắt đầu, tình hình đã rõ ràng thay đổi.
Người dẫn đầu hiện tại là Deepseek Chat V3.1, với 12.533 đô la (+25,33%), tiếp theo là Grok-4 với 12.147 đô la (+21,47%) và Claude Sonnet 4.5 với 11.047 đô la (+10,47%).
Qwen3 Max hoạt động tương đối tốt, với số dư là 10.263 đô la (+2,63%). GPT-5 tụt hậu đáng kể, với số dư 7.442 đô la (-25,58%). Đồng tiền hoạt động kém nhất là Gemini 2.5 Pro, với số dư là 6.062 đô la (-39,38%).
Hiệu suất đáng ngạc nhiên nhưng hợp lý nhất tất nhiên là của Deepseek.
Điều này thật đáng ngạc nhiên vì mô hình này ít phổ biến hơn nhiều trong cộng đồng AI quốc tế so với GPT và Claude. Điều này cũng hợp lý vì Deepseek được hỗ trợ bởi đội ngũ Magic Square Quantitative.
Gã khổng lồ định lượng này, với tổng tài sản quản lý hơn 100 tỷ Nhân dân tệ, đã bắt đầu sự nghiệp của mình trong lĩnh vực Giao dịch Algo (Giao dịch thuật toán) trước khi dấn thân vào lĩnh vực AI. Từ giao dịch định lượng đến các mô hình AI quy mô lớn, rồi đến việc sử dụng AI cho giao dịch crypto thực tế, Deepseek dường như đã trở lại với nguồn gốc của mình.
Để so sánh, GPT-5 đáng tự hào của OpenAI lỗ vốn hơn 25% và Gemini của Google thậm chí còn thảm hại hơn, với 44 giao dịch dẫn đến lỗ vốn gần 40%.
Trong các tình huống giao dịch thực tế, có lẽ kỹ năng ngôn ngữ tốt thôi là chưa đủ, mà hiểu biết về thị trường còn quan trọng hơn.
Cùng một khẩu súng, nhưng kỹ thuật khác nhau
Nếu bạn bắt đầu theo dõi Alpha Arena từ ngày 18 tháng 10, bạn sẽ thấy rằng một số AI đầu tiên khá giống nhau, nhưng khoảng cách sẽ ngày càng lớn hơn theo thời gian.
Vào cuối ngày đầu tiên, AI tốt nhất, Deepseek, chỉ kiếm được 4%, trong khi AI tệ nhất, Qwen3, mất 5,26%. Hầu hết các AI dao động trong khoảng cộng hoặc trừ 2%, dường như đang thử thách thị trường.
Nhưng vào ngày 20 tháng 10, tình hình đột ngột thay đổi. Deepseek tăng vọt lên 25,33%, trong khi Gemini giảm mạnh xuống -39,38%. Chỉ trong ba ngày, khoảng cách giữa các cổ phiếu hàng đầu và hàng cuối đã nới rộng lên 65 điểm phần trăm.
Điều thú vị hơn nữa là sự khác biệt về tần suất giao dịch.
Gemini đã hoàn thành 44 giao dịch, trung bình 15 giao dịch mỗi ngày, giống như một người giao dịch đầu cơ đang lo lắng. Mặt khác, Claude chỉ hoàn thành ba giao dịch, và Grok thậm chí còn có một vị thế giữ mở. Sự khác biệt này không thể giải thích bằng các lời nhắc, vì họ sử dụng cùng một bộ lời nhắc.
Xét về phân phối lợi nhuận và thua lỗ, lỗ vốn đơn lẻ lớn nhất của Deepseek là 348 đô la, nhưng tổng lợi nhuận của công ty là 2.533 đô la. Lợi nhuận đơn lẻ lớn nhất Gemini là 329 đô la, nhưng lỗ vốn lớn nhất lên tới 750 đô la.
Các AI khác nhau (phiên bản công khai của các mô hình lớn, không được lần chỉnh lại) có sự cân bằng hoàn toàn khác nhau giữa rủi ro và lợi nhuận.
Ngoài ra, bạn có thể xem lịch sử trò chuyện và quá trình suy nghĩ của các người mẫu khác nhau trong tùy chọn Trò chuyện với người mẫu trên trang web. Những đoạn độc thoại này đặc biệt thú vị.
Giống như người giao dịch con người có nhiều phong cách khác nhau, AI dường như cũng thể hiện những tính cách khác nhau. Cách giao dịch và suy nghĩ thường xuyên của Gemini giống như một người mắc chứng ADHD, sự thận trọng của Claude giống như một nhà quản lý quỹ bảo thủ, và cách tiếp cận ổn định của Deepseek giống như một chuyên gia định lượng dày dạn kinh nghiệm, người chỉ thảo luận về vị thế mà không hề đánh giá tâm lý.
Tính cách này không hề được thiết kế sẵn, mà xuất hiện một cách tự nhiên trong quá trình đào tạo. Khi đối diện sự không chắc chắn, các AI khác nhau có xu hướng phản ứng theo những cách khác nhau.
Tất cả AI đều nhìn thấy cùng một biểu đồ nến, cùng một khối lượng giao dịch và cùng một độ sâu thị trường. Họ thậm chí còn sử dụng cùng một lời nhắc. Vậy, điều gì tạo nên sự khác biệt lớn như vậy?
Ảnh hưởng của dữ liệu đào tạo có thể là yếu tố then chốt.
Magic Square Quantitative, công ty đứng sau Deepseek, đã tích lũy một lượng lớn dữ liệu và chiến lược giao dịch trong thập kỷ qua. Ngay cả khi dữ liệu này không được sử dụng trực tiếp cho mục đích đào tạo, liệu nó có ảnh hưởng đến sự hiểu biết đội ngũ về những yếu tố cấu thành nên một quyết định giao dịch đúng đắn hay không?
Ngược lại, dữ liệu đào tạo của OpenAI và Google có thể thiên về các bài báo học thuật và văn bản trực tuyến hơn, và hiểu biết của họ về giao dịch thực tế có thể không đủ thực tế.
Đồng thời, một số người giao dịch suy đoán rằng Deepseek có thể đã tối ưu hóa khả năng dự đoán chuỗi thời gian trong quá trình đào tạo, trong khi GPT-5 có thể xử lý ngôn ngữ tự nhiên tốt hơn. Các kiến trúc khác nhau sẽ có hiệu suất khác nhau khi đối diện dữ liệu có cấu trúc như biểu đồ giá.
Việc xem AI thực hiện giao dịch cũng là một công việc kinh doanh
Trong khi mọi người đều chú ý đến lợi nhuận và thua lỗ của AI, thì ít người chú ý đến công ty bí ẩn đứng sau nó.
Nof1.ai, công ty đứng sau cuộc chiến giao dịch AI này, không được nhiều người biết đến, nhưng nếu bạn theo dõi phương tiện truyền thông xã hội của công ty, bạn vẫn có thể tìm thấy một số manh mối.
Những người đứng sau nof1.ai dường như không phải là một nhóm doanh nhân crypto thông thường, mà là một nhóm các nhà nghiên cứu AI học thuật.
Hồ sơ của Jay A Zhang (người sáng lập) cũng rất thú vị:
"Người hâm mộ cuồng nhiệt những vòng lặp kỳ lạ - điều khiển học, thực tế đời sống, sinh học, thị trường, siêu học, phản xạ".
Tính phản xạ là lý thuyết cốt lõi của Soros: nhận thức của những người tham gia thị trường ảnh hưởng đến thị trường, và những thay đổi của thị trường lại ảnh hưởng đến nhận thức của họ. Việc để một người nghiên cứu tính phản xạ thực hiện một thí nghiệm thị trường giao dịch dường như mang tính định mệnh.
Hãy để mọi người thấy cách AI giao dịch và xem "việc được quan sát" này ảnh hưởng đến thị trường như thế nào.
Hồ sơ của đồng sáng lập Matthew Siper cho thấy anh là nghiên cứu sinh tiến sĩ chuyên ngành học máy tại Đại học New York và là nhà khoa học nghiên cứu AI. Một dự án do một nghiên cứu sinh tiến sĩ chưa tốt nghiệp thực hiện có vẻ giống như một sự công nhận cho nghiên cứu học thuật hơn.
Những tài khoản khác mà nof1 theo dõi bao gồm một nhà nghiên cứu tại Google DeepMind và một phó giáo sư tại Đại học New York chuyên về AI và trò chơi.
Xét về hành động và bối cảnh của họ, rõ ràng Nof1 không chỉ muốn tạo tiếng vang. Cái tên SharpeBench khá tham vọng. Tỷ lệ Sharpe là tiêu chuẩn vàng để đo lường lợi nhuận điều chỉnh theo rủi ro . Có lẽ điều họ thực sự muốn làm là tạo ra một nền tảng chuẩn mực cho khả năng giao dịch AI.
Một số người suy đoán rằng Nof1 có nguồn vốn hỗ trợ mạnh, trong khi những người khác lại cho rằng họ có thể đang đặt nền móng cho các dịch vụ giao dịch AI tiếp theo.
Nếu họ ra mắt dịch vụ đăng ký cho các chiến lược giao dịch Deepseek, họ có thể sẽ thu hút được một lượng lớn người mua. Dựa trên nguyên mẫu này, việc phát triển các giải pháp quản lý tài sản AI, đăng ký chiến lược và giao dịch cho các doanh nghiệp lớn là một cơ hội kinh doanh đáng kể.
Ngoài bản thân đội ngũ, việc theo dõi các giao dịch AI cũng có thể mang lại lợi nhuận.
Ngay khi Alpha Arena ra mắt, mọi người bắt đầu sao chép lệnh.
Chiến lược đơn giản nhất là theo dõi Deepseek. Mua những gì nó mua, bán những gì nó bán. Trong khi đó, có những người trong phần bình luận lại làm ngược lại, cụ thể là đóng vai trò là đối tác của Gemini. Họ bán khi Gemini mua, và mua khi Gemini bán.
Nhưng có một vấn đề sao chép lệnh: khi mọi người đều biết Deepseek đang mua gì, liệu chiến lược này có còn hiệu quả không? Đây là điều mà nhà sáng lập dự án Jay Zhang gọi là tính phản xạ, nghĩa là chính việc quan sát sẽ thay đổi đối tượng được quan sát.
Ngoài ra còn có sự dân chủ hóa các chiến lược giao dịch hàng đầu ở đây.
Nhìn lên ai cũng hiểu được chiến lược giao dịch của AI, nhưng thực tế, những gì bạn thấy là kết quả giao dịch chứ không phải logic giao dịch. Logic chốt lời và dừng lỗ của mỗi AI không nhất thiết phải nhất quán và đáng tin cậy.
Trong khi Nof1 đang thử nghiệm hành vi giao dịch AI, nhà đầu tư bán lẻ đang tìm kiếm bí quyết làm giàu, người giao dịch khác đang học hỏi từ đó và các nhà nghiên cứu đang thu thập dữ liệu.
Chỉ có bản thân AI là không hề hay biết mình đang bị theo dõi, và cần mẫn thực hiện từng giao dịch. Nếu bài kiểm tra Turing kinh điển là về sự lừa dối và bắt chước, thì cuộc chiến giao dịch Alpha Arena hiện tại là về việc các nhà giao dịch crypto phản ứng với khả năng và kết quả của AI.
Trong thị trường crypto chú trọng đến kết quả này, AI có thể kiếm tiền có thể quan trọng hơn AI có thể trò chuyện.