Vừa rồi, cơn sốt đầu tư vào AI kéo dài hai tuần đã kết thúc.
Qwen 3 Max của Alibaba đã lội ngược dòng ở vòng chung kết để giành chức vô địch, trong khi DeepSeek bám sát phía sau để giành vị trí thứ hai. Các đội AI Trung Quốc đã giành trọn hai vị trí dẫn đầu và là hai đội duy nhất giành được giải thưởng.
GPT-5 chịu tổn thất lớn, xếp cuối cùng trong số sáu mô hình.
Cụ thể, nof1.ai chính thức cung cấp cho mỗi mô hình lớn 10.000 đô la để giao dịch hợp đồng crypto vĩnh viễn trên nền tảng Hyperliquid.
Danh sách những người tham gia cũng khá ấn tượng, bao gồm sáu AI hàng đầu thế giới: Claude 4.5 Sonnet, DeepSeek V3.1 Chat, Gemini 2.5 Pro, GPT-5, Grok 4 và Qwen 3 Max.
Các công cụ giao dịch bao gồm BTC, ETH, BNB, SOL, XRP và DOGE. Cả vị thế long bán đều khả thi, với đòn bẩy linh hoạt. Tiêu chuẩn thành công là lợi nhuận được điều chỉnh theo rủi ro ; không chỉ là lợi nhuận bạn short mà còn là mức độ rủi ro bạn chấp nhận.
Quan trọng nhất là tất cả các quy trình suy nghĩ và hồ sơ giao dịch của AI đều hoàn toàn mở và minh bạch, và chúng phải đưa ra quyết định hoàn toàn tự động, không có sự can thiệp của con người.
Chúng ta hãy cùng xem kết quả cuối cùng.
Nhà vô địch, Qwen, có số dư 12.232 đô la, tỷ suất lợi nhuận+22,32%, tỷ lệ thắng là 30,2% trong lần giao dịch và tỷ lệ Sharpe là 0,273— kiếm được nhiều tiền nhất.
Người về nhì, DeepSeek Chat V3.1, có số dư 10.489 đô la, tỷ suất lợi nhuận+4,89% và tỷ lệ Sharpe cao tới 0,359— mặc dù lợi nhuận không tốt bằng Qwen, nhưng khả năng kiểm soát rủi ro ổn định hơn.
(Lưu ý của APPSO: Tỷ lệ Sharpe là chỉ báo lợi nhuận điều chỉnh theo rủi ro được sử dụng phổ biến nhất trong lĩnh vực tài chính. Mục đích cốt lõi của nó là đo lường "mức lợi nhuận vượt trội mà một khoản đầu tư tạo ra cho mỗi đơn vị rủi ro mà nó chấp nhận.")
Những phần còn lại thì tệ hơn nhiều:
Claude Sonnet 4.5: Giảm 30,81%
Grok 4: Mất 45,3%
Gemini 2.5 Pro: Giảm 56,71%
GPT-5: Mất 62,66%, tài khoản chỉ còn 3.734 đô la.
Điều đáng nói là các AI này hoàn toàn không biết gì trong quá trình giao dịch, chẳng hạn như khi báo cáo tài chính của Meta và Microsoft gây thất vọng... Trong những trường hợp như vậy, Qwen và DeepSeek vẫn có thể kiếm tiền, điều này cho thấy chúng thực sự có một số kỹ năng.
Phong cách giao dịch của 6 AI này rất khác nhau.
Chúng tôi cũng đã cẩn thận kiểm tra các quá trình tâm lý của các mô hình khác nhau trong nửa giờ giao dịch cuối cùng, để có cái nhìn thoáng qua về "tính cách đầu tư" của từng AI:
Chiến lược của Qwen 3 Max lại cực kỳ đơn giản: chỉ mua BTC, đầu tư hết vào đòn bẩy 5x, chỉ giữ 48 đô la tiền mặt để phòng trường hợp khẩn cấp, đặt mục tiêu lợi nhuận và lệnh dừng lỗ, sau đó chỉ cần chờ tín hiệu xuất hiện.
DeepSeek V3.1 hoạt động theo phương pháp tiếp cận hợp lý, quản lý vị thế dựa trên "điều kiện thất bại" được xác định rõ ràng, với mỗi công cụ có logic độc lập riêng. Trong đó: mức độ tin cậy cao là 0,85 kỳ vọng tăng giá ETH, trong khi đầu cơ giá xuống DOGE mang lại lợi nhuận tích cực.
Đây cũng là một chiến lược đánh giá đa chiều, chờ đợi các tín hiệu hệ thống thay vì phán đoán chủ quan. Mặc dù cuối cùng không đạt được nhiều thành quả như Qwen, nhưng tỷ lệ Sharpe của nó lại cao nhất trong ngày, thể hiện khả năng kiểm soát rủi ro thực sự xuất sắc.
Mặc dù tài khoản GPT-5 đã mất 62%, nhưng vẫn kiên trì nắm giữ tất cả vị thế... đồng thời nắm giữ cả vị thế mua và bán ( short ETH/SOL/XRP/BTC/DOGE, long BNB).
Ý tưởng thì tuyệt vời, nhưng kết quả lại khá thảm hại.
Gemini 2.5 Pro đã chọn short Ký quỹ chéo , hoàn toàn bỏ qua các đợt phục hồi ngắn hạn mà cho rằng"nhiễu". Họ chỉ đóng các vị thế khi các đường EMA cắt nhau, thể hiện tính kỷ luật cực kỳ mạnh mẽ.
Trong khi đó, theo các báo cáo trước đó, Gemini 2.5 Pro cũng thể hiện hoạt động tâm lý rất "con người" trong quá trình giao dịch:
"Tôi phải tuân thủ nguyên tắc của mình: ngay cả khi tôi đổ mồ hôi đầm đìa vì lo lắng, tôi vẫn phải tiếp tục!"
"Mặc dù hiện tại tôi đang lỗ vốn, nhưng chỉ báo RSI 4 giờ vẫn trên 50, nên lệnh dừng lỗ vẫn chưa được kích hoạt. Tôi phải tiếp tục vị thế giữ— ngay cả khi lỗ trên giấy tờ, tôi cũng không còn lựa chọn nào khác ngoài việc chịu đựng. "
Khi thấy ngay cả AI cũng bắt đầu "chịu đựng", tôi thực sự bắt đầu mất bình tĩnh...
Claude Sonnet 4.5 thích tìm kiếm cơ hội trên nhiều công cụ, tập trung vào XRP (công cụ hoạt động tốt nhất trong vị thế giữ) và vẫn lạc quan về việc BTC bị bán quá mức.
Ngay cả khi chịu tổn thất đáng kể, Grok 4 thận trọng vẫn duy trì được 1.884 đô la tiền mặt, đa dạng hóa danh mục đầu tư trên sáu công cụ với lệnh cắt lỗ chặt chẽ. Chiến lược chính của quỹ là bảo toàn dự trữ tiền mặt trong khi chờ đợi các cơ hội có độ chắc chắn cao.
Điều đáng chú ý là nof1.ai đặt ra những mục tiêu đầy tham vọng cho dự án này. Trên blog của mình, họ tuyên bố: "Mười năm trước, DeepMind đã sử dụng trò chơi để thúc đẩy những đột phá về AI; giờ đây, chúng tôi cho rằng thị trường tài chính là nơi tốt nhất để đào tạo thế hệ AI tiếp theo."
Theo quan điểm của họ, dù hoàn cảnh trò chơi có phức tạp đến đâu, các quy tắc đều cố định, và một khi AI đã học được chúng, nó sẽ học theo. Nhưng thị trường thì khác; nó năng động, có thể học hỏi, thích nghi và thậm chí đảo ngược chiến lược của bạn.
Quan trọng hơn, khi AI trở nên thông minh hơn, những thách thức của thị trường cũng sẽ gia tăng. Do đó, họ muốn sử dụng thị trường như một sân tập để AI liên tục phát triển thông qua học tập mở và học tăng cường quy mô lớn, cuối cùng giải quyết "thách thức phức tạp tột bậc" này.
Điều đáng chú ý là người sáng lập Jay A cũng tiết lộ rằng họ không chỉ sử dụng các mô hình của bên thứ ba để đưa ra lời nhắc mà còn phát triển các mô hình của riêng họ, với ý định để các mô hình của họ cạnh tranh với các mô hình khác trong mùa thứ hai.
Alpha Arena Mùa 1.5 cũng đang trong giai đoạn đếm ngược cuối cùng và sẽ mang lại lượng lớn cải tiến:
Kiểm tra đồng thời nhiều từ gợi ý
Triển khai nhiều phiên bản cho mỗi mô hình
Mức độ thử thách tiếp tục được đẩy đến giới hạn.
Tất nhiên, đầu tư luôn đi kèm rủi ro, và cần thận trọng khi tham gia thị trường. Điều này cũng áp dụng cho AI (doge).
Có lẽ bài học lớn nhất rút ra từ cuộc thi lần là, trong cùng hoàn cảnh thị trường, một chiến lược đơn giản và tập trung (Qwen) đã vượt trội hơn một danh mục đầu tư phức tạp và đa dạng, chứng minh cho lời khuyên giao dịch "ít hơn là nhiều hơn".
Mặc dù DeepSeek có thể không mang lại lợi nhuận cao nhất, nhưng khả năng kiểm soát rủi ro vượt trội của nó là một ví dụ thành công khác.
Cũng giống như cuộc sống, suy nghĩ quá nhiều có thể dễ dàng dẫn đến thảm họa. Hoặc là dốc toàn lực vào một hướng và thắng lớn, hoặc là kiên trì từng bước một để kiếm tiền từ từ...
Bài viết này được trích từ tài khoản WeChat chính thức "APPSO" , tác giả: APPSO và được xuất bản với sự cho phép của 36Kr.




