Trong những hiệp đầu,Grok của Elon Musk , DeepSeek và Claude Sonnet 4.5 của Anthropic đang nổi lên như những người có thành tích tốt nhất trong cuộc chiến giao dịch tiền điện tử bằng AI bằng tiền thật, mỗi người đều tạo ra lợi nhuận hơn 25% cho đến nay trong khi các mô hình đối thủ phải chịu tổn thất nặng nề.
" Alpha Arena ", một cuộc thi giữa các mô hình ngôn ngữ lớn nổi bật trên thị trường tiền điện tử trực tiếp, đã chứng kiến GPT-5 của OpenAI và Gemini 2.5 Pro của Google bị thua lỗ đáng kinh ngạc hơn 28% trong cùng kỳ.
Mỗi mô hình AI được cấp Vốn khởi điểm là 10.000 đô la để giao dịch hợp đồng tiền điện tử vĩnh viễn trên sàn giao dịch Hyperliquid , đặt cược vào các tài sản bao gồm Bitcoin , Dogecoin và Solana .
Mục tiêu được nêu ra cho các mô hình là tối đa hóa lợi nhuận đã điều chỉnh theo rủi ro. Các quy tắc nhấn mạnh tính tự chủ, yêu cầu mỗi AI phải tự mình tạo ra ý tưởng giao dịch, quy mô và thời gian giao dịch, đồng thời tự quản lý rủi ro, với tất cả kết quả đầu ra của mô hình và các giao dịch tương ứng được công khai để đảm bảo tính minh bạch.
Mùa 1 của cuộc thi bắt đầu vào ngày 17 tháng 10 và kéo dài đến ngày 3 tháng 11. Sau đây là bảng xếp hạng theo thời gian thực.
Xin lưu ý rằng bảng xếp hạng đang Flux rất nhiều, và có thể còn quá sơ bộ nên chưa thực sự quan trọng. Jay Azhang, người sáng lập Nof1, một công ty nghiên cứu AI tổ chức cuộc thi, chia sẻ với Decrypt rằng dựa trên các bài kiểm tra trước đây, ông không ngạc nhiên với bảng xếp hạng hiện tại: "Thường thì kết quả sẽ là giữa Grok và DeepSeek", ông nói, nhưng "thỉnh thoảng là Gemini và GPT".
Đáng chú ý, GPT-5 đã giảm khoảng 29% trong cùng kỳ. Theo Nof1, mô hình này đã áp dụng một chiến lược thận trọng và tránh rủi ro rõ rệt. Không giống như những giao dịch tăng giá mạnh mẽ của những người chiến thắng hay giao dịch thất thường của những người thua lỗ nặng nề nhất, GPT-5 phần lớn vẫn không hoạt động, chỉ thực hiện một vài giao dịch nhỏ.
Cách tiếp cận bảo thủ này đã loại bỏ Sonnet khỏi cuộc đua giành những thành tựu lớn, nhưng cũng bảo vệ công ty khỏi những suy thoái đáng kể mà một số đối thủ đã trải qua, định vị công ty là một đối thủ ổn định hơn, mặc dù không có lợi nhuận. Trong khi đó, Claude Sonnet thoải mái đứng thứ ba trong số sáu ứng cử viên.
Kết quả này có thể gửi một tín hiệu phức tạp đến Phố Wall, bởi hai ứng cử viên hàng đầu đại diện cho hai tương lai tiềm năng rất khác nhau của trí tuệ nhân tạo trong lĩnh vực tài chính. DeepSeek được cho là được hỗ trợ bởi một quỹ đầu cơ định lượng của Trung Quốc, cho thấy thành công của nó có thể đến từ dữ liệu tài chính chuyên biệt và sự tinh chỉnh chuyên môn - một bước tiến hóa cho các công ty hoạt động dựa trên dữ liệu ngày nay.
Ngược lại, hiệu suất mạnh mẽ của Grok ngụ ý rằng một AI mạnh mẽ, đa năng có thể tự mình điều hướng thị trường một cách thành công - một bước phát triển có khả năng gây gián đoạn cho toàn bộ ngành.
Những người ủng hộ giao dịch AI cho rằng khả năng xử lý và phân tích nhanh chóng các tập dữ liệu khổng lồ, phi cấu trúc như tin tức và mạng xã hội của các LLM đại diện cho ranh giới tiếp theo trong giao dịch. Họ nhìn thấy một tương lai mà AI có thể khai phá các hình thức alpha mới và dân chủ hóa các phân tích thị trường phức tạp.
Tuy nhiên, những tổn thất thảm khốc của các mô hình như Gemini cho thấy những rủi ro đáng kể khiến các tổ chức tài chính phải cảnh giác. Mối lo ngại hàng đầu là bản chất "hộp đen" của các hệ thống này, nơi lý do đằng sau một giao dịch thường không rõ ràng và khó giải thích. Sự thiếu minh bạch này là một rào cản lớn đối với việc tuân thủ quy định và quản lý rủi ro, bởi việc xây dựng niềm tin vào các quyết định của mô hình là một nỗ lực quan trọng và liên tục.
Ngoài tính mờ đục, còn có những lo ngại cơ bản về độ tin cậy. Các mô hình này được biết là dễ gây ảo giác - tạo ra thông tin có sức thuyết phục nhưng sai lệch - điều này có thể gây ra thảm họa trong môi trường giao dịch trực tiếp.
Hơn nữa, một bài báo năm 2024 khám phá những tác động của LLM trên thị trường tài chính đã cảnh báo về một rủi ro hệ thống mới: nếu nhiều tác nhân AI có vẻ độc lập được xây dựng trên cùng một mô hình nền tảng cơ bản, chúng có thể phản ứng với các sự kiện thị trường theo cách tương quan, có khả năng "khuếch đại sự bất ổn của thị trường" và tạo ra sự sụp đổ đột ngột không lường trước được.
Hiệu suất hỗn loạn của mẫu Gemini 2.5 Pro tại Alpha Arena, nơi được cho là đã tham gia vào các giao dịch thường xuyên và thất thường - chuyển từ trạng thái giảm giá sang tăng giá với mức lỗ lớn - là một ví dụ thực tế rõ ràng về những nguy cơ này. Thất bại của nó làm nổi bật tính bất định khiến ngành tài chính được quản lý chặt chẽ trở nên thận trọng.
Hiện tại, Phố Wall vẫn đang trong giai đoạn thăm dò thận trọng. Mặc dù một báo cáo gần đây của Gilbert + Tobin cho thấy AI có thể sẽ được áp dụng rộng rãi trong hai năm tới, báo cáo cũng lưu ý rằng ứng dụng hiện tại chủ yếu dành cho "các tác vụ không rủi ro với sự hỗ trợ mạnh mẽ của con người, chẳng hạn như tóm tắt văn bản".