在早期階段,埃隆馬斯克的 Grok 、 DeepSeek和Anthropic 的 Claude Sonnet 4.5成為真實貨幣 AI 加密交易對決中的佼佼者,迄今為止各自的回報率均超過 25%,而競爭對手的模型則遭受了重大損失。
“ Alpha Arena ” 是一場讓知名大型語言模型在加密貨幣實時市場上相互競爭的競賽, OpenAI 的 GPT-5和谷歌的Gemini 2.5 Pro在同一時期遭遇了超過 28% 的驚人損失。
每個 AI 模型都獲得了 10,000 美元的啟動資金,用於在Hyperliquid交易所交易加密貨幣永續合約,押注的資產包括比特幣、 Dogecoin和Solana 。
這些模型的既定目標是最大化其風險調整後的收益。規則強調自主性,要求每個人工智能獨立生成交易思路、確定交易規模和時間,並管理自身風險,所有模型輸出和相應的交易均應公開透明。
比賽第一季於 10 月 17 日開始,持續至 11 月 3 日。以下是實時排行榜。
請注意,排名Flux很大,可能過於初步,意義不大。主辦此次比賽的人工智能研究公司 Nof1 的創始人 Jay Azhang 告訴Decrypt ,根據之前的測試,他對目前的排名並不感到驚訝:“它通常位於 Grok 和 DeepSeek 之間,”他說,但“偶爾也會Gemini和 GPT 之間。”
值得注意的是,GPT-5 同期下跌了約 29%。據 Nof1 稱,該模型採取了明顯謹慎和規避風險的策略。與盈利者的激進看漲押注或虧損者波動的交易不同,GPT-5 基本保持低迷狀態,僅進行了少量小額交易。
這種保守的策略實際上使其在競爭中失去了大幅提升的潛力,但也使其免受一些競爭對手經歷的嚴重衰退的影響,使其成為一個更穩定(儘管無利可圖)的參賽者。與此同時,克勞德·索內特在六位競爭者中輕鬆位居第三。
這一結果可能向華爾街發出一個複雜的信號,因為這兩家領跑者代表著人工智能在金融領域截然不同的未來。據報道,DeepSeek 得到了一家中國量化對沖基金的支持,這表明其成功可能源於專業的金融數據和專家的精細調整——這對於當今數據驅動型公司來說是一次革命性的進步。
相比之下,Grok 的強勁表現意味著強大的通用人工智能可能能夠獨自成功駕馭市場——這對整個行業來說是一個潛在的顛覆性發展。
人工智能交易的支持者認為,法學碩士能夠快速處理和分析新聞和社交媒體等海量非結構化數據集,這代表著交易領域的下一個前沿。他們預見到未來人工智能能夠釋放新的Alpha收益,並使複雜的市場分析變得大眾化。
然而,像Gemini這樣的模型的災難性損失凸顯了巨大的風險,令金融機構警惕。主要擔憂在於這些系統的“黑箱”性質,交易背後的原因往往不透明且難以解釋。這種缺乏透明度是監管合規和風險管理的一大障礙,因為建立對模型決策的信任是一項至關重要且持續不斷的努力。
除了不透明性之外,可靠性也存在根本性擔憂。眾所周知,這些模型容易產生幻覺——編造令人信服但虛假的信息——這在實際交易環境中可能造成災難性的後果。
此外, 2024 年的一篇探討法學碩士 (LLM) 對金融市場影響的論文警告了一種新的系統性風險:如果多個看似獨立的人工智能代理建立在相同的底層基礎模型上,它們可能會以相關的方式對市場事件做出反應,從而可能“放大市場不穩定性”並造成不可預見的閃電崩盤。
據報道, Gemini 2.5 Pro 型號在Alpha Arena 的混亂表現——頻繁進行反覆無常的交易——從看跌轉為看漲,造成鉅額虧損——是這些風險在現實世界中一個鮮明的例子。它的失敗凸顯了不可預測性,正是這種不可預測性讓受到嚴格監管的金融行業保持警惕。
目前,華爾街仍處於謹慎探索的狀態。儘管Gilbert + Tobin 最近的一份報告表明,未來兩年可能會出現一波採用熱潮,但該報告也指出,目前的應用主要用於“需要大量人工協助的無風險任務,例如文本摘要”。