Alpha Arena 的實時加密交易基準測試顯示,Deepseek Chat V3.1 在 10 月 18 日星期六排名第一,當天的排行榜突顯了頂部的適度增長和大多數競爭對手的下跌。
Deepseek 在Alpha Arena 的真錢加密貨幣對戰中名列前茅
Deepseek Chat V3.1 在 Hyperliquid 賬戶中以 10,400 美元的賬戶價值(+4.0% 的回報率)領跑,在完成三筆交易後,回報率達到 +4.0%。該機器人支付了 58.51 美元的費用,已平倉交易的勝率為 0%,最大虧損為 348.33 美元,而小幅“盈利”為 4.19 美元,這反映出活躍的未實現倉位在平倉前不予統計。
Grok-4 位居第二,交易費為 10,010 美元(+0.1%),手續費為 0 美元,截至快照時未完成任何交易。Claude Sonnet 4.5 位居第三,交易費為 9,985 美元(-0.15%),手續費為 42.63 美元,已完成三筆交易,虧損額最大,為 88.38 美元。這項實驗凸顯了近年來人工智能 (AI) 的飛速發展。

GPT-5 位居第四,成交價為 9,901 美元(-0.99%),此前曾有兩筆交易平倉,手續費為 10.10 美元,最大虧損為 59.04 美元。Gemini Gemini Pro 排名第五,成交價為 9,725 美元(-2.75%),五筆交易手續費為當日最高(106.46 美元);該平臺取得了當日最大單筆盈利(329.35 美元),但也出現了相當大的虧損(731.43 美元),平倉盈利率為 60%。
Qwen3 Max 以 9,474 美元(-5.26%)的收益位列榜首,手續費為 44.62 美元,並有一筆交易已平倉;該模型的最大盈利和虧損均為 -517.77 美元,表明出現了一次明顯的虧損。整體而言,夏普指數較低或為負值,這與有限的交易次數和早期波動(而非已結算的風險調整後業績)相符。
Alpha Arena 由研究實驗室 Nof1 於 10 月 17 日推出,為每個模型分配 10,000 美元,用於在 Hyperliquid 去中心化交易所 (DEX) 上自主交易加密貨幣永續合約。Alpha Arena的公共儀表板跟蹤賬戶價值、回報、總盈虧、費用、勝率、最大盈虧、夏普值和交易,同時剔除平倉前的未實現盈虧——這是解讀單日排名時的一個重要提示。
Nof1.ai 排行榜週六的快照表明瞭實驗的前提:相同的預算、不同的 LLM 推理和透明的執行。由於一些機器人顯示完成的交易為零或很少,隨著未平倉頭寸的解決和費用足跡的累積,早期排名可能會發生變化。目前,Deepseek 保持領先,Grok-4 的空白狀態使其與 Gemini 保持著接近的差距,而 Gemini 的鉅額盈利和虧損組合凸顯了更大的差異性。
常問問題
- 什麼是Alpha Arena?這是一個實時基準測試,六位法學碩士 (LLM) 自主交易加密永續合約,每人投資 10,000 美元。
- 10 月 18 日哪種模型領先?根據已完成的交易,Deepseek Chat V3.1 領先,價格為 10,400 美元(+4.0%)。
- 交易在哪裡發生?在 Hyperliquid 去中心化交易所,擁有透明的鏈上追蹤功能。
- 排名是否包含未平倉盈虧?不計算,只有已平倉的交易才計算;活躍倉位一旦平倉,排名就會更新。