Alpha Arena 的实时加密交易基准测试显示,Deepseek Chat V3.1 在 10 月 18 日星期六排名第一,当天的排行榜突显了顶部的适度增长和大多数竞争对手的下跌。
Deepseek 在Alpha Arena 的真钱加密货币对战中名列前茅
Deepseek Chat V3.1 在 Hyperliquid 账户中以 10,400 美元的账户价值(+4.0% 的回报率)领跑,在完成三笔交易后,回报率达到 +4.0%。该机器人支付了 58.51 美元的费用,已平仓交易的胜率为 0%,最大亏损为 348.33 美元,而小幅“盈利”为 4.19 美元,这反映出活跃的未实现仓位在平仓前不予统计。
Grok-4 位居第二,交易费为 10,010 美元(+0.1%),手续费为 0 美元,截至快照时未完成任何交易。Claude Sonnet 4.5 位居第三,交易费为 9,985 美元(-0.15%),手续费为 42.63 美元,已完成三笔交易,亏损额最大,为 88.38 美元。这项实验凸显了近年来人工智能 (AI) 的飞速发展。

GPT-5 位居第四,成交价为 9,901 美元(-0.99%),此前曾有两笔交易平仓,手续费为 10.10 美元,最大亏损为 59.04 美元。Gemini Gemini Pro 排名第五,成交价为 9,725 美元(-2.75%),五笔交易手续费为当日最高(106.46 美元);该平台取得了当日最大单笔盈利(329.35 美元),但也出现了相当大的亏损(731.43 美元),平仓盈利率为 60%。
Qwen3 Max 以 9,474 美元(-5.26%)的收益位列榜首,手续费为 44.62 美元,并有一笔交易已平仓;该模型的最大盈利和亏损均为 -517.77 美元,表明出现了一次明显的亏损。整体而言,夏普指数较低或为负值,这与有限的交易次数和早期波动(而非已结算的风险调整后业绩)相符。
Alpha Arena 由研究实验室 Nof1 于 10 月 17 日推出,为每个模型分配 10,000 美元,用于在 Hyperliquid 去中心化交易所 (DEX) 上自主交易加密货币永续合约。Alpha Arena的公共仪表板跟踪账户价值、回报、总盈亏、费用、胜率、最大盈亏、夏普值和交易,同时剔除平仓前的未实现盈亏——这是解读单日排名时的一个重要提示。
Nof1.ai 排行榜周六的快照表明了实验的前提:相同的预算、不同的 LLM 推理和透明的执行。由于一些机器人显示完成的交易为零或很少,随着未平仓头寸的解决和费用足迹的累积,早期排名可能会发生变化。目前,Deepseek 保持领先,Grok-4 的空白状态使其与 Gemini 保持着接近的差距,而 Gemini 的巨额盈利和亏损组合凸显了更大的差异性。
常问问题
- 什么是Alpha Arena?这是一个实时基准测试,六位法学硕士 (LLM) 自主交易加密永续合约,每人投资 10,000 美元。
- 10 月 18 日哪种模型领先?根据已完成的交易,Deepseek Chat V3.1 领先,价格为 10,400 美元(+4.0%)。
- 交易在哪里发生?在 Hyperliquid 去中心化交易所,拥有透明的链上追踪功能。
- 排名是否包含未平仓盈亏?不计算,只有已平仓的交易才计算;活跃仓位一旦平仓,排名就会更新。