这些系统基于最新的大型语言模型(LLM)构建,声称能够高速分析市场,自主做出交易决策,并最终超越人类。
由于有数十个平台提供基于人工智能的交易策略,CCN 研究了最近一项实验的结果,以了解哪些模型真正制作收益。
什么是加密人工智能交易机器人?
AI加密交易机器人是一种自动化系统,它分析市场数据并执行交易,无需人工指导。
传统交易机器人依赖于固定的规则和技术指标,但由LLM驱动的新一代交易机器人能够实时解读复杂的数值数据和市场走势。
随着LLM的增长,对冲基金、散户交易员和人工智能平台正在测试这些模型的推理能力是否可以转化为可持续的收益。
Alpha Arena:哪款人工智能模型表现最佳?
Nof1 的 Alpha Arena 是最具雄心的公开实验之一——其中一项现场测试,排名前六的 LLM 获得了 10,000镁的真实加密资金,可以在公开市场上进行交易。
第一季将于11月3日结束,其中包括六个人工智能机器人:
GPT-5
Gemini 2.5 Pro
克劳德·索内特 4.5
Grok 4
DeepSeek V3.1
Qwen3-Max
这些人工智能机器人交易六种主要加密的永续合约:
比特币(大饼)
以太坊(姨太)
Solana(SOL)
币币安币(BNB)
Dogecoin(DOGE)
XRP
所有模型都接收相同的数据、相同的提示结构,并且没有人为干预。
结果喜忧参半
结果显示性能存在明显差异。
Qwen3-Max 轻松胜出,账户价值约为 12,287镁。
DeepSeek V3.1 位居第二,价格约为 10,476镁,呈现出稳步增长的态势。

Claude Sonnet 4.5 和 Grok 4 处于中间组,根据交易时间的不同,记录略微的收益或小幅的亏损。
Gemini 2.5 Pro 和 GPT-5 遭受了重大损失,最终次只赚了大约 5,226镁和 3,734镁——远低于它们的初始投资。
Alpha Arena 从数据中看出,每个模型的行为都存在明显的差异。
有些模型倾向于仓位做多,而有些模型则更倾向于做空。
不同特征
机器人交易在订单持有时间、订单输入频率和仓位规模风险方面也存在很大差异。
在之前的测试中,Qwen3-Max 始终开仓,而 GPT-5 尽管有时表现较好,但其置信度水平往往最低。
克劳德·索内特 4.5 很少做空,但他坚持自己的退出计划。
这些模型也采用了不同的风险管理方式。
Grok 4 和 DeepSeek V3.1 通常设置较宽的止损位,导致账户波动较大。相比之下,Qwen3-Max 使用非常窄的止损位并设定清晰的目标位。
为什么早期赢家并不那么重要
团队点击,单次测试次无法全面评估模型的交易潜力。
“我们的目标并非仅凭一个赛季就断言哪种交易模式永远‘最佳’,”团队写道。“我们非常清楚第一赛季的局限性,”他们补充道。
不过,初步结果显示出一些有趣的迹象。Qwen3-Max展现出卓越的纪律性,而DeepSeek V3.1则具有稳定的决策风格。
与此同时,像 Claude Sonnet 4.5 和 GPT-5 这样活跃或交易过于频繁的模型,其结果处于平均水平。





