在 Grok、ChatGPT、DeepSeek 等 AI 接受测试后,哪种 AI 最适合进行加密货币交易?

本文为机器翻译
展示原文

专注于金融市场的人工智能(AI)研究平台nof1于10月18日推出了一项名为Alpha Arena的大型语言学习模型(LLM)交易测试。

测试使用了六种主流 AI 模型(GPT-5、 Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1 和 Qwen3 Max),在 Hyperliquid 加密货币交易所上分别使用 10,000 美元的真实资金,并具有相同的提示和输入数据。

实验结束时,DeepSeek 和 Grok 的回报率均超过 14%,位居前两位。而Gemini 2.5 Pro 的回报率则高达 42.57%。

Alpha Arena AI交易测试

与模拟回测或纸面交易不同, Alpha Arena 完全自主且实时运行,衡量每个模型的原始盈亏(P&L)。

所有“参赛者”都在交易一些最受欢迎的资产,包括比特币(BTC)、以太坊(ETH)和XRP)。统一的提示确保所有模型都从相同的基线、基于指令的偏差开始。

早期的领头羊 DeepSeek 和 Grok 积极持有多头仓位,并抓住了持续的市场反弹机会。相比之下,持有多空混合仓位的 ChatGPT 和Gemini表现不佳。

总体而言, Alpha Arena 代表着首次大规模公开测试,旨在检验人工智能系统能否真正解读并应对实时金融市场。值得一提的是,在比特币价格大幅波动期间,多个模型成功识别并抓住了短期反弹机会。

因此,该实验为大型语言模型如何应对高不确定性的金融环境提供了宝贵的见解。然而,必须指出的是,10,000 美元的投资组合和 48 小时的窗口期并不能完全展现其长期表现。

同样,这些模型也并未真正经历过极端市场情景,因此其危机应对能力也未经检验。尽管如此,这些结果还是为开发人员提供了许多思考空间,让他们思考人工智能工具如何提升交易效率,并解决人类监管问题。

特色图片来自 Shutterstock

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
67
收藏
17
评论