ChainOpera AI 与普林斯顿人工智能实验室合作推出首个加密原生基准测试

本文为机器翻译
展示原文

主要亮点

  • ChainOpera宣布与普林斯顿人工智能公司合作,推出加密货币行业首个基准测试。
  • 名为“CryptoBench”的项目由机器学习专家王梦迪教授和博士生顾嘉诚共同开发。
  • 该基准测试将提高人工智能工具在波动市场中的预测准确性,并结合主要 DeFi 平台上使用的更精细的代理。

12 月 10 日,ChainOpera AI 宣布与普林斯顿人工智能实验室合作推出 CryptoBench,这是加密货币行业首个专家级动态基准测试。

加密货币行业代理商的首个基准。

我们与普林斯顿大学人工智能实验室(@MengdiWang10 教授及其博士生 @JiachengGu50887)合作,开发了 CryptoBench,这是世界上首个用于评估 LLM 智能体的专家级动态基准测试…… pic.twitter.com/g9tvKNYCZ9

——ChainOpera AI (@ChainOpera_AI) 2025 年 12 月 10 日

它被誉为世界上第一个专门为测试加密货币行业人工智能代理而构建的专家级动态基准。

该工具旨在解决重大问题,包括缺乏评估大型语言模型的标准方法,而这些大型语言模型越来越多地用于数字资产的交易、分析和风险评估。

该项目由机器学习专家王梦迪教授和博士生顾嘉诚共同开发。与使用陈旧静态数据的传统基准测试不同,CryptoBench 可以实时运行。

它从区块链获取实时信息,以此来测试人工智能代理。这些测试侧重于对驾驭加密货币市场至关重要的四个关键领域。

首先是从区块浏览器等来源实时获取数据。其次是在高波动性市场中预测未来趋势。此外,还要分析链上数据,以发现异常交易模式。

填补更安全的AI工具的关键空白

CryptoBench 的目的是将真正强大的 AI 与无效甚至危险的炒作区分开来。通用 AI 模型是

现有的代理基准测试忽略了整合链上情报、市场数据、去中心化交易所 (DEX) 流和 MEV 警报的必要性。CryptoBench 每月提供 50 个领域相关的真实问题,分为简单/复杂检索和简单/复杂预测两类,模拟专业分析师的工作量。

“我们推出了CryptoBench,这是一个实时基准测试平台,用于在时间敏感、对抗性强的加密货币工作流程中对LLM代理进行压力测试。现有的代理基准测试忽略了整合链上情报、市场数据、DEX交易流和MEV警报的必要性。CryptoBench每月提供50个领域相关的真实问题,分为简单/复杂检索和简单/复杂预测两类,模拟专业分析师的工作量。”官方网站上如此写道。

“对十款最先进的语言学习模型(包括使用和不使用 SmolAgent 框架的模型)的评估揭示了一个明显的检索-预测失衡现象:擅长事实查找的模型在预测推理方面往往表现不佳。智能体协调可以重新洗牌排行榜,这证明模型的原始智商并不等同于实际应用表现,”报告指出。

CryptoBench将如何帮助加密货币行业

仅在2025年,加密货币行业就因黑客攻击和诈骗损失了21亿美元。为了促进加密货币行业的发展并确保用户安全,避免这些诈骗至关重要。

CryptoBench 的 DeFi 风险评估将提供 AI Agent 的功能,该功能能够实时定位智能合约漏洞和可疑的链上活动。

这意味着,符合基准标准的 AI 代理可以集成到交易所中,在用户与其交互之前自动发出有关网络钓鱼合约或可能出现跑路行为的警报。

这种发展将有助于去中心化金融建立急需的信任,从而促进机构采用,正如新加坡等市场所见,基于人工智能的安全措施已帮助吸引了 1500 亿美元的去中心化金融投资。

除此之外,ChainOpera 的系统还通过其智能证明模型激励贡献,奖励那些改善生态系统的人 COAI 代币。

CryptoBench有望提升人工智能工具在波动市场中的预测准确性。其发展趋势将有助于用户开发更精细的代理,这些代理可用于主流的DeFi平台。

例如,人工智能优化的收益耕作已经通过预测流动性管理,将交易 gas 费用降低了 30%,并取得了显著成效。

CryptoBench 将为监管合规提供清晰的途径。诸如欧盟的《人工智能法案》和即将出台的美国证券交易委员会(SEC)指南等新法规,预计将要求对金融领域的人工智能代理进行风险审计。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
50
收藏
10
评论