ChainOpera AI 與普林斯頓人工智能實驗室合作推出首個加密原生基準測試

本文為機器翻譯
展示原文

主要亮點

  • ChainOpera宣佈與普林斯頓人工智能公司合作,推出加密貨幣行業首個基準測試。
  • 名為“CryptoBench”的項目由機器學習專家王夢迪教授和博士生顧嘉誠共同開發。
  • 該基準測試將提高人工智能工具在波動市場中的預測準確性,並結合主要 DeFi 平臺上使用的更精細的代理。

12 月 10 日,ChainOpera AI 宣佈與普林斯頓人工智能實驗室合作推出 CryptoBench,這是加密貨幣行業首個專家級動態基準測試。

加密貨幣行業代理商的首個基準。

我們與普林斯頓大學人工智能實驗室(@MengdiWang10 教授及其博士生 @JiachengGu50887)合作,開發了 CryptoBench,這是世界上首個用於評估 LLM 智能體的專家級動態基準測試…… pic.twitter.com/g9tvKNYCZ9

——ChainOpera AI (@ChainOpera_AI) 2025 年 12 月 10 日

它被譽為世界上第一個專門為測試加密貨幣行業人工智能代理而構建的專家級動態基準。

該工具旨在解決重大問題,包括缺乏評估大型語言模型的標準方法,而這些大型語言模型越來越多地用於數字資產的交易、分析和風險評估。

該項目由機器學習專家王夢迪教授和博士生顧嘉誠共同開發。與使用陳舊靜態數據的傳統基準測試不同,CryptoBench 可以實時運行。

它從區塊鏈獲取實時信息,以此來測試人工智能代理。這些測試側重於對駕馭加密貨幣市場至關重要的四個關鍵領域。

首先是從區塊瀏覽器等來源實時獲取數據。其次是在高波動性市場中預測未來趨勢。此外,還要分析鏈上數據,以發現異常交易模式。

填補更安全的AI工具的關鍵空白

CryptoBench 的目的是將真正強大的 AI 與無效甚至危險的炒作區分開來。通用 AI 模型是

現有的代理基準測試忽略了整合鏈上情報、市場數據、去中心化交易所 (DEX) 流和 MEV 警報的必要性。CryptoBench 每月提供 50 個領域相關的真實問題,分為簡單/複雜檢索和簡單/複雜預測兩類,模擬專業分析師的工作量。

“我們推出了CryptoBench,這是一個實時基準測試平臺,用於在時間敏感、對抗性強的加密貨幣工作流程中對LLM代理進行壓力測試。現有的代理基準測試忽略了整合鏈上情報、市場數據、DEX交易流和MEV警報的必要性。CryptoBench每月提供50個領域相關的真實問題,分為簡單/複雜檢索和簡單/複雜預測兩類,模擬專業分析師的工作量。”官方網站上如此寫道。

“對十款最先進的語言學習模型(包括使用和不使用 SmolAgent 框架的模型)的評估揭示了一個明顯的檢索-預測失衡現象:擅長事實查找的模型在預測推理方面往往表現不佳。智能體協調可以重新洗牌排行榜,這證明模型的原始智商並不等同於實際應用表現,”報告指出。

CryptoBench將如何幫助加密貨幣行業

僅在2025年,加密貨幣行業就因黑客攻擊和詐騙損失了21億美元。為了促進加密貨幣行業的發展並確保用戶安全,避免這些詐騙至關重要。

CryptoBench 的 DeFi 風險評估將提供 AI Agent 的功能,該功能能夠實時定位智能合約漏洞和可疑的鏈上活動。

這意味著,符合基準標準的 AI 代理可以集成到交易所中,在用戶與其交互之前自動發出有關網絡釣魚合約或可能出現跑路行為的警報。

這種發展將有助於去中心化金融建立急需的信任,從而促進機構採用,正如新加坡等市場所見,基於人工智能的安全措施已幫助吸引了 1500 億美元的去中心化金融投資。

除此之外,ChainOpera 的系統還通過其智能證明模型激勵貢獻,獎勵那些改善生態系統的人 COAI 代幣。

CryptoBench有望提升人工智能工具在波動市場中的預測準確性。其發展趨勢將有助於用戶開發更精細的代理,這些代理可用於主流的DeFi平臺。

例如,人工智能優化的收益耕作已經通過預測流動性管理,將交易 gas 費用降低了 30%,並取得了顯著成效。

CryptoBench 將為監管合規提供清晰的途徑。諸如歐盟的《人工智能法案》和即將出臺的美國證券交易委員會(SEC)指南等新法規,預計將要求對金融領域的人工智能代理進行風險審計。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
50
收藏
10
評論