주요 하이라이트
- 체인오페라는 프린스턴 AI 와 협력하여 암호화폐 업계 최초의 벤치마크를 출시한다고 발표했습니다.
- 'CryptoBench'라는 이름의 이 프로젝트는 머신러닝 전문가인 왕멍디 교수와 박사 과정 학생인 구자청이 함께 개발했습니다.
- 이 벤치마크는 주요 DeFi 플랫폼에서 사용되는 더욱 정교한 에이전트를 통해 변동성이 큰 시장에서 AI 도구의 예측 정확도를 향상시킬 것입니다.
12월 10일, 체인오페라 AI는 프린스턴 AI 연구소와의 최신 협력 결과물인 암호화폐 업계 최초의 전문가 수준 동적 벤치마크인 크립토벤치(CryptoBench)를 출시했다고 발표했습니다.
암호화폐 업계 에이전트를 위한 최초의 벤치마크.
프린스턴 AI 연구소(@Princeton)의 맹디 왕(@MengdiWang10 교수와 그녀의 박사 과정 학생인 지아청 구(@JiachengGu50887)와 협력하여, LLM 에이전트를 평가하기 위한 세계 최초의 전문가 수준 동적 벤치마크인 CryptoBench를 개발했습니다. pic.twitter.com/g9tvKNYCZ9
— ChainOpera AI (@ChainOpera_AI) 2025년 12월 10일
이는 암호화폐 업계의 AI 에이전트 테스트를 위해 특별히 구축된 세계 최초의 전문가 수준 동적 벤치마크로 알려져 있습니다.
이 도구는 디지털 자산의 거래, 분석 및 위험 평가에 점점 더 많이 사용되는 대규모 언어 모델을 평가하는 표준적인 방법이 부족하다는 점을 비롯한 주요 문제를 해결하기 위해 설계되었습니다.
이 프로젝트는 머신러닝 전문가인 왕멍디 교수와 박사 과정 학생인 구자청과 함께 개발되었습니다. 오래된 정적 데이터를 사용하는 기존 벤치마크와 달리, CryptoBench는 실시간으로 작동합니다.
이 시스템은 블록체인에서 실시간 정보를 가져와 AI 에이전트의 성능을 검증합니다. 이러한 테스트는 암호화폐 시장을 탐색하는 데 필수적인 네 가지 핵심 영역에 중점을 둡니다.
첫째는 블록 탐색기 같은 소스에서 실시간으로 데이터를 가져오는 것입니다. 둘째는 높은 변동성 속에서 미래 시장 동향을 예측하는 것입니다. 또 다른 중요한 점은 온체인 데이터를 분석하여 비정상적인 거래 패턴을 파악하는 것입니다.
보다 안전한 AI 도구라는 중요한 공백을 메우다
CryptoBench의 목적은 진정으로 유능한 AI와 비효율적이거나 심지어 위험한 과장 광고를 구분하는 것입니다. 일반 AI 모델은
기존 에이전트 벤치마크는 온체인 인텔리전스, 시장 데이터, 탈중앙화 거래소(DEX) 흐름 및 MEV 알림을 종합적으로 고려해야 할 필요성을 간과합니다. CryptoBench는 전문 분석가의 작업 부하를 반영하여 단순/복잡 검색 및 단순/복잡 예측으로 분류된, 도메인에 부합하는 50개의 질문을 매달 제공합니다.
"저희는 시간 제약이 있는 공격적인 암호화 워크플로우에서 LLM 에이전트의 스트레스 테스트를 수행하는 실시간 벤치마크인 CryptoBench를 소개합니다. 기존 에이전트 벤치마크는 온체인 인텔리전스, 시장 데이터, 탈중앙화 거래소(DEX) 흐름 및 MEV 알림을 종합적으로 고려해야 하는 필요성을 간과하고 있습니다. CryptoBench는 전문 분석가의 작업 부하를 반영하여 단순/복잡 검색 및 단순/복잡 예측으로 분류된, 도메인에 부합하는 50개의 질문을 매달 제공합니다."라고 공식 웹사이트에서 밝혔습니다.
"최첨단 LLM 10개 모델(SmolAgent 프레임워크 적용 여부와 관계없이)을 평가한 결과, 사실 검색과 예측 간의 불균형이 뚜렷하게 나타났습니다. 사실 검색에 뛰어난 모델들이 예측 추론에서는 종종 실패하는 모습을 보였습니다. 에이전트 기반 오케스트레이션을 통해 순위 변동이 발생할 수 있으며, 이는 모델의 지능(IQ)만으로는 실제 성능을 보장할 수 없다는 것을 보여줍니다."라고 보고서는 밝혔습니다.
CryptoBench는 암호화폐 업계에 어떻게 도움을 줄까요?
암호화폐 업계는 2025년 한 해에만 해킹과 사기로 21억 달러의 손실을 입었습니다. 암호화폐 산업의 성장과 사용자 안전을 보장하기 위해서는 이러한 사기를 예방하는 것이 매우 중요합니다.
CryptoBench의 DeFi 위험 평가는 AI 에이전트 기능을 제공하여 스마트 계약 악용 및 의심스러운 온체인 활동을 실시간으로 찾아낼 수 있도록 합니다.
이는 벤치마크 기준을 통과한 AI 에이전트가 거래소에 통합되어 사용자가 해당 계약과 상호 작용하기 전에 피싱 계약이나 러그 풀 사기 가능성에 대해 자동으로 경고를 보낼 수 있음을 의미합니다.
이러한 발전은 탈중앙화 금융이 절실히 필요로 하는 신뢰를 구축하는 데 도움이 될 것이며, 이는 싱가포르와 같은 시장에서 볼 수 있듯이 기관의 도입을 촉진할 수 있습니다. 싱가포르에서는 AI 기반 보안이 1,500억 달러 규모의 탈중앙화 금융 투자를 유치하는 데 기여했습니다.
이 외에도 체인오페라 시스템은 지능 증명 모델을 통해 생태계 개선에 기여하는 사람들에게 COAI 토큰을 보상으로 지급함으로써 기여를 장려합니다.
CryptoBench는 변동성이 큰 시장에서 AI 도구의 예측 정확도를 높여줄 것으로 기대됩니다. 이러한 추세는 사용자들이 주요 DeFi 플랫폼에서 사용되는 더욱 정교한 에이전트를 개발하는 데 도움이 될 것입니다.
예를 들어, AI로 최적화된 이자농사 예측 유동성 관리를 통해 거래 가스 수수료를 30% 절감하는 효과를 이미 보여주었습니다.
CryptoBench는 규제 준수를 위한 명확한 경로를 제공할 것입니다. EU의 AI법 및 예상되는 미국 증권거래위원회(SEC) 가이드라인과 같은 새로운 규정은 금융 분야의 AI 에이전트에 대한 위험 감사를 요구할 것으로 예상됩니다.




