Những điểm nổi bật chính
- ChainOpera vừa thông báo hợp tác với Princeton AI để ra mắt tiêu chuẩn đánh giá đầu tiên cho ngành công nghiệp tiền điện tử.
- Dự án mang tên 'CryptoBench' được phát triển với sự hợp tác của chuyên gia về học máy, Giáo sư Mengdi Wang, và nghiên cứu sinh tiến sĩ Jiacheng Gu.
- Tiêu chuẩn này sẽ cung cấp độ chính xác dự đoán tốt hơn cho các công cụ AI trong một thị trường biến động, với các tác nhân được tinh chỉnh tốt hơn được sử dụng trên các nền tảng DeFi lớn.
Vào ngày 10 tháng 12, ChainOpera AI đã tiết lộ sự hợp tác mới nhất của mình với Phòng thí nghiệm AI Princeton để ra mắt CryptoBench, đây là công cụ đo hiệu năng động cấp chuyên gia đầu tiên dành cho ngành công nghiệp tiền điện tử.
Tiêu chuẩn đầu tiên dành cho các đại lý trong ngành công nghiệp tiền điện tử.
Hợp tác với @Princeton Princeton AI Lab (Giáo sư @MengdiWang10 và nghiên cứu sinh tiến sĩ của bà @JiachengGu50887), chúng tôi đã xây dựng CryptoBench, chuẩn đánh giá động cấp chuyên gia đầu tiên trên thế giới để đánh giá các tác nhân LLM trong… pic.twitter.com/g9tvKNYCZ9
— ChainOpera AI (@ChainOpera_AI) Ngày 10 tháng 12 năm 2025
Nó được biết đến là bộ tiêu chuẩn đánh giá động cấp chuyên gia đầu tiên trên thế giới được xây dựng đặc biệt để kiểm tra các tác nhân AI trong ngành công nghiệp tiền điện tử.
Công cụ này được thiết kế để giải quyết các vấn đề lớn, bao gồm việc thiếu một phương pháp tiêu chuẩn để đánh giá các mô hình ngôn ngữ quy mô lớn đang ngày càng được sử dụng rộng rãi trong giao dịch, phân tích và đánh giá rủi ro trong tài sản kỹ thuật số.
Dự án này được phát triển với sự cộng tác của Giáo sư Mengdi Wang, một chuyên gia về máy học, và nghiên cứu sinh tiến sĩ Jiacheng Gu. Không giống như các hệ thống đánh giá hiệu năng truyền thống sử dụng dữ liệu cũ, tĩnh, CryptoBench hoạt động trong thời gian thực.
Nó thu thập thông tin trực tiếp từ blockchain để thử thách các tác nhân AI. Các bài kiểm tra này tập trung vào bốn lĩnh vực quan trọng thiết yếu để điều hướng thị trường tiền điện tử.
Đầu tiên là việc truy xuất dữ liệu theo thời gian thực từ các nguồn như trình khám phá Block . Thứ hai là dự đoán xu hướng thị trường tương lai trong bối cảnh biến động cao. Một điểm nữa là phân tích dữ liệu on-chain để phát hiện các mô hình giao dịch bất thường.
Lấp đầy khoảng trống quan trọng về các công cụ AI an toàn hơn.
Mục đích của CryptoBench là để phân biệt AI thực sự có năng lực với những sản phẩm thổi phồng kém hiệu quả hoặc thậm chí nguy hiểm. Các mô hình AI tổng quát là...
Các tiêu chuẩn đánh giá hiệu năng hiện có thường bỏ qua nhu cầu tổng hợp thông tin on-chain , dữ liệu thị trường, dòng tiền Sàn phi tập trung (DEX) và cảnh báo MEV. CryptoBench cung cấp 50 câu hỏi xác thực theo lĩnh vực mỗi tháng, được phân loại thành Truy xuất đơn giản/phức tạp và Dự đoán đơn giản/phức tạp, phản ánh khối lượng công việc của các nhà phân tích chuyên nghiệp.
“Chúng tôi giới thiệu CryptoBench, một công cụ đo hiệu năng trực tiếp giúp kiểm tra khả năng chịu tải của các tác nhân LLM trong các quy trình tiền điện tử nhạy cảm về thời gian và có tính đối kháng. Các công cụ đo hiệu năng hiện có thường bỏ qua nhu cầu tổng hợp thông tin on-chain , dữ liệu thị trường, dòng tiền Sàn phi tập trung (DEX) và cảnh báo MEV. CryptoBench cung cấp 50 câu hỏi xác thực theo lĩnh vực mỗi tháng, được phân loại thành Truy xuất đơn giản/phức tạp và Dự đoán đơn giản/phức tạp, phản ánh khối lượng công việc của các nhà phân tích chuyên nghiệp,” trang web chính thức cho biết.
“Việc đánh giá mười mô hình LLM tiên tiến nhất (có và không có khung SmolAgent) cho thấy sự mất cân bằng rõ rệt giữa khả năng truy xuất và dự đoán: các mô hình xuất sắc trong việc tra cứu thông tin thực tế thường thất bại trong việc suy luận dự đoán. Sự phối hợp của các tác nhân có thể thay đổi thứ hạng trên bảng xếp hạng, chứng minh rằng chỉ số IQ thô của mô hình không đồng nghĩa với hiệu suất thực tế,” báo cáo nêu rõ.
CryptoBench sẽ hỗ trợ ngành công nghiệp tiền điện tử như thế nào?
Chỉ riêng trong năm 2025, ngành công nghiệp tiền điện tử đã thiệt hại 2,1 tỷ đô la do các vụ tấn công mạng và lừa đảo. Việc tránh những trò lừa đảo này rất quan trọng để thúc đẩy sự phát triển của ngành công nghiệp tiền điện tử và đảm bảo an toàn cho người dùng.
Công cụ đánh giá rủi ro DeFi của CryptoBench sẽ cung cấp khả năng của AI Agent, có thể phát hiện các lỗ hổng bảo mật hợp đồng thông minh và hoạt động đáng ngờ on-chain trong thời gian thực.
Điều này có nghĩa là một tác nhân AI đáp ứng các tiêu chí của bộ tiêu chuẩn có thể được tích hợp vào sàn giao dịch để tự động cảnh báo về hợp đồng lừa đảo hoặc khả năng bị "Rug Pull" trước khi người dùng tương tác với nó.
Sự phát triển này sẽ giúp tài chính phi tập trung tạo dựng được niềm tin cần thiết, từ đó thúc đẩy việc áp dụng rộng rãi trong các tổ chức, như đã thấy ở các thị trường như Singapore, nơi bảo mật dựa trên trí tuệ nhân tạo đã giúp thu hút 150 tỷ đô la đầu tư vào tài chính phi tập trung.
Bên cạnh đó, hệ thống của ChainOpera cũng khuyến khích sự đóng góp thông qua mô hình bằng chứng trí tuệ bằng cách thưởng cho những người cải thiện hệ sinh thái bằng token COAI.
CryptoBench cũng được kỳ vọng sẽ mang lại độ chính xác dự đoán của các công cụ AI trong một thị trường đầy biến động. Xu hướng này sẽ giúp người dùng phát triển các tác nhân tinh vi hơn được sử dụng trên các nền tảng DeFi lớn.
Ví dụ, việc tối ưu hóa Canh tác lợi nhuận đã cho thấy kết quả giảm phí gas giao dịch tới 30% thông qua quản lý thanh khoản dự đoán.
CryptoBench sẽ cung cấp một lộ trình rõ ràng để tuân thủ các quy định. Các quy định mới, chẳng hạn như Đạo luật AI của EU và các hướng dẫn dự kiến của SEC Hoa Kỳ, dự kiến sẽ yêu cầu kiểm toán rủi ro đối với các tác nhân AI trong lĩnh vực tài chính.




