PANews đưa tin ngày 5 tháng 1 rằng với sự xuất hiện của năm 2026, lĩnh vực bảo mật AI đang đón nhận bài kiểm tra chuẩn mực lớn đầu tiên. Hôm nay, LISABench đã công bố khởi động đánh giá quý 1 năm 2026, nhằm mục đích xác định mô hình AI tiên tiến có hiệu suất cao nhất trong việc phát hiện lỗ hổng hợp đồng thông minh Web3 thông qua thử nghiệm thực tế. Ngoài ra, LISABench cũng đồng thời khởi động chương trình phần thưởng dự đoán bình chọn của cộng đồng.
Cuộc đánh giá lần tự hào sở hữu một dàn mô hình ấn tượng, quy tụ bảy mô hình tiên tiến độ sâu thế giới—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) và Claude 4.5 Sonnet (Anthropic)—cùng cạnh tranh trên cùng một sân khấu.
Hiện tại, việc bình chọn dự đoán người chiến thắng quý 1 đang diễn ra. Trong khi đó, mã nguồn của công cụ đo hiệu năng LISABench đã được mã nguồn mở trên GitHub để các nhà phát triển có thể xem xét và tái tạo.





