Bài kiểm tra đầu tiên của LISABench 2026 trong năm nay: Bảy mô hình AI hàng đầu tranh tài để giành danh hiệu "vua phát hiện lỗ hổng Web3".

Bài viết này được dịch máy
Xem bản gốc

PANews đưa tin ngày 5 tháng 1 rằng với sự xuất hiện của năm 2026, lĩnh vực bảo mật AI đang đón nhận bài kiểm tra chuẩn mực lớn đầu tiên. Hôm nay, LISABench đã công bố khởi động đánh giá quý 1 năm 2026, nhằm mục đích xác định mô hình AI tiên tiến có hiệu suất cao nhất trong việc phát hiện lỗ hổng hợp đồng thông minh Web3 thông qua thử nghiệm thực tế. Ngoài ra, LISABench cũng đồng thời khởi động chương trình phần thưởng dự đoán bình chọn của cộng đồng.

Cuộc đánh giá lần tự hào sở hữu một dàn mô hình ấn tượng, quy tụ bảy mô hình tiên tiến độ sâu thế giới—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) và Claude 4.5 Sonnet (Anthropic)—cùng cạnh tranh trên cùng một sân khấu.

Hiện tại, việc bình chọn dự đoán người chiến thắng quý 1 đang diễn ra. Trong khi đó, mã nguồn của công cụ đo hiệu năng LISABench đã được mã nguồn mở trên GitHub để các nhà phát triển có thể xem xét và tái tạo.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
1
Thêm vào Yêu thích
Bình luận