LISABench 2026의 첫 번째 테스트: 7개의 최고 AI 모델이 웹3 취약점 탐지 분야의 왕좌를 놓고 경쟁합니다.

01-05

이 기사는 기계로 번역되었습니다

원문 표시

PANews는 1월 5일, 2026년을 맞아 AI 보안 분야에 첫 번째 주요 벤치마크 테스트가 시작된다고 보도했습니다. LISABench는 오늘 실제 환경 테스트를 통해 Web3 스마트 계약 취약점 탐지 분야에서 최고의 성능을 발휘하는 최첨단 AI 모델을 가려내기 위한 2026년 1분기 평가 시작을 발표했습니다. 또한, LISABench는 동시에 커뮤니티 투표 예측 보상 프로그램도 시작합니다.

이번 평가에는 세계 최고 수준의 최첨단 모델 7종, 즉 KIMI K2(Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b(Alibaba Cloud), GLM 4.6(Zhipu AI), GPT-5.2(OpenAI), Gemini-3-pro-preview(Google), Claude 4.5 Sonnet(Anthropic)이 한자리에 모여 경쟁을 펼칩니다.

현재 1분기 우승자 예측 투표가 진행 중입니다. 한편, LISABench 벤치마크 코드베이스는 개발자들이 검토하고 재현할 수 있도록 GitHub에 오픈소스로 공개되었습니다.