LISABench 2026 개막: 7개의 AI가 웹3 취약점 발견 부문 1위 자리를 놓고 경쟁합니다.

이 기사는 기계로 번역되었습니다
원문 표시

LISABench는 실제 환경 테스트를 통해 웹3 스마트 계약 취약점 탐지 분야의 선두 AI 모델을 결정하기 위한 2026년 1분기 평가 결과를 발표했습니다.

이 테스트는 2026년을 맞아 AI 보안 분야의 첫 번째 주요 벤치마크로 도입되었으며, 커뮤니티 투표를 통해 보상을 제공하는 예측 프로그램과 커뮤니티 검증을 위한 소스 코드 공개 기능도 포함하고 있습니다.

주요 내용
  • LISABench는 Web3 스마트 계약 취약점 탐지를 위한 2026년 1분기 평가를 시작합니다.
  • GPT-5.2, Gemini-3-pro-preview, Claude 4.5 Sonnet을 포함한 7개의 주요 AI 모델이 참여했습니다.
  • 우승팀을 예측하는 설문조사를 실시하고, 코드베이스를 GitHub에 오픈소스로 공개하세요.

LISABench 2026년 1분기 벤치마크는 무엇인가요?

LISABench는 실제 환경 테스트를 통해 Web3 스마트 계약 취약점을 탐지하는 데 가장 효과적인 AI 모델을 선정하기 위해 2026년 1분기 평가를 시작했습니다.

1월 5일에 발표된 이 내용은 AI 보안 분야에서 첫 번째 주요 이정표가 세워질 2026년과 시기적으로 일치합니다. 핵심은 스마트 계약의 취약점을 탐지하는 능력인데, 이는 코드 오류로 인한 악용 및 자산 손실 위험 때문에 암호화폐 생태계에 매우 중요한 영역입니다.

동시에 LISABench는 커뮤니티 투표를 통한 보상 기반 예측 프로그램을 시작하여 사용자들이 경쟁에 참여하도록 유도하고 각 모델에 대한 커뮤니티의 신뢰도 및 기대치에 대한 더 많은 피드백 데이터를 생성하는 것을 목표로 했습니다.

참여 모델과 커뮤니티 모니터링 방법

이번 리뷰에는 KIMI K2, DeepSeek V3.2, QWen 3 30b-a3b, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5 Sonnet 등 7개 모델이 포함되었습니다.

이 목록에는 Moonshot AI, Alibaba Cloud, Zhipu AI, OpenAI, Google, Anthropic 등 다양한 개발사의 모델이 포함되어 있으며, 모두 단일 플랫폼에서 직접 비교 경쟁을 펼칩니다. 개발사의 다양성 덕분에 개별 프로젝트의 주장에만 의존하는 것이 아니라 일관된 기준에 따라 성능을 비교할 수 있습니다.

1분기 우승자를 예측하는 투표가 시작되었습니다. 또한 LISABench는 벤치마크 코드가 GitHub에 오픈소스로 공개되어 개발자들이 테스트를 검토하고 재현하여 결과를 비교할 수 있다고 밝혔습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트