LISABench 2026 개막: 7개의 AI가 웹3 취약점 발견 부문 1위 자리를 놓고 경쟁합니다.

Tin Tức Bitcoin

01-05

이 기사는 기계로 번역되었습니다

원문 표시

LISABench는 실제 환경 테스트를 통해 웹3 스마트 계약 취약점 탐지 분야의 선두 AI 모델을 결정하기 위한 2026년 1분기 평가 결과를 발표했습니다.

이 테스트는 2026년을 맞아 AI 보안 분야의 첫 번째 주요 벤치마크로 도입되었으며, 커뮤니티 투표를 통해 보상을 제공하는 예측 프로그램과 커뮤니티 검증을 위한 소스 코드 공개 기능도 포함하고 있습니다.

주요 내용

LISABench는 Web3 스마트 계약 취약점 탐지를 위한 2026년 1분기 평가를 시작합니다.
GPT-5.2, Gemini-3-pro-preview, Claude 4.5 Sonnet을 포함한 7개의 주요 AI 모델이 참여했습니다.
우승팀을 예측하는 설문조사를 실시하고, 코드베이스를 GitHub에 오픈소스로 공개하세요.

LISABench 2026년 1분기 벤치마크는 무엇인가요?

LISABench는 실제 환경 테스트를 통해 Web3 스마트 계약 취약점을 탐지하는 데 가장 효과적인 AI 모델을 선정하기 위해 2026년 1분기 평가를 시작했습니다.

1월 5일에 발표된 이 내용은 AI 보안 분야에서 첫 번째 주요 이정표가 세워질 2026년과 시기적으로 일치합니다. 핵심은 스마트 계약의 취약점을 탐지하는 능력인데, 이는 코드 오류로 인한 악용 및 자산 손실 위험 때문에 암호화폐 생태계에 매우 중요한 영역입니다.

동시에 LISABench는 커뮤니티 투표를 통한 보상 기반 예측 프로그램을 시작하여 사용자들이 경쟁에 참여하도록 유도하고 각 모델에 대한 커뮤니티의 신뢰도 및 기대치에 대한 더 많은 피드백 데이터를 생성하는 것을 목표로 했습니다.

참여 모델과 커뮤니티 모니터링 방법

이번 리뷰에는 KIMI K2, DeepSeek V3.2, QWen 3 30b-a3b, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5 Sonnet 등 7개 모델이 포함되었습니다.

이 목록에는 Moonshot AI, Alibaba Cloud, Zhipu AI, OpenAI, Google, Anthropic 등 다양한 개발사의 모델이 포함되어 있으며, 모두 단일 플랫폼에서 직접 비교 경쟁을 펼칩니다. 개발사의 다양성 덕분에 개별 프로젝트의 주장에만 의존하는 것이 아니라 일관된 기준에 따라 성능을 비교할 수 있습니다.

1분기 우승자를 예측하는 투표가 시작되었습니다. 또한 LISABench는 벤치마크 코드가 GitHub에 오픈소스로 공개되어 개발자들이 테스트를 검토하고 재현하여 결과를 비교할 수 있다고 밝혔습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트