PANews 1月5日消息,隨著 2026 年的到來,AI 安全領域迎來了首個重量級基準測試。LISABench 今日宣佈啟動 2026 第一季度評估,旨在通過實戰測試,決出在 Web3 智能合約漏洞檢測領域表現最強的前沿 AI 模型。此外,LISABench同步開展了社區投票預測的獎勵活動。
本次評測陣容豪華,集結了KIMI K2 (Moonshot AI)、DeepSeek V3.2 (深度求索)、QWen 3 30b-a3b (阿里雲)、GLM 4.6 (智譜 AI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (Google)和Claude 4.5 Sonnet (Anthropic)全球最頂尖的 7 大前沿模型 (Frontier Models) 同臺競技。
目前,針對 Q1 季度獲勝者的預測投票通道已經開啟。同時,LISABench 的評測標準代碼庫已在 GitHub 開源,供開發者查閱和復現。





