LISABench công bố đánh giá Q1/2026 nhằm xác định mô hình AI hàng đầu trong phát hiện lỗ hổng hợp đồng thông minh Web3 bằng thử nghiệm thực tế. Bài kiểm thử được giới thiệu là benchmark lớn đầu tiên củ...

<p><strong>LISABench công bố đánh giá Q1/2026 nhằm xác định mô hình AI hàng đầu trong phát hiện lỗ hổng <a href="https://tintucbitcoin.com/smart-contract-la-gi/" title="Smart Contract là gì? Cách hoạt động của hợp đồng thông minh" rel="nofollow">hợp đồng thông minh</a> Web3 bằng thử nghiệm thực tế.</strong></p><p>Bài kiểm thử được giới thiệu là benchmark lớn đầu tiên của lĩnh vực an ninh AI khi bước sang năm 2026, đồng thời mở chương trình dự đoán có thưởng qua bình chọn cộng đồng và công khai mã nguồn để cộng đồng kiểm chứng.</p><div><div>NỘI DUNG CHÍNH</div><ul><li>LISABench mở đánh giá Q1/2026 cho phát hiện lỗ hổng hợp đồng thông minh Web3.</li><li>7 mô hình AI hàng đầu tham gia, gồm GPT-5.2, Gemini-3-pro-preview, Claude 4.5 Sonnet.</li><li>Mở bình chọn dự đoán đội thắng và open-source codebase trên GitHub.</li></ul></div><h2>Benchmark Q1/2026 của LISABench là gì?</h2><p>LISABench khởi động đánh giá Q1/2026 để chọn mô hình AI hiệu quả nhất trong phát hiện lỗ hổng hợp đồng thông minh Web3 bằng kiểm thử thực tế.</p><p>Thông báo được đưa ra ngày 5/1, gắn với bối cảnh năm 2026 khi lĩnh vực an ninh AI đón benchmark lớn đầu tiên. Trọng tâm là năng lực phát hiện lỗ hổng trong hợp đồng thông minh, một mảng then chốt với hệ sinh thái tiền điện tử do rủi ro khai thác và thất thoát tài sản thường xuất phát từ lỗi mã.</p><p>Cùng thời điểm, LISABench mở chương trình dự đoán kết quả có thưởng thông qua bình chọn cộng đồng, nhằm thu hút người dùng theo dõi cuộc đua và tạo thêm dữ liệu phản hồi về mức độ tin cậy, kỳ vọng của cộng đồng với từng mô hình.</p><h2>Các mô hình tham gia và cách cộng đồng theo dõi</h2><p>Đánh giá quy tụ 7 mô hình: KIMI K2, DeepSeek V3.2, QWen 3 30b-a3b, GLM 4.6, GPT-5.2, Gemini-3-pro-preview và Claude 4.5 Sonnet.</p><p>Danh sách bao gồm các mô hình từ Moonshot AI, Alibaba Cloud, Zhipu AI, OpenAI, Google và Anthropic, cùng cạnh tranh trên một sân chơi để so sánh trực tiếp. Việc đa dạng nhà phát triển giúp đối chiếu hiệu suất theo cùng tiêu chí, thay vì chỉ dựa vào tuyên bố riêng lẻ của từng dự án.</p><p>Bình chọn dự đoán đội chiến thắng Q1 hiện đã mở. Ngoài ra, LISABench cho biết bộ mã benchmark đã được open-source trên GitHub, cho phép nhà phát triển xem xét và tái lập thử nghiệm để đối chiếu kết quả.</p>

LISABench 2026 mở màn: 7 AI tranh ngôi phát hiện lỗ hổng Web3

LISABench 發佈了其 2026 年第一季度評估，旨在通過真實環境測試，確定檢測 Web3 智能合約漏洞的領先 AI 模型。該測試被認為是首個重要的基準測試……

<p><strong>LISABench 發佈了其 2026 年第一季度評估，旨在通過實際測試確定檢測 Web3 <a href="https://tintucbitcoin.com/smart-contract-la-gi/" title="什麼是智能合約？智能合約是如何運作的？" rel="nofollow">智能合約</a>漏洞的領先 AI 模型。</strong></p><p>該測試作為 2026 年人工智能安全領域的第一個主要基準測試推出，它還包含一個預測程序，通過社群投票給予獎勵，並公開源代碼供社群驗證。</p><div><div>主要內容</div><ul><li>LISABench 將於 2026 年第一季度啟動 Web3 智能合約漏洞發現評估。</li><li>七款領先的人工智能模型參與了此次活動，包括 GPT-5.2、 Gemini-3-pro-preview 和 Claude 4.5 Sonnet。</li><li>發起投票預測獲勝隊伍，並在 GitHub 上開源代碼庫。</li></ul></div><h2> LISABench Q1/2026 基準測試是什麼？</h2><p> LISABench 啟動了 2026 年第一季度評估，旨在通過實際測試，選出檢測 Web3 智能合約漏洞的最有效 AI 模型。</p><p>該公告於1月5日發佈，恰逢2026背景，屆時人工智能安全領域將迎來首個重要里程碑。此次里程碑的重點在於檢測智能合約漏洞的能力，這對於加密貨幣生態系統至關重要，因為代碼錯誤往往會導致挖礦和資產損失的風險。</p><p>與此同時，LISABench 通過社群投票推出了一項基於獎勵的預測計劃，旨在引流關注比賽，並生成更多關於每個模型的可靠性和社群期望的反饋數據。</p><h2>參與模式以及社群如何進行監督</h2><p>評估包括 7 款機型：KIMI K2、DeepSeek V3.2、QWen 3 30b-a3b、GLM 4.6、GPT-5.2、 Gemini-3-pro-preview 和 Claude 4.5 Sonnet。</p><p>該列表囊括了來自 Moonshot AI、阿里雲、智普AI、OpenAI、谷歌和 Anthropic 等公司的模型，它們在同一平臺上展開直接比較。這種開發者的多樣性使得性能比較能夠基於一致的標準，而不是僅僅依賴於單個項目的宣傳。</p><p>預測第一季度獲勝者的投票現已開啟。此外，LISABench 表示，基準測試代碼已在 GitHub 上開源，開發者可以查看並復現測試，從而比較結果。</p>

LISABench 2026 拉開帷幕：7 款人工智能爭奪發現 Web3 漏洞的榜首位置。

世界自由金融公司（World Liberty Financial）的目標是在全球數兆美元的外匯市場——全球最大、流動性最強的金融領域——分一杯羹。

這家與川普政府有關的加密貨幣公司…

川普支持的「世界自由」計畫推出「世界互換」外匯平台

2026 年投資者面臨的問題已不是 「要不要配置」，而是「配多少，以及通過什麼工具配置 」。

ARK Invest：比特幣的機構化之路

作者： The Economist
編譯： 深潮 TechFlow
---------------------------------------------------------------
深潮導讀： 儘管比特幣價格仍處於 7 萬美元上方，但加密市場正經歷著一場前所未有的“孤獨寒冬”。本文深入剖析了本輪跌勢與以往的不同之處：槓桿清算的連鎖反應、曾被寄予厚望的 ETF 如今淪為砸盤推手，以及最...