Techub News 消息,據 CryptoBriefing 報道,新浪微博研究團隊發佈 VibeThinker-3B 語言模型。該模型僅含 30 億參數,但在 AIME 2026 數學競賽基準測試中獲得 94.3 分,與擁有 6710 億參數的 DeepSeek V3.2 性能相當,在 LiveCodeBench v6 編碼測試中也達到 80.2 的 Pass@1 分數。該模型基於 Qwen2.5-Coder-3B 架構構建,團隊通過課程式監督微調、多領域強化學習和離線自蒸餾技術提升性能。目前模型權重與代碼已在 Hugging Face 和 GitHub 以 MIT 協議完全開源。分析指出,此類高效小型模型更易於在分佈式網絡中運行,對加密貨幣領域去中心化 AI 項目具有建設性意義。
新浪微博發佈 VibeThinker-3B,30 億參數匹敵旗艦模型
來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享





