新浪微博发布 VibeThinker-3B,30 亿参数匹敌旗舰模型

Techub News 消息,据 CryptoBriefing 报道,新浪微博研究团队发布 VibeThinker-3B 语言模型。该模型仅含 30 亿参数,但在 AIME 2026 数学竞赛基准测试中获得 94.3 分,与拥有 6710 亿参数的 DeepSeek V3.2 性能相当,在 LiveCodeBench v6 编码测试中也达到 80.2 的 Pass@1 分数。该模型基于 Qwen2.5-Coder-3B 架构构建,团队通过课程式监督微调、多领域强化学习和离线自蒸馏技术提升性能。目前模型权重与代码已在 Hugging Face 和 GitHub 以 MIT 协议完全开源。分析指出,此类高效小型模型更易于在分布式网络中运行,对加密货币领域去中心化 AI 项目具有建设性意义。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论