百度的新型人工智能已经超越了顶级模型,而且构建成本降低了94%。

avatar
Decrypt
05-12
本文为机器翻译
展示原文

中国版的Google百度上周晚些时候正式发布了 ERNIE 5.1 ,其最引人注目的数据不容忽视:该模型的训练成本比同等规模的同类 AI 系统低约 94%。

换句话说,训练一个前缘人工智慧模型通常需要数百万(甚至数十亿美元)的运算资源。百度控制中国超过76%的搜寻市场,并在纳斯达克上市,股票代号为BIDU。该公司声称,其仅用了大约二十分之一的计算资源就实现了同等水准的效能。

这项技术被称为「多维弹性预训练」。百度并没有从零开始建立 ERNIE 5.1,而是从其现有的 ERNIE 5.0 架构(于 2026 年 1 月发布)中提取了一个优化的子网络,并将其压缩。总参数量减少到原来的三分之一左右。有效参数(即在对话过程中实际发挥作用的参数)减少了一半。最后得到的模型更精简,既继承了原有模型的知识库,也避免了重复完整的训练成本。

在LMArena搜寻竞技场(一个由真实用户在即时网路搜寻任务中比较AI模型并根据人类偏好评分的排行榜)上, ERNIE 5.1获得了1223分,位列全球第四,并在中国所有模型中排名第一。它的智能体能力——即处理诸如填写电子表格或自主浏览网页等多步骤任务的能力——超越了先前的中国标竿模型DeepSeek-V4-Pro。

ERNIE这个名字在西方观察家看来或许有些陌生,但它其实是中国一款主流的聊天机器人。百度于2023年8月推出了Ernie Bot,同年12月,这款聊天机器人在中国的用户数量就达到了1亿——比大多数中国竞争对手都快,但仍然比ChatGPT创下的仅用两个月就达到1亿用户的全球纪录慢一些。

这种效率提升的想法与DeepSeek在2025年1月对人工智慧产业的影响如出一辙。当时,这家中国新创公司发布了R1模型——该模型在查询成本降低98%的情况下,性能与OpenAI的o1模型不相上下——这导致英伟达市值蒸发6000亿美元,并迫使所有主要的人工智慧实验室重新思考,仅仅依靠大量计算资源是否是唯一可行的策略。 ERNIE 5.1的效率提升则著重于训练而非推理,但背后的讯息是一致的:中国实验室不断探索以更少的资源创造更多价值的方法。

值得一提的是训练后的流程。百度建构了一个四阶段强化学习系统,称为 MOPD(多教师策略蒸馏)。与试图一次性教授所有技能(这往往会导致“跷跷板效应”,例如,数学成绩的提高会降低创意写作能力)不同,百度并行训练了针对代码、推理和智能任务的专家模型,然后将所有模型蒸馏成一个统一的模型。最后一个在线强化学习阶段处理开放式对话和创意输出,保留了蒸馏过程未能很好地捕捉到的信息。

理论上,这意味著所有技能的熟练程度都相同,没有哪一项技能比其他技能更优先。

在 GPQA(研究生级别谷歌验证问答,一项衡量模型能否回答无法通过谷歌搜索找到答案的专家级科学问题的基准测试)上,ERNIE 5.1 的性能接近于西方领先的闭源模型。在 AIME26(美国数学邀请赛,2026 年版,旨在测试模型在竞争条件下的高级问题解决能力)上,该模型在使用工具辅助推理时取得了 99.6% 的分数,仅次于Gemini 3.1 Pro。

百度表示,ERNIE 5.1 已在中国十余个创意和智慧平台上推出,包括 AI 角色扮演平台和短剧生成工具。用户可透过ernie.baidu.com存取该模型,也可透过百度 AI 云端平台的 API 进行存取。

百度将于5月13日至14日在北京举办年度开发者大会Create 2026,届时将展示ERNIE最新的工业应用。此次大会将成为衡量百度将此模式推向企业和全球市场的力度的重要指标。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论