中國版的Google百度上週晚些時候正式發布了 ERNIE 5.1 ,其最引人注目的數據不容忽視:該模型的訓練成本比同等規模的同類 AI 系統低約 94%。
換句話說,訓練一個前緣人工智慧模型通常需要數百萬(甚至數十億美元)的運算資源。百度控制中國超過76%的搜尋市場,並在納斯達克上市,股票代號為BIDU。該公司聲稱,其僅用了大約二十分之一的計算資源就實現了同等水準的效能。
這項技術被稱為「多維彈性預訓練」。百度並沒有從零開始建立 ERNIE 5.1,而是從其現有的 ERNIE 5.0 架構(於 2026 年 1 月發布)中提取了一個優化的子網絡,並將其壓縮。總參數量減少到原來的三分之一左右。有效參數(即在對話過程中實際發揮作用的參數)減少了一半。最後得到的模型更精簡,既繼承了原有模型的知識庫,也避免了重複完整的訓練成本。
在LMArena搜尋競技場(一個由真實用戶在即時網路搜尋任務中比較AI模型並根據人類偏好評分的排行榜)上, ERNIE 5.1獲得了1223分,位列全球第四,並在中國所有模型中排名第一。它的智能體能力——即處理諸如填寫電子表格或自主瀏覽網頁等多步驟任務的能力——超越了先前的中國標竿模型DeepSeek-V4-Pro。
ERNIE這個名字在西方觀察家看來或許有些陌生,但它其實是中國一款主流的聊天機器人。百度於2023年8月推出了Ernie Bot,同年12月,這款聊天機器人在中國的用戶數量就達到了1億——比大多數中國競爭對手都快,但仍然比ChatGPT創下的僅用兩個月就達到1億用戶的全球紀錄慢一些。
這種效率提升的想法與DeepSeek在2025年1月對人工智慧產業的影響如出一轍。當時,這家中國新創公司發布了R1模型——該模型在查詢成本降低98%的情況下,性能與OpenAI的o1模型不相上下——這導致英偉達市值蒸發6000億美元,並迫使所有主要的人工智慧實驗室重新思考,僅僅依靠大量計算資源是否是唯一可行的策略。 ERNIE 5.1的效率提升則著重於訓練而非推理,但背後的訊息是一致的:中國實驗室不斷探索以更少的資源創造更多價值的方法。
值得一提的是訓練後的流程。百度建構了一個四階段強化學習系統,稱為 MOPD(多教師策略蒸餾)。與試圖一次性教授所有技能(這往往會導致“蹺蹺板效應”,例如,數學成績的提高會降低創意寫作能力)不同,百度並行訓練了針對代碼、推理和智能任務的專家模型,然後將所有模型蒸餾成一個統一的模型。最後一個在線強化學習階段處理開放式對話和創意輸出,保留了蒸餾過程未能很好地捕捉到的信息。
理論上,這意味著所有技能的熟練程度都相同,沒有哪一項技能比其他技能更優先。
在 GPQA(研究生級別谷歌驗證問答,一項衡量模型能否回答無法通過谷歌搜索找到答案的專家級科學問題的基準測試)上,ERNIE 5.1 的性能接近於西方領先的閉源模型。在 AIME26(美國數學邀請賽,2026 年版,旨在測試模型在競爭條件下的高級問題解決能力)上,該模型在使用工具輔助推理時取得了 99.6% 的分數,僅次於Gemini 3.1 Pro。
百度表示,ERNIE 5.1 已在中國十餘個創意和智慧平台上推出,包括 AI 角色扮演平台和短劇生成工具。用戶可透過ernie.baidu.com存取該模型,也可透過百度 AI 雲端平台的 API 進行存取。
百度將於5月13日至14日在北京舉辦年度開發者大會Create 2026,屆時將展示ERNIE最新的工業應用。此次大會將成為衡量百度將此模式推向企業和全球市場的力度的重要指標。




