OpenAI 的十週歲生日,過得不太體面。
在當天發佈的 GPT-5.2 交出了一份完美答卷:它橫掃許多基準測試的 SOTA,在數學和編程等競賽場景中的表現堪稱亮眼,也被官方描述為 AI「超級大腦」。
可到了社交網絡,迎接它的不是掌聲,而是用戶的集體罵街。
在 X 和 Reddit 上,憤怒與失望幾乎寫在每一條評論裡。人們又一次懷念起那個曾經的「白月光」GPT-4o:有人說 GPT-5.2 變得平淡、乏味、像被磨平了稜角;也有人譏諷它成了「把成年人當幼兒園小孩對待」的說教。
當輿論的炮火對準 OpenAI 及其 CEO Sam Altman(山姆·奧特曼),一個尖銳的問題擺在面前:為什麼模型更「聰明」了,用戶反而更不愛了?
更「聰明」的模型,為什麼不討喜了
The Information 今天凌晨的最新報道,扒出了內幕。
過去一年,OpenAI 內部曾奉行一條鐵律:每一次模型的代際飛躍,都會伴隨著用戶量的爆發式增長,因為「變聰明」帶來的體驗升級是直觀的。但現在,這條鐵律失效了。
當然,模型在智能與科研計算領域的提升依舊顯著。研究團隊耗費數月打磨推理能力,讓它能攻克更復雜的數學與科學難題,但對於大多數普通用戶而言,這種感知微乎其微。
https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
換句話說,智能的提升,並不天然等同於體驗的提升。
普通用戶很少需要一臺「競賽級大腦」,他們更多需要一個「日常好用的助手」。OpenAI 對 150 萬次對話的大規模分析佐證了這一判斷,用戶的核心需求極其接地氣:實用指導(29%)、信息查詢(24%)以及寫作(24%)等,而與編程任務相關的對話只有 4.2%。
於是矛盾就變得非常具體:當技術團隊在實驗室裡狂卷數理化、狂卷基準測試時,用戶在聊天框裡只想要一句話解決問題——別繞、別教、別拖。
戰線拉得過長是一大槽點。
今年大部分時間裡,奧特曼同時啟動了多個新項目:視頻生成應用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設備、機器人……攤子越鋪越大,資源也被越分越碎。
這其實是科技巨頭最常見的經典錯誤:核心陣地還沒打穩,就急著開闢第二、第三戰場。短期看是「全面開花」,長期看,貪多嚼不爛,乃兵家大忌——每一條戰線都缺人、缺算力、缺產品打磨的耐心。
OpenAI 內部「研究優先」和「產品增長」之間的拉扯,在圖像生成上體現得尤為明顯:
即便 GPT-4o 的吉卜力風格在三月還短暫帶動過 ChatGPT 的使用與用戶增長,但 OpenAI 還是一度把圖像模型的開發優先級往後放,等到 Nano Banana 口碑發酵後,OpenAI 又緊急回頭補課,內部也因此爆發分歧——
奧特曼認定圖像模型是用戶增長的抓手,研究主管 Mark Chen 則更想把資源押在別的項目上。
另外,伴隨著 Scaling Laws 邊際效益遞減,為了突破大模型的瓶頸,OpenAI 過去一年裡押注了推理模型,超過 1000 人的研究團隊將資源傾斜於此,導致對 ChatGPT 日常體驗的優化被邊緣化。
這種做法不僅分散了資源,甚至在年初的內測中出現了性能倒退——為了適配「聊天」場景,反而削弱了推理模型的純粹性。雖然後來推出了「思考模式」和「深度研究」來分流、來補救,但用戶使用率卻很低,真正的日常對話體驗並沒有因此變得更討喜。
除此之外,新舊模型之間也常出現兼容問題。
例如在發佈 GPT-5 前,研究人員發現模型在集成進 ChatGPT 後在部分編程任務上表現變差——因為系統根據用戶職業等個性化信息調整回答,結果反而干擾了模型理解,導致錯誤答案。
誠然,推理模型越來越強,但 ChatGPT 體驗越來越拉胯。
當技術進步的方向和用戶需求的方向開始分叉,誰會先妥協?答案顯而易見。
Gemini 3 Pro 的強勢發佈,最終把 OpenAI 逼到了牆角,於是便有了奧特曼發佈「紅色警報」的經典名場面,要求 OpenAI 員工重新聚焦 ChatGPT,提高產品體驗吸引力。
而在同一時間,OpenAI 應用負責人 Fidji Simo 也在個人博客中闡述 ChatGPT 的願景,那就是從主要以文本為主的對話系統,轉向能根據用戶意圖動態生成界面的全生成式 UI。
只是Simo 也曾承認,公司本質仍以研究為中心,「產品本身並不是最終目標」。
Fidji Simo
從商業邏輯看,這句話其實很危險。
不同於 Anthropic 更偏向主攻 API 市場,OpenAI 的大頭收入來自個人訂閱。在消費市場,沒有人會為企業的「終極理想」買單,用戶只願為當下的體驗付費。這就好比餐廳大廚醉心於研發米其林料理,而大堂裡的食客僅僅想要一碗熱氣騰騰的陽春麵。
不過,如果你因此就斷言 OpenAI 內部已經亂了陣腳,那可能低估了這家公司的韌性。
據彭博社援引 Mark Chen 的說法,「紅色警報」並非新鮮事,而更像是一種戰時狀態的常態化管理工具。每當 OpenAI 需要集中火力攻克某一單一目標,或要求團隊放下低優先級任務時,這種機制就會啟動。
播客地址:https://x.com/Kantrowitz/status/2001790090641645940
奧特曼在最新的播客中,同樣否認了拉響紅色警報帶來的過度焦慮。
「首先,所謂的『紅色警報』,在我們看來其實是一種低風險、但非常必要的應對措施。」奧特曼坦言,「在潛在的競爭威脅出現時,保持一點『偏執』、並迅速做出反應,是件好事。」
他甚至提到了今年年初 DeepSeek 的崛起,認為那和現在的 Gemini 3 一樣,都是一種良性的外部刺激。
「Gemini 3 到目前為止,還沒帶來我們原本擔心的那種毀滅性衝擊。雖然它和 DeepSeek 一樣,精準地刺痛了我們在產品策略上的軟肋,但也倒逼我們做出了極其迅速的調整。」
在奧特曼看來,這種緊急狀態通常只會持續六到八週。「我很高興我們有這種快速反應機制,我們不會在這個狀態裡待太久。」
OpenAI 顯然也明白光喊口號不夠,他們今天也正式發佈了 GPT-5.2-Codex。
作為專為解決複雜現實軟件工程問題而生的智能體編程模型,GPT-5.2-Codex 在通用智能的基礎上,融合了 GPT-5.1-Codex-Max 的終端操作能力,更擅長處理代碼重構、遷移等長程任務。
而同樣是在播客的尾聲,當主持人詢問「GPT-6 還要等多久?」時,奧特曼敞亮地表示:「我不知道我們什麼時候會正式把某個模型命名為 GPT-6,但我預計在明年第一季度,會有比 5.2 有顯著提升的新模型發佈。」
拉響「紅色警報」,到 GPT-5.2 系列的反擊,再到 GPT-6 的曖昧預告,OpenAI 試圖用新模型與新節奏重建信心,但決定長期勝負的,仍是分發入口、生態協同與算力成本等硬門檻。
Google 的陽謀,與奧特曼的 8300 億「空城計」
Google 的優勢,從來不只在 Gemini 3 Pro 這一個模型上,更在於它幾乎無可匹敵的分發渠道。
搜索、Chrome、辦公套件。在 AI 賽道,護城河可能是所有科技產品中最淺的。 用戶的遷移成本幾乎為零,當 Google 的 AI 產品如空氣般無處不在,這幾乎成了一場無解的陽謀——你不需要「被說服」,你只會「順手就用」。
更重要的是,在與 Google 的較量中,硬件層面的短板成了 OpenAI 最大的軟肋。
相比於 Google 十二年前就開始佈局專用 AI 芯片(TPU)所建立的效率優勢,OpenAI 每年仍需花費數十億美元租用算力。即便試圖通過自建數據中心和芯片來「補課」,但體驗在被追平、成本在被碾壓的現狀已是不爭的事實。
用網友的話來說:
OpenAI 現在並不需要一個更強大的模型,它需要的是 AMD。如果 OpenAI 收購了 AMD,這場 AI 之戰就將宣告結束。Google 之所以不怕 OpenAI,是因為它擁有自家的 TPU。但它真正該擔心的,是 OpenAI 擁有 AMD。
OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言,由於算力捉襟見肘,每當新功能上線(如年初 GPT-4o 吉卜力風格),就必須從研究部門「抽血」,把算力挪給產品部。這是一種飲鴆止渴的循環——為了維持今天的用戶體驗,被迫推遲了明日的技術研發。
可算力這東西,歸根到底就是兩個字:燒錢。而且是海量地燒錢。
為此,據 WSJ 報道,OpenAI 已計劃發起 1000 億美元的鉅額融資;若一切順利,這家超級獨角獸將在明年 Q1 之前,以 8300 億美元的估值,再次刷新資本市場的想象力。
而在今年早些時候,軟銀同意向 OpenAI 投資 300 億美元,並於上月出售所持的英偉達股份價值 58 億美元,為這筆投資籌資,並預計儘快完成剩餘 225 億美元的出資。
但錢的問題沒那麼簡單。預計到 2030 年,OpenAI 的現金消耗將超過 2000 億美元。相比之下,Google 財務穩健,甚至能通過 Oracle 等合作伙伴的股價波動間接擠壓 OpenAI 的融資前景。
到處籌錢的 OpenAI,看起來更像是在和時間賽跑。於是便誕生了那個笑話:照奧特曼的融資能力,沒準哪天連 Google 和英偉達都能「打包帶走」。
但玩笑歸玩笑,錢能買來時間,卻買不來口碑。
所以在 2025 年這個冬天,狂奔三年的 OpenAI 選擇先踩一腳剎車,其實是對的:收攏戰線、回撤資源,把方向重新對準 ChatGPT 的日常體驗。
這是一次昂貴但必要的糾偏。
技術領先不等於產品好用,基準測試第一不等於用戶滿意。更重要的是,你不能只在用戶懷念舊版本的時候,才想起來問問他們的感受。
本文來自微信公眾號“APPSO”,作者:APPSO,36氪經授權發佈。





