Sam與Pichai扳手腕,圖片由AI生成
一個月前,谷歌的Gemini 3超越所有競爭對手成為“世界最佳”,一個月後,OpenAI成立10週年這一天(美國時間12月11日),正式推出新一代AI模型GPT-5.2。
在這一關鍵的產品發佈前,奧特曼為了應對主要對手的產品、挖角攻勢,在內部拉響最高級別的“紅色警報”。
所以,GPT-5.2的亮相,不僅關乎兩家科技巨頭的市場地位,更可能重新定義全球人工智能產業的競爭格局。
提前“內測”兩週的HyperWrite聯合創始人兼CEO馬特·舒默評論說:能力強,尤其是推理能力強,但速度慢,且場景太單一,只能通過ChatGPT使用。
“這是世界上最好的模型,它可以用1個小時來處理難題,而且還能出色完成任務。我已離不開它。”
硅谷AI專家艾莉·米勒也是“內測用戶”,她將GPT-5.2定義為“專業研究員”:對深度思考和複雜問題解決“嚴肅”、“專業”,但內容結構化,對追求快速、簡潔和擬人化交流的用戶不太友好。
“複雜的工作,腦暴,專業分析,我可能會用GPT-5.2。”
AI開發者Dp Singh也認同上述判斷,強調AI首次能在日常專業任務(如製作演示文稿、電子表格、分析圖表)中達到專家級產出水平,而不僅是演示場景。
GPT-5.2表現出來的與人類研究員平齊的專業能力,也引發了學界專家的關注。
賓夕法尼亞大學沃頓商學院教授、人工智能專家伊桑·莫利克說:“我從未如此確信過,即便今天人工智能發展不再繼續,未來10年社會、經濟仍然將面臨巨大的變革,因為人類會想方設法利用模型的能力。當然,AI的進步也不可能就此結束。”
01 OpenAI無法“遙遙領先”
OpenAI對GPT-5.2的定位很明確,是“迄今為止最適合現實世界專業用途的模型”。
而證明其“能力”的指標,就是基準測試、跑分。
上面是OpenAI在X上曬出來的一張基準測試圖(官方新聞稿甚至都沒這張圖)。
可以看到,在其自主研發的GDPval基準測試中,GPT-5.2在70.9%的明確任務上達到或超越了頂尖人類專家的水平,較其8月發佈的GPT-5(38.8%)實現大幅躍升,也領先於Anthropic的Claude Opus 4.5(59.6%)和谷歌的Gemini 3 Pro(53.5%)。
但是話說回來,GDPval是OpenAI自己的基準測試,做不好才有問題。
更重要的是,基準測試這東西,在業界數量太多了,OpenAI這次引用了其中8項不同類型的,谷歌在Gemini 3的引用了可能有20項基準測試,這裡就有一個操作空間了——我的哪些基準測試數據好就放哪個,其他就不放。
但如果我們把上面的表格轉換成折線圖,可以很清晰的看到,在多個基準測試中,OpenAI新發布的GPT-5.2各家最前沿的模型差別都不明顯。
可以說,AI競賽已從OpenAI一家獨大,演變為多方巨頭“短兵相接”的混戰。
《紐約時報》也提及了這種看法,並且援引行業專家觀點指出,“OpenAI所謂的AI基礎模型與其他公司模型之間的技術差距實際上已經不復存在。”
如果說,基準測試不夠直觀,可以看看具體的案例,下圖左是OpenAI官方提供的“海浪模擬器”網頁,右邊是相同提示詞在Gemini中生成的頁面,總的來說,各有優勢。
前面提到過,因為競爭對手的步步緊逼,奧特曼在公司內部拉響“紅色警報”。
從GPT 5.2和同行之間的差距來看,短期內估計沒辦法在產品和模型層面消除“紅色警報。”
針對這個問題,被奧特曼一手挖過來的應用業務首席執行官菲吉·西莫說,“紅色警報是向公司發出的一個信號,表明我們需要將資源集中在一個特定領域,這是一種確定優先級的方式。”
大意就是紅色警報不是決戰生死,只是讓大家看到管理層表決心、定方向。實際上GPT-5.2在數月之前就已經研發,只是選擇在這麼一個時間點發布。
問題是,如果要決企業生死,除了這個不怎麼能拉開差距的GPT-5.2,奧特曼的手中,還有沒有比它更快的刀?
當然,比起在內部拉警報,奧特曼在外部的表現還是挺放鬆。
他在接受CNBC採訪時表現出謹慎樂觀:“Gemini 3對我們的業務指標產生的影響,可能比我們擔心的要小。”他預計OpenAI將在2026年1月“以非常強勢的地位”解除“紅色警報”狀態。
02 十年一夢,還是十年十夢
OpenAI剛剛迎來成立10週年,官網也發了一條視頻,介紹這家公司從哪裡來、到哪裡去。
10年前,馬斯克還在OpenAI項目組中活動的時候,黃仁勳送給OpenAI的世界上首臺DGX-1服務器,各路大佬都在上面留下來簽名,背景牆有一句格言“關鍵的問題不在於我們‘知道什麼’,而在於我們如何‘運用所知’……我相信,我們每個人的責任都是——在行動時,要把自己當成全世界的命運都維繫在自己肩上一樣。”
十年來,OpenAI給世界送來了ChatGPT、Sora等震撼的產品,奧特曼在世界各地巡遊佈道,與各種硅谷巨頭捆綁壓鑄算力,但是隨著時間的推移,OpenAI從一開始的大幅度領先,到慢慢被對手追平甚至超越?
現在的OpenAI,處在一個茫然的十字路口。
成立初期,OpenAI聲稱其目標是“以最可能造福全人類的方式推進數字智能,不受產生財務回報需求的限制”。
斯塔福德郡大學的AI倫理學家凱瑟琳·弗利克也強調,這一創立理念已發生鉅變。因為在OpenAI複雜的架構背後,存在著一個利益錯綜複雜互相綁定的營利性公司。
“現在我們有一個營利性公司,它已經完全卸下了對社會效益的任何責任,基本上接受了那種不惜一切代價增長的信條。”弗利克表示,原因在於OpenAI身處生成式AI革命的最前沿,而這裡“有錢可賺”。
紅色警報聲中,OpenAI的第一要務是做產品體驗,商業化優先級排在後面,因為這已經涉及到生死存亡,也關乎奧特曼更遠大的理想——10年後可能會到達的超級智能,但這種願景並非是OpenAI絕對的共識。
03 商業化與治理的矛盾
技術競賽的背後,是OpenAI面臨的巨大商業化與盈利壓力。
奧特曼表示,OpenAI的目標是在2025年底實現相當於每年200億美元收入的月度營收,但他承認距離整體盈利“仍有很長一段路要走”。
更引人注目的是,OpenAI承諾在未來幾年投入高達1.4萬億美元用於計算基礎設施建設,以支撐其AI雄心。
市場調研公司Sensor Tower的最新數據顯示,2025年11月,ChatGPT全球月活用戶總數為8.1億,8-11月增速僅為6%,遠低於2024年同期40%以上水平。此外,其全球的份額,四個月內也從38%降至35%。
目前,ChatGPT是OpenAI的營收生命線。每週超過8億的活躍用戶中,約6%每月支付20美元使用高級服務。
OpenAI正試圖從免費用戶中挖掘更多價值,探索的方向包括在ChatGPT中引入廣告,以及開發交易分成模式(例如用戶通過聊天機器人購物,OpenAI從中抽成)。
西莫還證實,OpenAI計劃在推出“成人模式”(可能允許成人內容)前,先引入用戶年齡預測功能以保護青少年,“成人模式”預計明年第一季度上線。
與此同時,OpenAI正積極進軍企業軟件市場,將自身定位為同時服務消費者與企業兩大客戶群體的公司。GPT-5.2在編碼、法律、金融等專業領域的性能提升,正是為了吸引高價值的企業客戶。
然而,在這一市場,OpenAI將直接面對谷歌、微軟等巨頭的激烈競爭,後者能夠將AI工具與成熟的辦公軟件生態(如Google Workspace、Microsoft 365)深度捆綁。
營利性能幫助OpenAI獲得源源不斷的資金,以繼續它幫助人類的遠大理想,但這個過程中也會衍生出一系列的安全、倫理方面的問題。
就在GPT-5.2發佈之前,OpenAI遭遇一項新的訴訟,指控ChatGPT與一名心理困擾用戶的互動間接導致了康涅狄格州的一起謀殺-自殺慘劇。需要注意,這已經不是第一起類似的訴訟。
OpenAI回應稱事件“令人心碎”,並承諾持續改進系統對心理困擾跡象的識別和應對能力,引導用戶尋求現實幫助。
此外,《紐約時報》起訴OpenAI及其合作伙伴微軟侵犯版權的案件仍在進行中,凸顯了AI訓練數據合法性這一根本性行業難題。
04 與谷歌“爭霸”
這場OpenAI與谷歌之間的較量,早已超越單純的技術參數比拼,演變為一場涵蓋技術迭代、生態構建、商業模式、安全治理和資本耐力的全方位戰爭。
在技術層面,基準測試的“榜首”爭奪日趨白熱化。
OpenAI研究副總裁艾丹·克拉克雖未透露GPT-5.2的具體訓練突破,但承認在預訓練等基礎環節持續改進,回應了業界對“預訓練潛力是否耗盡”的質疑。
在生態層面,OpenAI推出自有瀏覽器,意在挑戰谷歌的Chrome,試圖構建從底層模型到上層應用的完整生態閉環。而谷歌則憑藉其龐大的現有產品矩陣,試圖通過整合創造協同優勢。
AI模型評估平臺LMArena公司Wei-Lin Chiang指出:“通用模型的用戶增長已觸及階段性瓶頸,下一個增長極必然來自垂直領域。”
他還強調,當前競爭的核心已非單純用戶擴張,而在於誰能率先在醫療、金融等關鍵行業建立起可靠、高效的解決方案,真正實現技術能力向產業價值的轉化。
最後在戰略文化層面,OpenAI從非營利研究機構向高估值商業實體的快速轉型,以及其對盈利的迫切追求,正在重塑其內部文化。一些早期員工曾引以為傲的、與谷歌等廣告驅動模式的區別,正在現實壓力下變得模糊。
“這是一場將在多條戰線上展開的競賽。”追蹤最新AI技術性能的公司Vals AI首席執行官拉揚·克里希南的論斷精準概括了當前AI霸主之爭的複雜性。
總體來看,GPT-5.2的發佈是OpenAI在專業領域一次有力的技術宣示,但它遠非終局——沒能和對手拉開差距,甚至OpenAI自己都說要到2026年1月份才能消除警報聲。更重要的是,即便短期內“紅色警報”可以暫時解除,但整個AI行業最高強度的競爭警報,已然長鳴。
本文來自微信公眾號“騰訊科技”,作者:蘇揚 無忌,36氪經授權發佈。




