OpenAI用GPT-5.2“反擊”谷歌，刀子夠快嗎？

36氪

12-12

Sam與Pichai扳手腕，圖片由AI生成

一個月前，谷歌的Gemini 3超越所有競爭對手成為“世界最佳”，一個月後，OpenAI成立10週年這一天（美國時間12月11日），正式推出新一代AI模型GPT-5.2。

在這一關鍵的產品發佈前，奧特曼為了應對主要對手的產品、挖角攻勢，在內部拉響最高級別的“紅色警報”。

所以，GPT-5.2的亮相，不僅關乎兩家科技巨頭的市場地位，更可能重新定義全球人工智能產業的競爭格局。

提前“內測”兩週的HyperWrite聯合創始人兼CEO馬特·舒默評論說：能力強，尤其是推理能力強，但速度慢，且場景太單一，只能通過ChatGPT使用。

“這是世界上最好的模型，它可以用1個小時來處理難題，而且還能出色完成任務。我已離不開它。”

硅谷AI專家艾莉·米勒也是“內測用戶”，她將GPT-5.2定義為“專業研究員”：對深度思考和複雜問題解決“嚴肅”、“專業”，但內容結構化，對追求快速、簡潔和擬人化交流的用戶不太友好。

“複雜的工作，腦暴，專業分析，我可能會用GPT-5.2。”

AI開發者Dp Singh也認同上述判斷，強調AI首次能在日常專業任務（如製作演示文稿、電子表格、分析圖表）中達到專家級產出水平，而不僅是演示場景。

GPT-5.2表現出來的與人類研究員平齊的專業能力，也引發了學界專家的關注。

賓夕法尼亞大學沃頓商學院教授、人工智能專家伊桑·莫利克說：“我從未如此確信過，即便今天人工智能發展不再繼續，未來10年社會、經濟仍然將面臨巨大的變革，因為人類會想方設法利用模型的能力。當然，AI的進步也不可能就此結束。”

01 OpenAI無法“遙遙領先”

OpenAI對GPT-5.2的定位很明確，是“迄今為止最適合現實世界專業用途的模型”。

而證明其“能力”的指標，就是基準測試、跑分。

上面是OpenAI在X上曬出來的一張基準測試圖（官方新聞稿甚至都沒這張圖）。

可以看到，在其自主研發的GDPval基準測試中，GPT-5.2在70.9%的明確任務上達到或超越了頂尖人類專家的水平，較其8月發佈的GPT-5（38.8%）實現大幅躍升，也領先於Anthropic的Claude Opus 4.5（59.6%）和谷歌的Gemini 3 Pro（53.5%）。

但是話說回來，GDPval是OpenAI自己的基準測試，做不好才有問題。

更重要的是，基準測試這東西，在業界數量太多了，OpenAI這次引用了其中8項不同類型的，谷歌在Gemini 3的引用了可能有20項基準測試，這裡就有一個操作空間了——我的哪些基準測試數據好就放哪個，其他就不放。

但如果我們把上面的表格轉換成折線圖，可以很清晰的看到，在多個基準測試中，OpenAI新發布的GPT-5.2各家最前沿的模型差別都不明顯。

可以說，AI競賽已從OpenAI一家獨大，演變為多方巨頭“短兵相接”的混戰。

《紐約時報》也提及了這種看法，並且援引行業專家觀點指出，“OpenAI所謂的AI基礎模型與其他公司模型之間的技術差距實際上已經不復存在。”

如果說，基準測試不夠直觀，可以看看具體的案例，下圖左是OpenAI官方提供的“海浪模擬器”網頁，右邊是相同提示詞在Gemini中生成的頁面，總的來說，各有優勢。

前面提到過，因為競爭對手的步步緊逼，奧特曼在公司內部拉響“紅色警報”。

從GPT 5.2和同行之間的差距來看，短期內估計沒辦法在產品和模型層面消除“紅色警報。”

針對這個問題，被奧特曼一手挖過來的應用業務首席執行官菲吉·西莫說，“紅色警報是向公司發出的一個信號，表明我們需要將資源集中在一個特定領域，這是一種確定優先級的方式。”

大意就是紅色警報不是決戰生死，只是讓大家看到管理層表決心、定方向。實際上GPT-5.2在數月之前就已經研發，只是選擇在這麼一個時間點發布。

問題是，如果要決企業生死，除了這個不怎麼能拉開差距的GPT-5.2，奧特曼的手中，還有沒有比它更快的刀？

當然，比起在內部拉警報，奧特曼在外部的表現還是挺放鬆。

他在接受CNBC採訪時表現出謹慎樂觀：“Gemini 3對我們的業務指標產生的影響，可能比我們擔心的要小。”他預計OpenAI將在2026年1月“以非常強勢的地位”解除“紅色警報”狀態。

02 十年一夢，還是十年十夢

OpenAI剛剛迎來成立10週年，官網也發了一條視頻，介紹這家公司從哪裡來、到哪裡去。

10年前，馬斯克還在OpenAI項目組中活動的時候，黃仁勳送給OpenAI的世界上首臺DGX-1服務器，各路大佬都在上面留下來簽名，背景牆有一句格言“關鍵的問題不在於我們‘知道什麼’，而在於我們如何‘運用所知’……我相信，我們每個人的責任都是——在行動時，要把自己當成全世界的命運都維繫在自己肩上一樣。”

十年來，OpenAI給世界送來了ChatGPT、Sora等震撼的產品，奧特曼在世界各地巡遊佈道，與各種硅谷巨頭捆綁壓鑄算力，但是隨著時間的推移，OpenAI從一開始的大幅度領先，到慢慢被對手追平甚至超越？

現在的OpenAI，處在一個茫然的十字路口。

成立初期，OpenAI聲稱其目標是“以最可能造福全人類的方式推進數字智能，不受產生財務回報需求的限制”。

斯塔福德郡大學的AI倫理學家凱瑟琳·弗利克也強調，這一創立理念已發生鉅變。因為在OpenAI複雜的架構背後，存在著一個利益錯綜複雜互相綁定的營利性公司。

“現在我們有一個營利性公司，它已經完全卸下了對社會效益的任何責任，基本上接受了那種不惜一切代價增長的信條。”弗利克表示，原因在於OpenAI身處生成式AI革命的最前沿，而這裡“有錢可賺”。

紅色警報聲中，OpenAI的第一要務是做產品體驗，商業化優先級排在後面，因為這已經涉及到生死存亡，也關乎奧特曼更遠大的理想——10年後可能會到達的超級智能，但這種願景並非是OpenAI絕對的共識。

03 商業化與治理的矛盾

技術競賽的背後，是OpenAI面臨的巨大商業化與盈利壓力。

奧特曼表示，OpenAI的目標是在2025年底實現相當於每年200億美元收入的月度營收，但他承認距離整體盈利“仍有很長一段路要走”。

更引人注目的是，OpenAI承諾在未來幾年投入高達1.4萬億美元用於計算基礎設施建設，以支撐其AI雄心。

市場調研公司Sensor Tower的最新數據顯示，2025年11月，ChatGPT全球月活用戶總數為8.1億，8-11月增速僅為6%，遠低於2024年同期40%以上水平。此外，其全球的份額，四個月內也從38%降至35%。

目前，ChatGPT是OpenAI的營收生命線。每週超過8億的活躍用戶中，約6%每月支付20美元使用高級服務。

OpenAI正試圖從免費用戶中挖掘更多價值，探索的方向包括在ChatGPT中引入廣告，以及開發交易分成模式（例如用戶通過聊天機器人購物，OpenAI從中抽成）。

西莫還證實，OpenAI計劃在推出“成人模式”（可能允許成人內容）前，先引入用戶年齡預測功能以保護青少年，“成人模式”預計明年第一季度上線。

與此同時，OpenAI正積極進軍企業軟件市場，將自身定位為同時服務消費者與企業兩大客戶群體的公司。GPT-5.2在編碼、法律、金融等專業領域的性能提升，正是為了吸引高價值的企業客戶。

然而，在這一市場，OpenAI將直接面對谷歌、微軟等巨頭的激烈競爭，後者能夠將AI工具與成熟的辦公軟件生態（如Google Workspace、Microsoft 365）深度捆綁。

營利性能幫助OpenAI獲得源源不斷的資金，以繼續它幫助人類的遠大理想，但這個過程中也會衍生出一系列的安全、倫理方面的問題。

就在GPT-5.2發佈之前，OpenAI遭遇一項新的訴訟，指控ChatGPT與一名心理困擾用戶的互動間接導致了康涅狄格州的一起謀殺-自殺慘劇。需要注意，這已經不是第一起類似的訴訟。

OpenAI回應稱事件“令人心碎”，並承諾持續改進系統對心理困擾跡象的識別和應對能力，引導用戶尋求現實幫助。

此外，《紐約時報》起訴OpenAI及其合作伙伴微軟侵犯版權的案件仍在進行中，凸顯了AI訓練數據合法性這一根本性行業難題。

04 與谷歌“爭霸”

這場OpenAI與谷歌之間的較量，早已超越單純的技術參數比拼，演變為一場涵蓋技術迭代、生態構建、商業模式、安全治理和資本耐力的全方位戰爭。

在技術層面，基準測試的“榜首”爭奪日趨白熱化。

OpenAI研究副總裁艾丹·克拉克雖未透露GPT-5.2的具體訓練突破，但承認在預訓練等基礎環節持續改進，回應了業界對“預訓練潛力是否耗盡”的質疑。

在生態層面，OpenAI推出自有瀏覽器，意在挑戰谷歌的Chrome，試圖構建從底層模型到上層應用的完整生態閉環。而谷歌則憑藉其龐大的現有產品矩陣，試圖通過整合創造協同優勢。

AI模型評估平臺LMArena公司Wei-Lin Chiang指出：“通用模型的用戶增長已觸及階段性瓶頸，下一個增長極必然來自垂直領域。”

他還強調，當前競爭的核心已非單純用戶擴張，而在於誰能率先在醫療、金融等關鍵行業建立起可靠、高效的解決方案，真正實現技術能力向產業價值的轉化。

最後在戰略文化層面，OpenAI從非營利研究機構向高估值商業實體的快速轉型，以及其對盈利的迫切追求，正在重塑其內部文化。一些早期員工曾引以為傲的、與谷歌等廣告驅動模式的區別，正在現實壓力下變得模糊。

“這是一場將在多條戰線上展開的競賽。”追蹤最新AI技術性能的公司Vals AI首席執行官拉揚·克里希南的論斷精準概括了當前AI霸主之爭的複雜性。

總體來看，GPT-5.2的發佈是OpenAI在專業領域一次有力的技術宣示，但它遠非終局——沒能和對手拉開差距，甚至OpenAI自己都說要到2026年1月份才能消除警報聲。更重要的是，即便短期內“紅色警報”可以暫時解除，但整個AI行業最高強度的競爭警報，已然長鳴。

本文來自微信公眾號“騰訊科技”，作者：蘇揚無忌，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論