ChatGPT負責人深度覆盤，爆4o復活內幕，過快下線是失誤，將迭代模型人格

GPT-5上線引發全網吐槽。8月14日，ChatGPT負責人Nick Turley深度覆盤了GPT-5發佈「風波」，並詳細總結了此次產品發佈中的失誤：比如過快下線GPT-4o、低估用戶會對模型的情感依戀、沒有讓用戶建立起「可預期性」等。Nick也分享了OpenAI的產品設計哲學，要堅持「真正對用戶有幫助」的原則。

「還我GPT-4o！」

GPT-5發佈後不到一週，在用戶強大的反對聲浪中，OpenAI不得不火速宣佈GPT-4o等前代模型迴歸。

至此，大家才意識到：用戶對4o等上一代模型，已經產生了深深的「依戀感」。

下線4o，已經不再是產品升級那麼簡單了，更像是忽然從用戶身邊帶走了一位熟人或夥伴。

尤其是對於深度用戶來說，這一點更為明顯。他們很多都是4o等前代模型的忠實擁躉，反彈情緒也更為強烈。

這一點令Altman，以及一直領導ChatGPT開發的Nick Turle都始料未及。

於是，便有了GPT-4o的火速回歸。

事實上，GPT-5的發佈會，給了OpenAI一個很好的反思產品的機會。

一週之後，Nick Turley在《The Verge》編輯Alex Heath的採訪中，深度覆盤了GPT-5發佈後面臨的用戶差評風波，以及他的一些思考。

對談中，Nick詳細總結了GPT-5發佈的一些失誤，比如：

過快下線GPT-4o、低估用戶會對模型的情感依戀、用一個模型適用所有用戶、沒有讓用戶建立起「可預期性」等。

Nick表示，OpenAI已經認識到持續迭代模型人格的重要性，並提到通過一個Model Behavior的團隊來推動這項工作。

同時，Nick也分享了OpenAI的產品設計哲學，是幫用戶解決長期問題、達成長期目標，而不是讓用戶儘可能留在產品裡。

「真正對用戶有幫助」，才是其設計產品的核心原則。

忽視用戶情感

讓GPT-5發佈後迎意外暴擊

忽視用戶的「依戀感」，讓GPT-5在發佈不到一週後，便被網友錘爆了。

用Nick的話說，「很多意外都是寫進常態的」。

但也沒辦法，ChatGPT現在有7億周活用戶：用戶太多，千人千面，眾口難調。

這搞得Nick著實頭大，幾天後他在接受《The Verge》採訪時，仍在「消化」這次發佈會所帶來的影響。

他先是總結了GPT-5發佈的兩點失誤：

Nick：第一，GPT-4o下線走得太快了，至少在過渡期沒有繼續提供GPT-4o；第二，低估了用戶會對一個模型有如此強的情感依戀。真正的挑戰，不在於產品本身的升級，而是人們對模型「人格」的強烈感受。

這兩點失誤，讓Nick認為應當更認真地思考，如何在如此龐大的用戶基礎上進行產品升級和管理。

Nick表示，OpenAI已快速修正了這兩點錯誤。

一是將原有模型重新提供給ChatGPT付費用戶；二是對GPT-5的個性進行更新，上線了「選擇你自己的性格」的能力。

8月13日，Altman發佈了ChatGPT的更新信息，已經將4o恢復為所有付費用戶的默認模型，他們可以在網頁設置中切換o3、4.1、GPT-5 Thinking mini等其他模型。

Altman稱在過去幾天學到的一點，是真正認識到：要打造一個能夠根據用戶需求定製更多模型個性的世界——解決方案，就是要讓更多用戶能夠自由定製ChatGPT的風格。

Nick提到了一個原則，要努力去理解4o身上的一些原本沒有被足夠認識或重視的東西，比如模型人格對用戶的情感價值。在這方面，GPT-5也要向4o看齊，變得更溫暖和友好一些。

實際上，Sam Altman已經在GPT-5發佈後表示，在過去大約一年，OpenAI就一直在密切關注用戶對GPT-4o的「依戀感」，但並沒有太主流的關注。

這次發佈會風波，引發了OpenAI對ChatGPT產品「模型人格」的重視，這也是一個很好的優化契機。

放棄模型選擇

用一個模型適用所有用戶

放棄模型選擇，試圖用一個模型搞定所有用戶，是OpenAI在GPT-5發佈上的另一個失誤。

這導致了OpenAI在發佈GPT-5時，沒有做分階段發佈。

Alex：這個決定背後的動機是什麼？是成本因素嗎？
Nick：這絕對不是成本問題，而是為了追求簡單，這也是ChatGPT做產品一貫的核心原則。

在Nick看來，讓用戶自己去搞清楚「用哪個模型回答哪個問題」，認知負擔非常重。

而且在用戶調查中，Nick也反覆從用戶那裡聽到：他們希望得到的是一個「產品」，不是一堆「模型」。如果OpenAI能根據問題，為他們做出合適的選擇，他們會很喜歡。

Nick一直認為，大多數用戶需要的是像macOS這樣的產品：

既能面向大部人做到簡單易用；同時，對於深度用戶，他們也可以進設置、打開終端、把各種開關和參數都調起來。

同樣，Nick也希望將ChatGPT做成macOS式的產品：

Nick：對於普通用戶簡單易用，重度用戶也能按自己喜好配置一切——包括選擇自己最喜歡的模型。

因此，面對重度用戶，ChatGPT一直是堅持要保留所有舊模型的。

但這次的失誤之處在於：他們在7億用戶基礎之上，對重度用戶的分佈產生了誤判，低估了在其他一些套餐中也存在很多重度用戶——正是這些重度用戶對舊模型的「依戀感」，讓他們在網上掀起了反對聲浪。

沒有讓用戶建立起「可預期性」

凡是成功的產品，都有一個成功的「預期管理」。

符合或者超越用戶預期，必會贏得用戶追捧；違背或忽視用戶預期，勢必令用戶唾棄。

GPT-4o的過早下線，就是踩到了違背「用戶預期」的紅線。

隨著GPT-5，以及未來GPT-6等一系列新模型的發佈，舊模型何時「退休」也被提上日程。

Alex：OpenAI對此是否有已經有了明確安排？

Nick表示，這點十分必要，而且OpenAI也在著手做這件事。但必須堅持一個重要原則：給用戶一定的「可預期性」，尤其是在目前用戶基數的前提下，這樣做尤其重要。

Nick：關於用戶的「可預期性」，在企業版裡OpenAI已經這麼做了。目前的做法，更像是將這一原則進一步拓展。

這也是此次發佈會，OpenAI獲得的一個非常明確的經驗教訓。

談到4o的「退休時間」，Nick表示，目前並沒有一個具體的時間表。

Nick:我們想先真正搞清楚4o擅長的地方。如果沒有非要讓它下線的重大理由，我很樂意把它保留下來。

為了保持用戶的「可預期性」，Nick稱，未來4o真的要下線，一定會提前溝通。

所以，具體怎麼做，取決於我們學到了什麼。

Nick：我覺得這件事需要多去傾聽，這也是做 AI 非常獨特的一點：你在發佈之後會學到海量信息。基於這些，我們會拿出正確的方案。

模型人格與「優化哲學」

與其猜測4o何時下線，更讓Nick感興趣的問題是：

到底大家是喜歡4o本身，還是喜歡4o身上的某些具體特質？

比如，假設用戶喜歡它「人格更有溫度」，OpenAI也會把這個特質帶到GPT-5上。

Nick稱，OpenAI已經認識到持續迭代模型人格的重要性，並通過一個叫「Model Behavior」的團隊來推動這項工作。

此外，還會通過Model Spec（模型行為規範文檔），來幫助開發者和研究人員理解和審視模型行為，明確某些行為是設計上的有意為之，還是潛在的bug。

Nick：在未來幾周甚至幾個月內，還將持續迭代GPT-5的「感覺」和「行為」。這次GPT-5的發佈，也為繼續做這件事提供了一個好時機。

Alex Heath提到了這次4o下線後，用戶在Reddit上的驚人反應：

「有人說，我一夜之間失去了朋友。這是我唯一的朋友；感覺像有人去世了；我不敢跟GPT-5說話，因為感覺像是在「出軌」；我感覺丟了那個很有同理心的同事……」

Alex：用戶的反應為OpenAI帶來了什麼影響？為什麼之前沒有充分意識到，大家會有這麼強烈的情感依戀？

Nick回答說，其實OpenAI內部已經關注這類現象有一段時間了。與此同時，他們也一直在擔心：出現一個人們過度依賴AI的世界。

但讓Nick沒想到的是，人們會對某個「特定模型」產生這麼強的感情——而不是對整個產品。

Nick：實際上，GPT-5已經解決了很多大家對4o的建設性反饋，甚至在整體氛圍上也做了改進。但很多網友對此並不認賬。

Reddit上的評論，讓Nick覺得很有意思，它們顯示出用戶群體的極度「分化」：

Nick：有人特別愛4o，也有人強烈認為GPT-5更好，大家對自己選擇的「熱情程度」非常驚人。

用戶的反饋，對Nick也有點「重新校準」的意味。

Nick提到，他在一兩週前，曾寫過一篇博客，在裡面花了不少篇幅講ChatGPT的「優化哲學」。

他非常想強調的一點是：

Nick：我們的目標，不是讓用戶儘可能留在產品裡；相反，而是要幫用戶解決長期問題、達成長期目標。這在很多時候其實意味著「在產品裡花更少時間」。

所以，當Nick看到人們把GPT視作自己唯一而且最好的朋友時，這並不是他想在ChatGPT裡主動營造的東西。

相反，Nick將這種「過度停留」，視作一種副作用。

比如就在8月16日，OpenAI宣佈會讓GPT-5由以前的過於正式，變為更加溫暖和友好時，也有網友反對讓GPT-5過度人格化。

如何衡量產品對用戶的價值，這是一個值得認真對待和深入研究的問題，OpenAI也在這個問題上不斷探索。

如何讓7億用戶

可以毫不含糊地說YES

Alex Heath問了一個有關產品設計的靈魂問題：

Alex：如何平衡「產品目標」與「用戶實際使用方式」之間的張力？

Nick說，當你在7億用戶的規模上運營，就不得不面對一個現實：你可以有正確而純粹的目標，你也可以盡最大努力按照這些目標來構建產品。

在如何選擇上，Nick提到了一個重要原則——「真正對用戶有幫助」。

甚至，有時要說出用戶可能不愛聽的話。

基於這一原則，OpenAI也對產品做了一系列調整：

比如，OpenAI通過與多個國家和大量心理健康專業人士交流，理解當人們過度使用產品，或者在不太健康的狀態下使用產品時，該如何處理。

並以此修改模型行為，為模型上線了「過度使用提醒」，當用戶以極端頻率使用ChatGPT時，它會輕輕提醒你。

Nick提到了特別重要的一點，也回應了公眾對OpenAI是否會探索廣告模式的猜測：

Nick：我們其實並沒有任何「讓你在產品裡花更多時間」的特別動機；我們的商業模式非常簡單：基礎產品免費，如果你喜歡更多功能，就訂閱。沒有第二層目的。

在這一原則下，Nick也提到了檢驗好產品的標準，這也是他們經常給自己設的「思想實驗」：

Nick：如果你認識的人正經歷困難，或許剛失戀，或許對人生感到迷茫——你會不會真的、毫不猶豫、很有信心地推薦他/她使用ChatGPT？

Nick表示，對於OpenAI來說，這就是標準。他們會一直做到自己也有這種底氣為止，在此之前他們不會停下來。

當然，Nick也坦言，有時這也是一道艱難的選擇題。

比如，當有人向你尋求人生建議，或者陷入困境時，你完全可以很輕鬆地把這些用例直接關掉，對用戶說：「抱歉，這個我幫不了你。」

這樣做的確是條「容易的出路」，但Nick和OpenAI想要選擇的，顯然是那條「難而正確的」道路，就是為那些沒有資源、沒人可聊的人，提供一個好的產品，做到讓用戶「可以毫不含糊地說 YES」的程度。

GPT-5發佈

傷害ChatGPT了嗎

Alex：GPT-5對ChatGPT的使用有沒有傷害？你們內部統計的總體數字是在上漲嗎？最重度用戶的使用是在下降嗎？

面對Alex Heath的提問，Nick對GPT-5的表現似乎很滿意：

Nick：使用和增長看起來都很不錯，和我們的直覺也高度一致；我們在第2天看到API的調用量大幅增長——也就是開發者在用GPT-5搭建東西；在ChatGPT裡，我們也看到了非常積極的增長。

用戶分層不同，也會影響到對產品的評價，這也是為什麼Nick提到，在為這麼多不同的用戶構建產品時，你會有點困惑：

Nick：一方面，有一小撮重度用戶，我認為他們對我們如何推出GPT-5的反饋非常有道理；另一方面，還有大批更典型的普通用戶，對他們來說，這可能是第一次真正看到、接觸「推理模型」這一概念，以及它能帶來的火花。這也會體現在我們的數據裡。

正如Reddit上兩級分化的用戶評論，GPT-5發佈時間還很短，Nick並不太想下結論，但所有指標都是偏正面的。

Nick認為，除了看數據之外，還要「待在重度用戶所在的地方」，因為數據可能不足以反映他們的情緒。

Alex Heath似乎不依不饒，問：

Alex：既然整體指標不錯，為什麼還要把4o帶回來？我推測託管就模型也會有成本。如果指標沒受傷害，為什麼要這麼做？

Nick回答道，打造偉大產品的方式是「同時服務兩端」：

Nick：一端是普通用戶，比如我們的家人，他們可能離AI還比較遠；另一端是極端的重度用戶。二者之間「詭異的中間地帶」通常不是好位置。

這也是Nick以macOS類比ChatGPT的原因：他會參考這樣的產品是如何處理這一問題的。

Nick並不諱言，服務舊模型是有成本的。但他更希望能從長遠投入，打造一個出色的產品。過於盯著短期指標，通常是把一個產品帶向下坡路的方式。

Alex Heath提到了「模型選擇」的迴歸，雖然他能感受到「切換模型」所造成的認知負擔，但仍為此高興。

對此，Nick回應說，會為重度用戶，也就是那些可以理解模型，也願意處理選擇模型這層複雜性的用戶提供「模型選擇」。

但對於普通用戶，則不必為「切換什麼模式」費心，他們可以直接問模型問題，或者讓它幫忙做事。

「我們會為90%的人保持簡潔；然後為那群聲音更大的重度用戶提供他們想要的完整列表。這是一個兼顧兩邊的平衡方式。」Nick說。

這也是應對網友對GPT-5口碑兩極分化的好方法。

參考資料：

https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview

本文來自微信公眾號“新智元”，作者：新智元，編輯：元宇，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論