ChatGPT負責人深度覆盤,爆4o復活內幕,過快下線是失誤,將迭代模型人格

GPT-5上線引發全網吐槽。8月14日,ChatGPT負責人Nick Turley深度覆盤了GPT-5發佈「風波」,並詳細總結了此次產品發佈中的失誤:比如過快下線GPT-4o、低估用戶會對模型的情感依戀、沒有讓用戶建立起「可預期性」等。Nick也分享了OpenAI的產品設計哲學,要堅持「真正對用戶有幫助」的原則。

「還我GPT-4o!」

GPT-5發佈後不到一週,在用戶強大的反對聲浪中,OpenAI不得不火速宣佈GPT-4o等前代模型迴歸。

至此,大家才意識到:用戶對4o等上一代模型,已經產生了深深的「依戀感」。

下線4o,已經不再是產品升級那麼簡單了,更像是忽然從用戶身邊帶走了一位熟人或夥伴。

尤其是對於深度用戶來說,這一點更為明顯。他們很多都是4o等前代模型的忠實擁躉,反彈情緒也更為強烈。

這一點令Altman,以及一直領導ChatGPT開發的Nick Turle都始料未及。

於是,便有了GPT-4o的火速回歸。

事實上,GPT-5的發佈會,給了OpenAI一個很好的反思產品的機會。

一週之後,Nick Turley在《The Verge》編輯Alex Heath的採訪中,深度覆盤了GPT-5發佈後面臨的用戶差評風波,以及他的一些思考。

對談中,Nick詳細總結了GPT-5發佈的一些失誤,比如:

過快下線GPT-4o、低估用戶會對模型的情感依戀、用一個模型適用所有用戶、沒有讓用戶建立起「可預期性」等。

Nick表示,OpenAI已經認識到持續迭代模型人格的重要性,並提到通過一個Model Behavior的團隊來推動這項工作。

同時,Nick也分享了OpenAI的產品設計哲學,是幫用戶解決長期問題、達成長期目標,而不是讓用戶儘可能留在產品裡。

「真正對用戶有幫助」,才是其設計產品的核心原則。

忽視用戶情感

讓GPT-5發佈後迎意外暴擊

忽視用戶的「依戀感」,讓GPT-5在發佈不到一週後,便被網友錘爆了。

Nick的話說,「很多意外都是寫進常態的」。

但也沒辦法,ChatGPT現在有7億周活用戶:用戶太多,千人千面,眾口難調。

這搞得Nick著實頭大,幾天後他在接受《The Verge》採訪時,仍在「消化」這次發佈會所帶來的影響。

他先是總結了GPT-5發佈的兩點失誤:

Nick:第一,GPT-4o下線走得太快了,至少在過渡期沒有繼續提供GPT-4o;第二,低估了用戶會對一個模型有如此強的情感依戀。真正的挑戰,不在於產品本身的升級,而是人們對模型「人格」的強烈感受。

這兩點失誤,讓Nick認為應當更認真地思考,如何在如此龐大的用戶基礎上進行產品升級和管理。

Nick表示,OpenAI已快速修正了這兩點錯誤。

一是將原有模型重新提供給ChatGPT付費用戶;二是對GPT-5的個性進行更新,上線了「選擇你自己的性格」的能力。

8月13日,Altman發佈了ChatGPT的更新信息,已經將4o恢復為所有付費用戶的默認模型,他們可以在網頁設置中切換o3、4.1、GPT-5 Thinking mini等其他模型。

Altman稱在過去幾天學到的一點,是真正認識到:要打造一個能夠根據用戶需求定製更多模型個性的世界——解決方案,就是要讓更多用戶能夠自由定製ChatGPT的風格。

Nick提到了一個原則,要努力去理解4o身上的一些原本沒有被足夠認識或重視的東西,比如模型人格對用戶的情感價值。在這方面,GPT-5也要向4o看齊,變得更溫暖和友好一些。

實際上,Sam Altman已經在GPT-5發佈後表示,在過去大約一年,OpenAI就一直在密切關注用戶對GPT-4o的「依戀感」,但並沒有太主流的關注。

這次發佈會風波,引發了OpenAI對ChatGPT產品「模型人格」的重視,這也是一個很好的優化契機。

放棄模型選擇

用一個模型適用所有用戶

放棄模型選擇,試圖用一個模型搞定所有用戶,是OpenAI在GPT-5發佈上的另一個失誤。

這導致了OpenAI在發佈GPT-5時,沒有做分階段發佈。

Alex:這個決定背後的動機是什麼?是成本因素嗎?

Nick:這絕對不是成本問題,而是為了追求簡單,這也是ChatGPT做產品一貫的核心原則。

在Nick看來,讓用戶自己去搞清楚「用哪個模型回答哪個問題」,認知負擔非常重。

而且在用戶調查中,Nick也反覆從用戶那裡聽到:他們希望得到的是一個「產品」,不是一堆「模型」。如果OpenAI能根據問題,為他們做出合適的選擇,他們會很喜歡。

Nick一直認為,大多數用戶需要的是像macOS這樣的產品:

既能面向大部人做到簡單易用;同時,對於深度用戶,他們也可以進設置、打開終端、把各種開關和參數都調起來。

同樣,Nick也希望將ChatGPT做成macOS式的產品:

Nick:對於普通用戶簡單易用,重度用戶也能按自己喜好配置一切——包括選擇自己最喜歡的模型。

因此,面對重度用戶,ChatGPT一直是堅持要保留所有舊模型的。

但這次的失誤之處在於:他們在7億用戶基礎之上,對重度用戶的分佈產生了誤判,低估了在其他一些套餐中也存在很多重度用戶——正是這些重度用戶對舊模型的「依戀感」,讓他們在網上掀起了反對聲浪。

沒有讓用戶建立起「可預期性」

凡是成功的產品,都有一個成功的「預期管理」。

符合或者超越用戶預期,必會贏得用戶追捧;違背或忽視用戶預期,勢必令用戶唾棄。

GPT-4o的過早下線,就是踩到了違背「用戶預期」的紅線。

隨著GPT-5,以及未來GPT-6等一系列新模型的發佈,舊模型何時「退休」也被提上日程。

Alex:OpenAI對此是否有已經有了明確安排?

Nick表示,這點十分必要,而且OpenAI也在著手做這件事。但必須堅持一個重要原則:給用戶一定的「可預期性」,尤其是在目前用戶基數的前提下,這樣做尤其重要。

Nick:關於用戶的「可預期性」,在企業版裡OpenAI已經這麼做了。目前的做法,更像是將這一原則進一步拓展。

這也是此次發佈會,OpenAI獲得的一個非常明確的經驗教訓。

談到4o的「退休時間」,Nick表示,目前並沒有一個具體的時間表。

Nick:我們想先真正搞清楚4o擅長的地方。如果沒有非要讓它下線的重大理由,我很樂意把它保留下來。

為了保持用戶的「可預期性」,Nick稱,未來4o真的要下線,一定會提前溝通。

所以,具體怎麼做,取決於我們學到了什麼。

Nick:我覺得這件事需要多去傾聽,這也是做 AI 非常獨特的一點:你在發佈之後會學到海量信息。基於這些,我們會拿出正確的方案。

模型人格與「優化哲學」

與其猜測4o何時下線,更讓Nick感興趣的問題是:

到底大家是喜歡4o本身,還是喜歡4o身上的某些具體特質?

比如,假設用戶喜歡它「人格更有溫度」,OpenAI也會把這個特質帶到GPT-5上。

Nick稱,OpenAI已經認識到持續迭代模型人格的重要性,並通過一個叫「Model Behavior」的團隊來推動這項工作。

此外,還會通過Model Spec(模型行為規範文檔),來幫助開發者和研究人員理解和審視模型行為,明確某些行為是設計上的有意為之,還是潛在的bug。

Nick:在未來幾周甚至幾個月內,還將持續迭代GPT-5的「感覺」和「行為」。這次GPT-5的發佈,也為繼續做這件事提供了一個好時機。

Alex Heath提到了這次4o下線後,用戶在Reddit上的驚人反應:

「有人說,我一夜之間失去了朋友。這是我唯一的朋友;感覺像有人去世了;我不敢跟GPT-5說話,因為感覺像是在「出軌」;我感覺丟了那個很有同理心的同事……」

Alex:用戶的反應為OpenAI帶來了什麼影響?為什麼之前沒有充分意識到,大家會有這麼強烈的情感依戀?

Nick回答說,其實OpenAI內部已經關注這類現象有一段時間了。與此同時,他們也一直在擔心:出現一個人們過度依賴AI的世界。

但讓Nick沒想到的是,人們會對某個「特定模型」產生這麼強的感情——而不是對整個產品。

Nick:實際上,GPT-5已經解決了很多大家對4o的建設性反饋,甚至在整體氛圍上也做了改進。但很多網友對此並不認賬。

Reddit上的評論,讓Nick覺得很有意思,它們顯示出用戶群體的極度「分化」:

Nick:有人特別愛4o,也有人強烈認為GPT-5更好,大家對自己選擇的「熱情程度」非常驚人。

用戶的反饋,對Nick也有點「重新校準」的意味。

Nick提到,他在一兩週前,曾寫過一篇博客,在裡面花了不少篇幅講ChatGPT的「優化哲學」。

他非常想強調的一點是:

Nick:我們的目標,不是讓用戶儘可能留在產品裡;相反,而是要幫用戶解決長期問題、達成長期目標。這在很多時候其實意味著「在產品裡花更少時間」。

所以,當Nick看到人們把GPT視作自己唯一而且最好的朋友時,這並不是他想在ChatGPT裡主動營造的東西。

相反,Nick將這種「過度停留」,視作一種副作用。

比如就在8月16日,OpenAI宣佈會讓GPT-5由以前的過於正式,變為更加溫暖和友好時,也有網友反對讓GPT-5過度人格化。

如何衡量產品對用戶的價值,這是一個值得認真對待和深入研究的問題,OpenAI也在這個問題上不斷探索。

如何讓7億用戶

可以毫不含糊地說YES

Alex Heath問了一個有關產品設計的靈魂問題:

Alex:如何平衡「產品目標」與「用戶實際使用方式」之間的張力?

Nick說,當你在7億用戶的規模上運營,就不得不面對一個現實:你可以有正確而純粹的目標,你也可以盡最大努力按照這些目標來構建產品。

在如何選擇上,Nick提到了一個重要原則——「真正對用戶有幫助」。

甚至,有時要說出用戶可能不愛聽的話。

基於這一原則,OpenAI也對產品做了一系列調整:

比如,OpenAI通過與多個國家和大量心理健康專業人士交流,理解當人們過度使用產品,或者在不太健康的狀態下使用產品時,該如何處理。

並以此修改模型行為,為模型上線了「過度使用提醒」,當用戶以極端頻率使用ChatGPT時,它會輕輕提醒你。

Nick提到了特別重要的一點,也回應了公眾對OpenAI是否會探索廣告模式的猜測:

Nick:我們其實並沒有任何「讓你在產品裡花更多時間」的特別動機;我們的商業模式非常簡單:基礎產品免費,如果你喜歡更多功能,就訂閱。沒有第二層目的。

在這一原則下,Nick也提到了檢驗好產品的標準,這也是他們經常給自己設的「思想實驗」:

Nick:如果你認識的人正經歷困難,或許剛失戀,或許對人生感到迷茫——你會不會真的、毫不猶豫、很有信心地推薦他/她使用ChatGPT?

Nick表示,對於OpenAI來說,這就是標準。他們會一直做到自己也有這種底氣為止,在此之前他們不會停下來。

當然,Nick也坦言,有時這也是一道艱難的選擇題。

比如,當有人向你尋求人生建議,或者陷入困境時,你完全可以很輕鬆地把這些用例直接關掉,對用戶說:「抱歉,這個我幫不了你。」

這樣做的確是條「容易的出路」,但Nick和OpenAI想要選擇的,顯然是那條「難而正確的」道路,就是為那些沒有資源、沒人可聊的人,提供一個好的產品,做到讓用戶「可以毫不含糊地說 YES」的程度。

GPT-5發佈

傷害ChatGPT了嗎

Alex:GPT-5對ChatGPT的使用有沒有傷害?你們內部統計的總體數字是在上漲嗎?最重度用戶的使用是在下降嗎?

面對Alex Heath的提問,Nick對GPT-5的表現似乎很滿意:

Nick:使用和增長看起來都很不錯,和我們的直覺也高度一致;我們在第2天看到API的調用量大幅增長——也就是開發者在用GPT-5搭建東西;在ChatGPT裡,我們也看到了非常積極的增長。

用戶分層不同,也會影響到對產品的評價,這也是為什麼Nick提到,在為這麼多不同的用戶構建產品時,你會有點困惑:

Nick:一方面,有一小撮重度用戶,我認為他們對我們如何推出GPT-5的反饋非常有道理;另一方面,還有大批更典型的普通用戶,對他們來說,這可能是第一次真正看到、接觸「推理模型」這一概念,以及它能帶來的火花。這也會體現在我們的數據裡。

正如Reddit上兩級分化的用戶評論,GPT-5發佈時間還很短,Nick並不太想下結論,但所有指標都是偏正面的。

Nick認為,除了看數據之外,還要「待在重度用戶所在的地方」,因為數據可能不足以反映他們的情緒。

Alex Heath似乎不依不饒,問:

Alex:既然整體指標不錯,為什麼還要把4o帶回來?我推測託管就模型也會有成本。如果指標沒受傷害,為什麼要這麼做?

Nick回答道,打造偉大產品的方式是「同時服務兩端」:

Nick:一端是普通用戶,比如我們的家人,他們可能離AI還比較遠;另一端是極端的重度用戶。二者之間「詭異的中間地帶」通常不是好位置。

這也是Nick以macOS類比ChatGPT的原因:他會參考這樣的產品是如何處理這一問題的。

Nick並不諱言,服務舊模型是有成本的。但他更希望能從長遠投入,打造一個出色的產品。過於盯著短期指標,通常是把一個產品帶向下坡路的方式。

Alex Heath提到了「模型選擇」的迴歸,雖然他能感受到「切換模型」所造成的認知負擔,但仍為此高興。

對此,Nick回應說,會為重度用戶,也就是那些可以理解模型,也願意處理選擇模型這層複雜性的用戶提供「模型選擇」。

但對於普通用戶,則不必為「切換什麼模式」費心,他們可以直接問模型問題,或者讓它幫忙做事。

「我們會為90%的人保持簡潔;然後為那群聲音更大的重度用戶提供他們想要的完整列表。這是一個兼顧兩邊的平衡方式。」Nick說。

這也是應對網友對GPT-5口碑兩極分化的好方法。

參考資料:

https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview

本文來自微信公眾號“新智元”,作者:新智元,編輯:元宇,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論