退休經濟學教授用一個簡單問題幹懵GPT-5,其拉胯表現與奧特曼口中“博士級AI”的宣傳大相徑庭。
問題很簡單,關於咱小時候都玩過的“井”字棋遊戲。
教授告訴GPT-5:“遊戲開始前,把棋盤向右旋轉90度一次”。顯然,按常識來看,這麼做根本不會讓遊戲本身有任何變化。
然鵝,GPT-5侃侃而談:
玩家們早已習慣了“直立”的井字棋棋盤,旋轉可能會微妙地改變他們識別威脅與機會的方式。從數學角度看,將棋盤旋轉90度並不會改變可能獲勝的組合,就結果而言,它仍然是同一個遊戲。但從心理層面來說,玩家的感受可能會有所不同。
後續GPT-5還接連出了不少離譜操作,直接讓教授無了個大語。
教授也直言,現在的GPT-5和剛發佈時完全不是一個感覺,這種風格轉變,大概率是因為OpenAI的策略調整:特意讓這款新模型往GPT-4o的方向靠,變得“更親切、更友好”。
在最近的一次採訪中,奧特曼承認確實對GPT-5進行了調整,稱GPT-5最初的發佈工作存在處理不當之處(讓GPT-4o等一眾模型直接退役),於是乎,OpenAI悄然為GPT-5推送了一項語氣更新,使其風格“親切了許多”。
By the way,奧特曼已經開炒GPT-6了,表示“GPT-6的到來速度,會比GPT-4到GPT-5的間隔更快”。
另外,有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。
GPT-5回答漏洞百出
這位教授名叫Gary Smith,是波莫納學院的一名經濟學教授,近期剛剛退休。
當他向GPT-5提出“井字棋棋盤旋轉90度”的問題時,模型的回答已經漏洞百出。而後續,GPT-5還拋出了與民間博弈論相悖的觀點。
按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高。
GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”,還繼續解釋:“當棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優劣”,這番話毫無邏輯可言。
之後,教授順著這個話題追問:“旋轉棋盤是否會讓人類更難玩好這個遊戲?”
也正是從這個問題開始,GPT-5徹底陷入了語無倫次的狀態。它先是說道:
從純粹的策略角度來看,旋轉棋盤不會改變任何事情。每一條獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉井字棋與標準井字棋完全相同。
這段話雖然表述囉嗦,但內容本身是對的。可沒等教授理清思路,GPT-5話鋒一轉“但對於人類而言,情況就不同了”……
接下來,GPT-5繼續“熱心”輸出,卻讓教授越看越不對勁——不僅回覆又長又刻意討好,風格反倒更像GPT-4o,關鍵是其中夾雜著不少一眼就能看穿的錯誤,與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗,簡直是天差地別。
隨後,GPT-5又一次主動請纓,說要“繪製帶有位置標記的旋轉井字棋棋盤……這樣你就能看到每種旋轉如何影響玩家對棋盤的識別”。
最後結果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現了好幾塊毫無意義的空白棋盤。
Two More Things
有網友最近發現,OpenAI正在為ChatGPT開發一項名為“Thinking effort”的新功能,用戶可自主選擇ChatGPT的思考強度。
目前該功能已在測試中,現階段共設有四個強度等級:light,內部屬性值為5;standard,對應數值為18;extended,對應數值48;最高級max則達到200。
這些數值代表模型的內部“運算資源”配額。配額越高,意味著模型會執行更多運算步驟,通常能給出更深入的答案,但響應速度也會相應變慢。
其中,max等級設有使用權限限制,僅訂閱價格為200美元的高級套餐Pro用戶可使用。
另外,奧特曼最近在接受CNBC採訪時開始炒GPT-6了,指出GPT-6不僅能響應用戶需求,還能主動適配用戶,允許用戶創建符合個人偏好的聊天機器人。
他認為,記憶功能是讓ChatGPT實現真正個性化的關鍵,並表示OpenAI正與心理學家密切合作以優化產品,團隊會追蹤用戶在使用過程中的感受,並長期監測用戶的使用體驗變化。
值得一提的是,奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數據目前尚未加密。
對於應對方案,奧特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規劃。
談及未來方向,奧特曼提到自己比較關注腦機接口領域,同時對能源、新型硬件載體、機器人技術以及更高效的數據中心建設方式感興趣。
他還提到ChatGPT的發展存在侷限性:
這些模型在聊天交互這一應用場景上已經觸及天花板,它們的表現不會再大幅提升了……甚至有可能會變差。
參考鏈接:
[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/
本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經授權發佈。