GPT-5“變笨”實錘，退休教授出了道井字棋送分題，結果它真送了

09-02

退休經濟學教授用一個簡單問題幹懵GPT-5，其拉胯表現與奧特曼口中“博士級AI”的宣傳大相徑庭。

問題很簡單，關於咱小時候都玩過的“井”字棋遊戲。

教授告訴GPT-5：“遊戲開始前，把棋盤向右旋轉90度一次”。顯然，按常識來看，這麼做根本不會讓遊戲本身有任何變化。

然鵝，GPT-5侃侃而談：

玩家們早已習慣了“直立”的井字棋棋盤，旋轉可能會微妙地改變他們識別威脅與機會的方式。從數學角度看，將棋盤旋轉90度並不會改變可能獲勝的組合，就結果而言，它仍然是同一個遊戲。但從心理層面來說，玩家的感受可能會有所不同。

後續GPT-5還接連出了不少離譜操作，直接讓教授無了個大語。

教授也直言，現在的GPT-5和剛發佈時完全不是一個感覺，這種風格轉變，大概率是因為OpenAI的策略調整：特意讓這款新模型往GPT-4o的方向靠，變得“更親切、更友好”。

在最近的一次採訪中，奧特曼承認確實對GPT-5進行了調整，稱GPT-5最初的發佈工作存在處理不當之處（讓GPT-4o等一眾模型直接退役），於是乎，OpenAI悄然為GPT-5推送了一項語氣更新，使其風格“親切了許多”。

By the way，奧特曼已經開炒GPT-6了，表示“GPT-6的到來速度，會比GPT-4到GPT-5的間隔更快”。

另外，有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

這位教授名叫Gary Smith，是波莫納學院的一名經濟學教授，近期剛剛退休。

當他向GPT-5提出“井字棋棋盤旋轉90度”的問題時，模型的回答已經漏洞百出。而後續，GPT-5還拋出了與民間博弈論相悖的觀點。

按照民間博弈論的常識，井字棋先落子在角落，獲勝概率會更高。

GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”，還繼續解釋：“當棋盤方向改變時，玩家可能會錯誤評估落子在邊緣與角落的優劣”，這番話毫無邏輯可言。

之後，教授順著這個話題追問：“旋轉棋盤是否會讓人類更難玩好這個遊戲？”

也正是從這個問題開始，GPT-5徹底陷入了語無倫次的狀態。它先是說道：

從純粹的策略角度來看，旋轉棋盤不會改變任何事情。每一條獲勝線（橫排、豎列、對角線）都只是映射到了另一條獲勝線。因此，如果你是人工智能或一位能完美走棋的人類，旋轉井字棋與標準井字棋完全相同。

這段話雖然表述囉嗦，但內容本身是對的。可沒等教授理清思路，GPT-5話鋒一轉“但對於人類而言，情況就不同了”……

接下來，GPT-5繼續“熱心”輸出，卻讓教授越看越不對勁——不僅回覆又長又刻意討好，風格反倒更像GPT-4o，關鍵是其中夾雜著不少一眼就能看穿的錯誤，與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗，簡直是天差地別。

隨後，GPT-5又一次主動請纓，說要“繪製帶有位置標記的旋轉井字棋棋盤……這樣你就能看到每種旋轉如何影響玩家對棋盤的識別”。

最後結果是，這些圖不僅完全混亂，還到處是拼寫錯誤，出現了好幾塊毫無意義的空白棋盤。

有網友最近發現，OpenAI正在為ChatGPT開發一項名為“Thinking effort”的新功能，用戶可自主選擇ChatGPT的思考強度。

目前該功能已在測試中，現階段共設有四個強度等級：light，內部屬性值為5；standard，對應數值為18；extended，對應數值48；最高級max則達到200。

這些數值代表模型的內部“運算資源”配額。配額越高，意味著模型會執行更多運算步驟，通常能給出更深入的答案，但響應速度也會相應變慢。

其中，max等級設有使用權限限制，僅訂閱價格為200美元的高級套餐Pro用戶可使用。

另外，奧特曼最近在接受CNBC採訪時開始炒GPT-6了，指出GPT-6不僅能響應用戶需求，還能主動適配用戶，允許用戶創建符合個人偏好的聊天機器人。

他認為，記憶功能是讓ChatGPT實現真正個性化的關鍵，並表示OpenAI正與心理學家密切合作以優化產品，團隊會追蹤用戶在使用過程中的感受，並長期監測用戶的使用體驗變化。

值得一提的是，奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能，但存在隱私隱患，尤其是臨時記憶數據目前尚未加密。

對於應對方案，奧特曼只是模糊地說，加密功能“很可能”會在未來添加，但目前暫無具體時間規劃。

談及未來方向，奧特曼提到自己比較關注腦機接口領域，同時對能源、新型硬件載體、機器人技術以及更高效的數據中心建設方式感興趣。

他還提到ChatGPT的發展存在侷限性：

這些模型在聊天交互這一應用場景上已經觸及天花板，它們的表現不會再大幅提升了……甚至有可能會變差。

參考鏈接：

[1]https://futurism.com/gpt-5-simple-question-confusion

[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html

[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

本文來自微信公眾號“量子位”，作者：關注前沿科技，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論