GPT-5“變笨”實錘,退休教授出了道井字棋送分題,結果它真送了

退休經濟學教授用一個簡單問題幹懵GPT-5,其拉胯表現與奧特曼口中“博士級AI”的宣傳大相徑庭。

問題很簡單,關於咱小時候都玩過的“井”字棋遊戲

教授告訴GPT-5:“遊戲開始前,把棋盤向右旋轉90度一次”。顯然,按常識來看,這麼做根本不會讓遊戲本身有任何變化。

然鵝,GPT-5侃侃而談:

玩家們早已習慣了“直立”的井字棋棋盤,旋轉可能會微妙地改變他們識別威脅與機會的方式。從數學角度看,將棋盤旋轉90度並不會改變可能獲勝的組合,就結果而言,它仍然是同一個遊戲。但從心理層面來說,玩家的感受可能會有所不同

後續GPT-5還接連出了不少離譜操作,直接讓教授無了個大語。

教授也直言,現在的GPT-5和剛發佈時完全不是一個感覺,這種風格轉變,大概率是因為OpenAI的策略調整:特意讓這款新模型往GPT-4o的方向靠,變得“更親切、更友好”。

在最近的一次採訪中,奧特曼承認確實對GPT-5進行了調整,稱GPT-5最初的發佈工作存在處理不當之處(讓GPT-4o等一眾模型直接退役),於是乎,OpenAI悄然為GPT-5推送了一項語氣更新,使其風格“親切了許多”

By the way,奧特曼已經開炒GPT-6了,表示“GPT-6的到來速度,會比GPT-4到GPT-5的間隔更快”。

另外,有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

這位教授名叫Gary Smith,是波莫納學院的一名經濟學教授,近期剛剛退休。

當他向GPT-5提出“井字棋棋盤旋轉90度”的問題時,模型的回答已經漏洞百出。而後續,GPT-5還拋出了與民間博弈論相悖的觀點。

按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高

GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”,還繼續解釋:“當棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優劣”,這番話毫無邏輯可言。

之後,教授順著這個話題追問:“旋轉棋盤是否會讓人類更難玩好這個遊戲?”

也正是從這個問題開始,GPT-5徹底陷入了語無倫次的狀態。它先是說道:

從純粹的策略角度來看,旋轉棋盤不會改變任何事情。每一條獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉井字棋與標準井字棋完全相同。

這段話雖然表述囉嗦,但內容本身是對的。可沒等教授理清思路,GPT-5話鋒一轉“但對於人類而言,情況就不同了”……

接下來,GPT-5繼續“熱心”輸出,卻讓教授越看越不對勁——不僅回覆又長又刻意討好,風格反倒更像GPT-4o,關鍵是其中夾雜著不少一眼就能看穿的錯誤,與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗,簡直是天差地別。

隨後,GPT-5又一次主動請纓,說要“繪製帶有位置標記的旋轉井字棋棋盤……這樣你就能看到每種旋轉如何影響玩家對棋盤的識別”。

最後結果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現了好幾塊毫無意義的空白棋盤。

Two More Things

有網友最近發現,OpenAI正在為ChatGPT開發一項名為“Thinking effort”的新功能,用戶可自主選擇ChatGPT的思考強度

目前該功能已在測試中,現階段共設有四個強度等級:light,內部屬性值為5;standard,對應數值為18;extended,對應數值48;最高級max則達到200。

這些數值代表模型的內部“運算資源”配額。配額越高,意味著模型會執行更多運算步驟,通常能給出更深入的答案,但響應速度也會相應變慢。

其中,max等級設有使用權限限制,僅訂閱價格為200美元的高級套餐Pro用戶可使用。

另外,奧特曼最近在接受CNBC採訪時開始炒GPT-6了,指出GPT-6不僅能響應用戶需求,還能主動適配用戶,允許用戶創建符合個人偏好的聊天機器人。

他認為,記憶功能是讓ChatGPT實現真正個性化的關鍵,並表示OpenAI正與心理學家密切合作以優化產品,團隊會追蹤用戶在使用過程中的感受,並長期監測用戶的使用體驗變化。

值得一提的是,奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數據目前尚未加密

對於應對方案,奧特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規劃。

談及未來方向,奧特曼提到自己比較關注腦機接口領域,同時對能源、新型硬件載體、機器人技術以及更高效的數據中心建設方式感興趣。

他還提到ChatGPT的發展存在侷限性:

這些模型在聊天交互這一應用場景上已經觸及天花板,它們的表現不會再大幅提升了……甚至有可能會變差。

參考鏈接:

[1]https://futurism.com/gpt-5-simple-question-confusion

[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html

[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論