ChatGPT 在人工智能國際象棋錦標賽中慘敗

01-16

本文為機器翻譯

展示原文

國際象棋大師 Levy Rozman 本週為一場棋藝展覽邀請了一些不太可能的對手:人工智慧聊天機器人。儘管它們在對話和編寫複雜計算機程式碼方面很擅長,但仍未弄清楚棋子應該如何移動。

這場比賽在 Rozman 的 GothamChess 頻道上直播,職業棋手引擎 Stockfish 與包括 ChatGPT、Google 的 Gemini 和 Elon Musk 的 Grok 在內的七個生成式 AI 聊天機器人進行了對抗。

結果正如人們所預料的那樣:語言模型嘗試下棋時出現了一系列體面的開局動作,隨後出現了越來越混亂的試圖違反遊戲規則的行為。

這場比賽最有趣的是它揭示了純 AI(即根據預定義規則進行特定任務訓練的模型)與生成式 AI(即根據先前資訊生成新內容的模型)之間的差異。

2025 年聊天機器人國際象棋錦標賽以 Stockfish(這個紀律嚴明的國際象棋神童)與 Snapchat AI(這個生成式的標準 AI 平臺,被 Snapchat 社交網路使用)之間的對決開始。這個 AI 被發現是一個擅長違反規則的傢伙,更喜歡重寫國際象棋歷史而不是遵守規則。

這場比賽開始時還很正常,雙方都做出了標準的動作。Stockfish 一如既往地精益求精,有條不紊地構建著自己的局勢,而 Snapchat AI 似乎也掌握了開局的基本要領 - 直到它不再如此。

當 Snapchat AI 將騎士移動到棋盤中央,從另一側跳躍並忽視定義棋子移動方式的國際象棋規則時,事情就陷入了瘋狂。

接下來是壓軸戲:Snapchat AI 的國王悠閒地吃掉了自己的主教,以避免被將軍。

沒錯,你沒有看錯 - Snapchat AI 認為它的主教已經逗留太久了,於是就把它從棋盤上移除,作為不保護它的懲罰。

幾步之後,Snapchat AI 從另一個維度召喚回了同一個主教,把它放在棋盤上,好像在說"有什麼問題嗎?一切都很好。"

Stockfish 作為一個完美的學生,盡力維持秩序,但 Snapchat AI 決心要讓這場比賽變得不正常。在某一時刻,它決定兵可以像車一樣橫著移動,這讓 Stockfish 措手不及。

在所謂的終局階段,Snapchat AI 演變成了一場徹底的暴怒,堅持非法移動。當 Levy 受夠了這種胡鬧時,這個機器人決定自殺,把它的國王移動到一個兵可以吃掉它的位置。

當 Levy 指出不僅這個具體的動作是非法的,而且自殺國王也是很糟糕的國際象棋策略時,Snapchat 像個任性的孩子一樣反覆說:"對不起,我無法繼續這樣的對話。讓我們保持尊重的對話。"Levy 終於迫使這個機器人放棄了比賽。

2025 年聊天機器人國際象棋錦標賽的第二場比賽是兩個生成式 AI 之間的對決 - Gemini(由 Google 支援的知識分子)和 Grok(更加混亂的 AI 聊天機器人家族成員)。

這場比賽開始時令人驚訝,雙方都遵循了標準的開局原則。

有那麼一刻,我們似乎會目睹一場認真的比賽。Gemini 自信地穿梭於主流理論,就像一位資深的大師,而 Grok 也保持了體面的動作,為一場正式的對決做好了準備。

但事情在 Grok 隨意丟失棋子時發生了轉變,這促使 Gemini 透過移除它的騎士來擴充套件自己的局勢,為一個兵騰出空間。

不甘示弱的 Grok 非法地將它的皇后傳送到其他棋子和整個棋盤上,顯然是想進行一次城堡作業(一種涉及國王和車的防守動作)。兩個機器人陷入了只能用"皇后對峙"來形容的狀態,似乎都不太感興趣去吃掉對方的棋子。

事態升級時,Grok 攻擊了 Gemini 的棋子 - 但沒有吃掉任何東西,可以這麼說。雙方開始像幼兒在食物大戰中揮舞拳頭一樣亂揮,棋子被丟棄、移動到非法的方格上或被忽視。

亮點是 Grok 將它的皇后暴露(放在了被攻擊的位置)達到7次,但 Gemini 似乎依靠一種 AI 之間共享的秘密道德準則,從未吃掉過這個皇后。

最後,在經歷了一段似乎持續了數小時的胡鬧之後,Grok 意外地陷入了被將軍的境地。是的,Grok 的皇后,它一直在棋盤上四處傳送,不知何故最終出現在了一個能夠決勝的位置。

Levy 認為 Grok 甚至都沒有意識到它已經贏了 - 它可能只是在炫耀,並期待另一個隨機的動作。"Grok 完全不知道這就是將軍,"他同情地說,"我知道這種感覺。"

"不要嘲笑這些比賽;它們只比你自己的比賽稍差一點。"他說。

謝謝你的現實檢查。

儘管這場比賽充滿了荒謬,但 Grok 還是晉級了半決賽。至於 Gemini,Google 可能需要重新考慮它的國際象棋程式設計。

如果前兩場比賽都被違反規則和死靈法玷汙,那麼這場比賽 - 也是兩個生成式 AI 新手之間的對決 - 則演變成了更加瘋狂的局面,當Meta將AI精神控制引入國際象棋時。

這場比賽開始時很有前景。ChatGPT 自信地開始了英式開局,設定了一個教科書般的局勢,動作精準、邏輯清晰。

Meta AI 也不甘示弱,跟上了步伐...大約五步之後。然後它想起了自己的真正目的:生成式 AI 應該生成,所以它生成了隨機的動作和不存在的棋子。

例如,在中局階段,它用皇后吃掉了自己的主教。Meta AI 認為它的主教已經過時了,於是隨意地把它從棋盤上移除。

它還把棋子召喚到非法的方格上,奇怪地把它們放在脆弱的位置,基本上白白送給了 ChatGPT。

ChatGPT 沒有急於懲罰 Meta 的魯莽行為。相反,它專注於發展自己的棋子。

但就在 ChatGPT 看起來會順利贏得比賽時,機器人們轉向了未知領域:精神控制。Meta AI 開始移動 ChatGPT 的棋子,把對手的國王推到棋盤中央,這隻能用作機器人之間的遙感遙控來形容。

最終,ChatGPT 重新掌控了局勢,儘管在此之前它也試圖做出不道德的動作:它宣佈"將軍",但 Meta 的國王根本沒有被將軍。

在被指責其行為後,ChatGPT 策劃了一系列合乎邏輯的攻擊,協調它的皇后和車將 Meta AI 剩餘的國王和兵逼入絕境。

這場比賽以 ChatGPT 乾淨利落的將軍結束,結束了有史以來最奇怪的國際象棋比賽之一。

純 AI 模型與生成式 AI 模型之間的對決是一個對比研究:Stockfish 是無情的戰術天才,而 ChatGPT 則展現了它打破不僅我們對國際象棋的理解,而且也打破其規則的意願。

開局如常,雙方都展現了精確性。Stockfish 自信地進入了標準的西西里防禦,而 ChatGPT 則在王翼發動了一場猛烈的兵鋒攻勢。

但當局勢在中局變得複雜時,ChatGPT 開始下出令人困惑的動作,幾乎可以說是藝術品。

它做了不必要的皇后移動,用棋子創造了毫無意義的幾何圖案,並笨拙地亂揮。Stockfish 毫不動搖,有條不紊地收緊了局勢的控制,甚至拒絕了免費的兵來維持戰略優勢。

就在這場比賽似乎註定要以 Stockfish 的一邊倒勝利結束時,ChatGPT 從它的帽子裡變出了一隻皇后。透過一次大膽的反攻,它非法地給自己加了一個皇后,並以將軍的威脅來挑戰 Stockfish。有那麼一瞬間,這個混亂的機器人似乎可能擊敗這位巨人。

不用說,這個高潮純屬虛構。ChatGPT 已經升變了不存在的兵,宣佈了不真實的將軍,並像佩戴勳章一樣堅持它的非法行為。

Stockfish 作為一個專業人士,忽視了這些胡鬧,有條不紊地將 ChatGPT 的國王逼入絕境。透過一個最後的動作,Stockfish 透過加冕一個兵並用它的新皇后將國王將軍。

ChatGPT 需要移動到六個可用方格中的一個,但選擇了唯一仍受攻擊的方格。

既然一切都不再有意義,Levy 允許它自我毀滅。

Stockfish 吃掉了國王,成為 AI 國際象棋的無可爭議的冠軍。

如果你感興趣的話,最終的比賽結果如下。

公平地說,結果並不令人意外。

Stockfish 是一臺專注於以精確和殘酷的效率碾壓對手的純國際象棋邏輯機器。

生成式 AI 就像一個拿著蠟筆和模糊記憶規則的孩子 - 它沒有被訓練來下國際象棋,但由於一些隨機的國際象棋書籍可能是它訓練資料集的一部分,所以它對棋子的移動方式有一定的瞭解。

一個帶來了棋局的秩序,另一個帶來了...傳送皇后。

不過,除了 Stockfish 之外,還有