谷歌與OpenAI同獲ICPC 2025金牌，GPT-5滿分奪冠，Gemini攻破人類隊伍都沒解出的難題

09-18

在過去幾十年裡，國際大學生程序設計競賽（ICPC）一直被視為計算機程序設計領域的“奧林匹克”。然而今年，賽場上的風頭卻被兩位“非人類”選手搶走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。

GPT-5 和 Gemini 2.5 Deep Think 作為參賽模型，受 ICPC 官方規則與組織監督，參與了與人類選手相同的解題環節。雖然它們並非與學生團隊直接同場競技，卻交出了驚豔答卷：

● GPT-5 拿下滿分，12 道題全解，相當於“金牌”水準。

● Gemini 2.5 Deep Think 在 677 分鐘內解出 12 題中的 10 題，也達到金牌級別。根據谷歌的說法，這樣的成績放在人類排名裡將是全球第二。

要知道，本屆 ICPC 的人類金牌隊伍來自聖彼得堡國立大學、東京大學、北京交通大學和清華大學。可即便是這些頂尖學府的強隊，也沒有任何一支做到全對（最好成績是 11/12）。換句話說，這是 AI 第一次在這類算法競賽中實現了“超車”。

ICPC：程序員的“奧林匹克”

ICPC 是全球最頂尖的大學生編程賽事，自 1970 年代起，這項賽事就匯聚了全球高校最頂尖的算法天才。今年，ICPC 總決賽共有來自 103 個國家、139 所高校的戰隊參賽，大賽規則看似簡單：

● 每支隊伍由三名大學生組成；

● 5 小時內解答 12 道算法題；

● 排名取決於解題數和用時。

但背後的難度遠超一般編程比賽。據悉，ICPC 的題目常涉及圖論、數論、動態規劃、組合優化、網絡流等前沿算法。既考察編碼速度，也考察數學功底與團隊合作。歷年來，能在 ICPC 拿到金牌的隊伍，幾乎都成為了全球科技公司的核心技術人才。

也正因為 ICPC 的權威與挑戰性，本屆 AI 的入局顯得尤為標誌性：這是把AI直接推上了最嚴苛的算法競技場。

GPT-5 給出完美答卷，Gemini 2.5 解出人類沒有答出的問題 C

根據 OpenAI 官方披露，GPT-5 參賽時並沒有針對 ICPC 做特別訓練，也沒有任何“外掛”工具。它像其他人類隊伍一樣：直接拿到同樣的 PDF 賽題、通過官方判題系統提交答案、在 5 小時內完成所有解答。

結果令人瞠目：有 11 道題都是一遍過，唯一的難題在第 9 次提交時才解出，最終達成 12/12 滿分——要知道，今年人類最強隊伍的成績是 11/12，而 GPT-5 直接拿下滿分，這在 ICPC 的歷史上極為罕見。

基於此，OpenAI 也在 X 平臺分享了 GPT-5 的成績：

“我們在 ICPC 的 AI 賽道正式參賽，同樣是 5 小時解 12 道題，答案由 ICPC 評測系統實時判定。結果顯示，12 道題中有 11 道題一次提交就通過，最難的一題則是在第 9 次提交時才解出。最終，GPT-5 完成了全部 12 道題，而最好的人類隊伍只解出 11 道。”

與此同時，Google 也公佈了 Gemini 2.5 Deep Think 的比賽細節：45 分鐘內解出 8 題；3 小時內解出 10 題；更令人震驚的是，Gemini 在比賽前半小時內，就成功解決了問題 C——一道沒有任何大學隊伍解出的難題。

據悉，這道題目要求：在由多個水庫和管道組成的複雜網絡中，找到一種管道開關配置，使所有水庫在最短時間內被注滿。每條管道可以開、關或部分開啟，組合幾乎無限，導致搜索最優解極其困難。

面對這道題，Gemini 2.5 Deep Think 的解題思路堪稱“巧妙”：

1、先為每個水庫設定一個“優先級值”，表示它相對於其他水庫應被分配的程度；

2、在給定優先級值後，通過動態規劃找到最優管道配置；

3、進一步應用極小化極大定理，將問題轉化為尋找“最受約束”的優先級組合；

4、最後在凸優化空間中，利用嵌套三分搜索快速收斂到最優解。

這一思路並非賽題官方題解的“標準做法”，而是模型自己推演出的路徑。換句話說，Gemini 在賽場上展示了超越記憶的原創性算法思維。為此Google 也在博客中強調，這不僅是一次正確解答，更是一次“創造性突破”。

為什麼這次意義非凡？

其實，大模型在各種考試、基準測試中的高分表現早已不是新聞：

● ChatGPT、Gemini 等 LLM 在 SAT、律師資格考試、託福等人類考試中屢屢高分；

● 今年7月，Gemini在國際數學奧林匹克（IMO）拿到金牌；

● 在各種 NLP、邏輯推理 benchmark 上，LLM 也早已“刷榜”。

但這些成績往往被質疑為“靠記憶訓練數據”或“靠海量算力暴力搜索”。而 ICPC 這種現場算法競賽不同：首先題目新穎，幾乎不可能出現在訓練語料中；其次需要綜合運用數學建模、推理和代碼實現；最為重要的是，必須在有限時間內找到解法，而不是離線慢慢思考。

此次GPT-5 與 Gemini 2.5 Deep Think在ICPC中的表現，證明了它們已經具備臨場推理、抽象建模、創造性解題的能力，這比在標準化考試中得高分更能說明問題。為此在社交媒體上，許多 AI 工程師感嘆：“過去我們擔心 AI 只是會背題庫；現在它在現場比賽裡擊敗人類冠軍。這感覺像是見證了‘人機智力平權’的時刻。”

這不是終點，而是一個開始。接下來，AI 是否會把這種能力擴展到更復雜的現實問題中還有待考驗，但可以確定的是：如今，AI 不再只是“會寫代碼的助手”，而是真正具備了與人類智力正面對抗的實力。

本文來自微信公眾號“CSDN”，整理：鄭麗媛，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論