在過去幾十年裡,國際大學生程序設計競賽(ICPC)一直被視為計算機程序設計領域的“奧林匹克”。然而今年,賽場上的風頭卻被兩位“非人類”選手搶走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。
GPT-5 和 Gemini 2.5 Deep Think 作為參賽模型,受 ICPC 官方規則與組織監督,參與了與人類選手相同的解題環節。雖然它們並非與學生團隊直接同場競技,卻交出了驚豔答卷:
● GPT-5 拿下滿分,12 道題全解,相當於“金牌”水準。
● Gemini 2.5 Deep Think 在 677 分鐘內解出 12 題中的 10 題,也達到金牌級別。根據谷歌的說法,這樣的成績放在人類排名裡將是全球第二。
要知道,本屆 ICPC 的人類金牌隊伍來自聖彼得堡國立大學、東京大學、北京交通大學和清華大學。可即便是這些頂尖學府的強隊,也沒有任何一支做到全對(最好成績是 11/12)。換句話說,這是 AI 第一次在這類算法競賽中實現了“超車”。
ICPC:程序員的“奧林匹克”
ICPC 是全球最頂尖的大學生編程賽事,自 1970 年代起,這項賽事就匯聚了全球高校最頂尖的算法天才。今年,ICPC 總決賽共有來自 103 個國家、139 所高校的戰隊參賽,大賽規則看似簡單:
● 每支隊伍由三名大學生組成;
● 5 小時內解答 12 道算法題;
● 排名取決於解題數和用時。
但背後的難度遠超一般編程比賽。據悉,ICPC 的題目常涉及圖論、數論、動態規劃、組合優化、網絡流等前沿算法。既考察編碼速度,也考察數學功底與團隊合作。歷年來,能在 ICPC 拿到金牌的隊伍,幾乎都成為了全球科技公司的核心技術人才。
也正因為 ICPC 的權威與挑戰性,本屆 AI 的入局顯得尤為標誌性:這是把AI直接推上了最嚴苛的算法競技場。
GPT-5 給出完美答卷,Gemini 2.5 解出人類沒有答出的問題 C
根據 OpenAI 官方披露,GPT-5 參賽時並沒有針對 ICPC 做特別訓練,也沒有任何“外掛”工具。它像其他人類隊伍一樣:直接拿到同樣的 PDF 賽題、通過官方判題系統提交答案、在 5 小時內完成所有解答。
結果令人瞠目:有 11 道題都是一遍過,唯一的難題在第 9 次提交時才解出,最終達成 12/12 滿分——要知道,今年人類最強隊伍的成績是 11/12,而 GPT-5 直接拿下滿分,這在 ICPC 的歷史上極為罕見。
基於此,OpenAI 也在 X 平臺分享了 GPT-5 的成績:
“我們在 ICPC 的 AI 賽道正式參賽,同樣是 5 小時解 12 道題,答案由 ICPC 評測系統實時判定。結果顯示,12 道題中有 11 道題一次提交就通過,最難的一題則是在第 9 次提交時才解出。最終,GPT-5 完成了全部 12 道題,而最好的人類隊伍只解出 11 道。”
與此同時,Google 也公佈了 Gemini 2.5 Deep Think 的比賽細節:45 分鐘內解出 8 題;3 小時內解出 10 題;更令人震驚的是,Gemini 在比賽前半小時內,就成功解決了問題 C——一道沒有任何大學隊伍解出的難題。
據悉,這道題目要求:在由多個水庫和管道組成的複雜網絡中,找到一種管道開關配置,使所有水庫在最短時間內被注滿。每條管道可以開、關或部分開啟,組合幾乎無限,導致搜索最優解極其困難。
面對這道題,Gemini 2.5 Deep Think 的解題思路堪稱“巧妙”:
1、先為每個水庫設定一個“優先級值”,表示它相對於其他水庫應被分配的程度;
2、在給定優先級值後,通過動態規劃找到最優管道配置;
3、進一步應用極小化極大定理,將問題轉化為尋找“最受約束”的優先級組合;
4、最後在凸優化空間中,利用嵌套三分搜索快速收斂到最優解。
這一思路並非賽題官方題解的“標準做法”,而是模型自己推演出的路徑。換句話說,Gemini 在賽場上展示了超越記憶的原創性算法思維。為此Google 也在博客中強調,這不僅是一次正確解答,更是一次“創造性突破”。
為什麼這次意義非凡?
其實,大模型在各種考試、基準測試中的高分表現早已不是新聞:
● ChatGPT、Gemini 等 LLM 在 SAT、律師資格考試、託福等人類考試中屢屢高分;
● 今年7月,Gemini在國際數學奧林匹克(IMO) 拿到金牌;
● 在各種 NLP、邏輯推理 benchmark 上,LLM 也早已“刷榜”。
但這些成績往往被質疑為“靠記憶訓練數據”或“靠海量算力暴力搜索”。而 ICPC 這種現場算法競賽不同:首先題目新穎,幾乎不可能出現在訓練語料中;其次需要綜合運用數學建模、推理和代碼實現;最為重要的是,必須在有限時間內找到解法,而不是離線慢慢思考。
此次GPT-5 與 Gemini 2.5 Deep Think在ICPC中的表現,證明了它們已經具備臨場推理、抽象建模、創造性解題的能力,這比在標準化考試中得高分更能說明問題。為此在社交媒體上,許多 AI 工程師感嘆:“過去我們擔心 AI 只是會背題庫;現在它在現場比賽裡擊敗人類冠軍。這感覺像是見證了‘人機智力平權’的時刻。”
這不是終點,而是一個開始。接下來,AI 是否會把這種能力擴展到更復雜的現實問題中還有待考驗,但可以確定的是:如今,AI 不再只是“會寫代碼的助手”,而是真正具備了與人類智力正面對抗的實力。
本文來自微信公眾號“CSDN”,整理:鄭麗媛,36氪經授權發佈。