수십 년 동안 국제 대학생 프로그래밍 경진대회(ICPC)는 컴퓨터 프로그래밍의 "올림픽"으로 여겨져 왔습니다. 그러나 올해는 두 명의 "비인간" 경쟁자가 그 주목을 빼앗았습니다. 바로 OpenAI의 GPT-5와 Google DeepMind의 Gemini 2.5 DeepThink입니다.
참여 모델인 GPT-5와 Gemini 2.5 Deep Think는 공식 ICPC 규칙과 조직의 감독을 받으며, 인간 경쟁자들과 동일한 문제 해결 과정에 참여했습니다. 학생 팀과 직접 경쟁하지는 않았지만, 인상적인 결과를 달성했습니다.
● GPT-5는 12개 문제를 모두 풀어 만점을 받았으며, 이는 "금메달" 수준과 동일합니다.
● 제미니 2.5 딥싱크는 12개 문제 중 10개를 677분 만에 해결하여 금메달 수준에 도달했습니다. 구글에 따르면, 이 결과는 인간 중 세계 2위가 될 것입니다.
올해 ICPC에서 금메달을 수상한 팀은 상트페테르부르크 국립대학교, 도쿄대학교, 베이징 교통대학교, 칭화대학교 출신이라는 점이 주목할 만합니다. 이 엘리트 팀들조차 모든 문제를 맞히지는 못했습니다(최고 점수는 11/12). 다시 말해, AI가 이러한 유형의 알고리즘 경쟁에서 경쟁자들을 앞지른 것은 이번이 처음이었습니다.
ICPC: 프로그래머 올림픽
ICPC는 세계 최고의 학부 프로그래밍 경진대회입니다. 1970년대부터 세계 최고의 알고리즘 전문가들이 대학에서 모여왔습니다. 올해 ICPC 결선에는 103개국 139개 대학의 팀이 참가했습니다. 대회 규칙은 놀라울 정도로 간단합니다.
● 각 팀은 대학생 3명으로 구성됩니다.
● 5시간 안에 알고리즘 문제 12개를 풀어보세요.
● 순위는 풀이한 문제의 수와 걸린 시간을 기준으로 결정됩니다.
하지만 이 대회의 도전 과제는 일반적인 프로그래밍 대회의 수준을 훨씬 뛰어넘습니다. ICPC 대회는 그래프 이론, 정수론, 동적 프로그래밍, 조합 최적화, 네트워크 흐름 등 다양한 분야의 최첨단 알고리즘을 다루는 경우가 많습니다. 코딩 속도뿐만 아니라 수학적 능력과 팀워크까지 시험합니다. 지난 수년간 ICPC 금메달 수상 팀은 거의 항상 글로벌 기술 기업의 핵심 기술 인재로 성장해 왔습니다.
ICPC의 권위와 도전성 때문에 올해 대회에 AI가 참가하는 것은 특히 상징적입니다. 이를 통해 AI는 가장 엄격한 알고리즘 분야로 직접 진출하게 됩니다.
GPT-5는 완벽한 답변을 제공하고, Gemini 2.5는 인간이 답할 수 없는 질문을 해결합니다.
OpenAI에 따르면 GPT-5는 ICPC 대회를 위해 특별한 훈련을 받지 않았고 외부 도구도 사용하지 않았습니다. 다른 인간 팀과 마찬가지로, GPT-5는 동일한 PDF 챌린지 문제를 받고 공식 채점 시스템을 통해 답을 제출했으며, 5시간 이내에 모든 문제를 완료했습니다.
결과는 놀라웠습니다. 11개의 문제가 한꺼번에 통과되었고, 유일하게 어려운 문제는 9번째 제출에서 풀렸으며, 최종적으로 12/12의 완벽한 점수를 받았습니다. 올해 가장 강력한 인간 팀이 11/12를 받았고, GPT-5가 직접 만점을 받았다는 것을 기억하세요. 이는 ICPC 역사상 극히 드문 일입니다.
이를 바탕으로 OpenAI는 X 플랫폼에서 GPT-5의 결과도 공유했습니다.
"저희는 ICPC AI 트랙에 공식적으로 참가했습니다. 5시간의 제한 시간 안에 12개의 문제를 풀어야 했고, ICPC 평가 시스템을 통해 실시간으로 정답을 평가했습니다. 결과: 12개 문제 중 11개는 첫 번째 제출에서 통과했지만, 가장 어려운 문제는 9번째 제출에서야 겨우 해결했습니다. 결국 GPT-5는 12개 문제를 모두 해결했지만, 최고의 인간 팀은 11개만 해결했습니다."
동시에 구글은 제미니 2.5 딥싱크 대회의 세부 사항도 발표했습니다. 45분 안에 8개 문제를 풀었고, 3시간 안에 10개 문제를 풀었습니다. 더욱 충격적인 것은 제미니가 대회 시작 후 30분 안에 문제 C를 성공적으로 풀었다는 것입니다. 이 문제는 어떤 대학 팀도 풀지 못했던 어려운 문제였습니다.
이 문제는 여러 저수지와 파이프라인으로 구성된 복잡한 네트워크에서 모든 저수지를 최단 시간 내에 채울 수 있는 파이프 스위치 구성을 찾는 것을 요구한다고 합니다. 각 파이프는 개방형, 폐쇄형 또는 부분 개방형일 수 있으며, 거의 무한한 조합이 가능하기 때문에 최적의 해결책을 찾는 것은 매우 어렵습니다.
이러한 문제 대면 Gemini 2.5 Deep Think의 솔루션은 "영리합니다".
1. 먼저 각 저수지에 대해 "우선순위 값"을 설정하여 다른 저수지에 비해 어느 정도를 할당해야 하는지를 나타냅니다.
2. 우선순위 값이 주어진 후 동적 프로그래밍을 통해 최적의 파이프라인 구성을 찾습니다.
3. 미니맥스 정리를 더 적용하여 문제를 "가장 제약이 큰" 우선순위 조합을 찾는 문제로 변환합니다.
4. 마지막으로, 볼록 최적화 공간에서는 중첩된 3단계 탐색을 사용하여 빠르게 최적 솔루션에 수렴합니다.
이 접근법은 공식 경쟁 솔루션의 "표준 접근법"이 아니라, 모델 자체의 추론입니다. 다시 말해, 제미니는 암기를 초월하는 독창적인 알고리즘적 사고를 보여주었습니다. 구글은 블로그 게시물을 통해 이것이 단순한 정답이 아니라 "창의적인 돌파구"라고 강조했습니다.
왜 이번이 그토록 중요한가요?
사실, 다양한 시험과 벤치마크에서 대형 모델이 높은 점수를 받았다는 사실은 더 이상 뉴스가 아닙니다.
● ChatGPT 및 Gemini와 같은 LLM은 SAT, 변호사 시험, TOEFL과 같은 인간 시험에서 반복적으로 높은 점수를 받습니다.
● 제미니는 올해 7월 국제수학올림피아드(IMO)에서 금메달을 획득했습니다.
● LLM은 이미 다양한 NLP 및 논리적 추론 벤치마크에서 1위를 차지했습니다.
그러나 이러한 성과는 훈련 데이터를 암기하거나 엄청난 해시레이트 활용한 무차별 대입 공격에 의존하는 것이라는 의문이 제기되는 경우가 많습니다. 그러나 ICPC와 같은 실시간 알고리즘 경진대회는 다릅니다. 첫째, 문제가 참신하고 훈련 자료에 포함되기가 거의 불가능합니다. 둘째, 수학적 모델링, 추론, 그리고 코드 구현의 조합이 필요합니다. 그리고 가장 중요한 것은, 오프라인에서 느린 사고를 요구하는 것이 아니라 제한된 시간 내에 해결책을 찾아야 한다는 것입니다.
ICPC 경진대회에서 GPT-5와 Gemini 2.5 Deep Think의 성과는 즉석 추론, 추상 모델링 수행, 그리고 창의적인 문제 해결 능력을 보여주는데, 이는 단순히 표준화된 시험에서 높은 점수를 받는 것보다 더 중요합니다. 많은 AI 엔지니어들은 소셜 미디어에서 "과거에는 AI가 문제은행만 암기할까 봐 걱정했는데, 이제는 실제 경쟁에서 인간 챔피언을 누르고 있습니다. 마치 '인간과 기계의 지능 동등성'을 목격하는 것 같습니다."라고 한탄했습니다.
이것은 끝이 아니라 시작입니다. AI가 이러한 역량을 확장하여 더 복잡한 현실 세계의 문제를 해결할 수 있을지는 아직 불확실하지만, 한 가지 확실한 것은 AI가 더 이상 단순한 "코드 작성 도우미"가 아니라 인간 지능과 정면으로 경쟁할 수 있는 진정한 힘을 가지고 있다는 것입니다.
본 기사는 정리위안이 편집하고 36Kr이 허가를 받아 게시한 위챗 공개 계정 "CSDN" 에서 발췌한 것입니다.