지둥시(Zhidongxi)에 따르면, 오늘 이른 아침, OpenAI와 구글은 자사 모델이 세계적으로 유명한 프로그래밍 대회인 ICPC 2025(제49회 국제 대학 프로그래밍 대회)의 결승에서 금메달 수준의 성과를 달성했다고 발표했습니다.
OpenAI 추론 시스템은 12개 문제를 모두 정답으로 맞혔고, 한 번에 11개 문제를 정답으로 맞혔습니다. 가장 어려운 문제를 9번 제출한 후 풀면서 인간 팀과 비교했을 때 1위를 차지했습니다. Gemini 2.5 Deep Think의 고급 버전은 677분 만에 10개 문제를 풀면서 인간 팀과 비교했을 때 2위를 차지했습니다 .
ICPC 전체 순위에 AI가 포함된다면 상위 3개는 OpenAI 추론 시스템, 상트페테르부르크 국립대학교, Google Gemini 2.5 Deep Think 고급 버전이 될 것입니다 .
ICPC는 참가자들에게 5시간 안에 12개의 복잡한 알고리즘 문제를 풀어야 합니다. 정답의 완벽성과 문제 해결에 걸린 시간이 점수에 영향을 미칩니다.
최종적으로 139개 팀 중 상위 4개 팀이 금메달을 획득했습니다. 상트페테르부르크 국립대학교, 도쿄대학교, 베이징 교통대학교, 칭화대학교가 그 주인공입니다. 상트페테르부르크 국립대학교가 가장 많은 문제를 풀어 총 11개를 기록했습니다.
ICPC 금메달을 딴 인간팀
OpenAI의 추론 시스템과 Google의 Gemini 2.5 Deep Think가 두 달 전 국제 수학 올림피아드(IMO)에서 우승한 데 이어, 이번이 두 번째로 최고의 국제 대회에서 그 강점을 입증한 것입니다.
ICPC 결승전에 참가하는 Google의 Gemini 2.5 Deep Think 고급 버전에 대한 코드가 GitHub에 오픈 소스로 공개되었습니다.
GitHub 주소:
https://github.com/google-deepmind/gemini_icpc2025
01.
OpenAI가 만점을 받았습니다.
구글은 두 가지를 잘못 이해했습니다.
ICPC는 전 세계적으로 가장 오래되고, 규모가 크며, 가장 권위 있는 대학 수준 알고리즘 프로그래밍 대회로 인정받고 있습니다. 매년 103개국 이상, 약 3,000개 대학의 참가자들이 실제 프로그래밍 문제를 해결하기 위해 경쟁합니다.
OpenAI와 Google 모두 참여하여 골드 레벨의 성과를 달성했습니다. OpenAI의 추론 시스템은 12개의 질문에, Google의 Gemini 2.5 Deep Think 고급 버전은 10개의 질문에, 그리고 최고의 인간 팀은 11개의 질문에 답했습니다 .
1. OpenAI: 첫 시도에서 11개 질문에 모두 정답을 맞혀 완벽한 점수를 달성했습니다.
OpenAI의 추론 시스템은 완벽한 점수를 받았습니다.
OpenAI는 ICPC를 위해 특별히 모델을 훈련하지 않았으며, 일반적인 추론 모델을 조합하여 대회에 참여했다고 밝혔습니다.
대회 기간 동안 GPT-5와 실험 추론 모델이 협력하여 해결책을 도출했으며, 실험 추론 모델은 제출된 해결책을 선정하는 역할을 했습니다. 최종적으로 GPT-5는 11개 문제에 정답을 맞혔고, 마지막이자 가장 어려운 문제는 실험 추론 모델이 해결했습니다.
이 모델은 한 번에 11개의 질문에 올바르게 답했으며 , 가장 어려운 질문은 9번째 제출에서 성공적으로 답했습니다.
2. Google: 10개 질문에 정답, 45분 안에 8개 질문 풀이
Deep Think의 고급 버전인 Gemini 2.5는 ICPC 규칙에 따라 원격 온라인 환경에서 실시간 경쟁을 펼쳤으며, 실제 경쟁자보다 10분 늦게 시작했습니다. Gemini는 12개 문제 중 10개를 677분 만에 풀었고, 그중 8개는 45분, 2개는 3시간이 걸렸습니다.
아래 그림은 2025년 ICPC 결승전에서 각 문제를 푸는 데 걸린 시간을 보여줍니다. 제미니 시간은 파란색으로 표시되어 있고 대학 팀의 가장 빠른 시간은 회색으로 표시되어 있습니다.
쌍둥이자리는 세 가지 문제를 모두 해결하는 데 있어 인간을 능가했습니다 .
ICPC 결승전에서 각 문제를 푸는 데 걸린 시간
또한 구글 딥마인드는 인간 팀 전체를 난처하게 했던 어려운 문제를 언급했는데, 제미니는 이 문제를 30분 만에 성공적으로 해결했습니다.
문제 C는 각 팀이 상호 연결된 파이프 네트워크를 통해 여러 탱크에 액체를 공급하는 솔루션을 설계해야 합니다. 목표는 모든 탱크를 최대한 빨리 채울 수 있는 파이프 구성을 찾는 것입니다.
이 문제에는 가능한 구성의 수가 무한합니다. 각 파이프가 열려 있거나 닫혀 있거나 심지어 부분적으로 열려 있을 수 있기 때문에 최적의 구성을 찾는 것이 매우 어렵습니다.
문제 C 소개
제미니는 효과적인 해결책을 찾았습니다. 먼저 각 저수지에 다른 저수지와 비교했을 때 각 저수지가 받아야 할 우선 순위를 나타내는 "우선 순위 값"이 있다고 가정합니다.
우선순위 값 집합이 주어지면 동적 프로그래밍 알고리즘을 사용하여 파이프라인의 최적 구성을 찾을 수 있습니다.
제미니는 미니맥스 정리를 적용하면 원래 문제가 최종 흐름의 제약 조건을 최대화할 수 있는 우선 순위 값을 찾는 문제로 변환될 수 있음을 발견했습니다.
Gemini는 우선순위 값과 최적 흐름 간의 상관관계를 활용하여 그릇 모양의 볼록 솔루션 공간에서 중첩된 3진 검색을 통해 최적의 우선순위 값을 빠르게 찾아 궁극적으로 문제 C를 해결했습니다.
현재 Google AI Ultra를 구독 중인 Gemini 사용자는 Gemini 앱에서 Gemini 2.5 Deep Think의 경량 버전을 사용할 수 있습니다.
02.
ICPC 금메달 레벨
대규모 모델의 추상적 추론 능력을 보여줍니다.
Google DeepMind의 블로그에서는 Gemini의 성능이 사전 학습, 사후 학습, 강화 학습 기술, 다단계 추론 및 병렬 사고의 기술 혁신으로 인해 향상되었다고 언급했습니다.
예를 들어, 연구진은 강화 학습을 사용하여 프로그래머가 직면한 가장 어려운 문제들에 대한 추론 및 코드 생성을 위해 Gemini를 훈련시켰습니다. 이를 통해 얻은 피드백을 통해 학습하고 접근 방식을 개선했습니다. 문제를 해결하기 위해 여러 Gemini 에이전트가 각자 자신만의 해결책을 제안하고, 코드를 실행하고, 터미널을 사용하여 테스트한 다음, 모든 시도를 기반으로 해결책을 반복했습니다.
Google DeepMind의 내부 조사에 따르면, Gemini 2.5 Deep Think의 고급 버전은 2023년과 2024년 ICPC 월드 파이널에서도 금메달 수준의 성능을 달성할 수 있으며, 세계 상위 20위 경쟁 개발자들과 비교해도 뒤지지 않는 성능을 보일 것으로 나타났습니다 .
ICPC에서 금메달 수준의 결과를 달성한 것은 소프트웨어 개발에 직접적인 실질적인 영향을 미칩니다. 경쟁에서 최고의 AI와 인간의 솔루션을 결합하여 12개 문제 모두 철저하고 정확하게 해결되었습니다. 이는 AI가 인간 전문가를 보완하는 고유한 통찰력을 제공할 수 있는 잠재력을 보여줍니다.
Gemini 2.5 Deep Think의 고급 버전은 수학과 프로그래밍 능력 외에도 추상적 추론 능력도 보여줍니다.
ICPC 문제에는 복잡한 문제를 이해하고, 여러 단계로 구성된 논리적 계획을 설계하고, 이를 완벽하게 실행하는 모델이 필요하기 때문입니다. 이는 신약이나 마이크로칩을 설계하는 것을 포함하여 과학과 공학의 많은 분야에서 요구되는 기술과 동일합니다.
OpenAI 연구진은 X에 동일한 모델 세트를 사용하여 IMO와 IOI 대회에 참여하여 해당 모델의 성능과 다재다능함을 입증했다고 게시했습니다.
03.
결론: 대형 모델은 복잡합니다
추상적인 문제 해결 능력을 향상시키세요
국제수학올림피아드(IMO)부터 이 프로그래밍 경진대회에 이르기까지 OpenAI와 구글의 모델은 점점 더 어려워지는 수학 및 추론 문제를 해결하는 데 엄청난 잠재력을 보여주었습니다. ICPC 글로벌 전무이사인 빌 파우처 박사는 ICPC가 항상 문제 해결 분야에서 최고의 기준을 정립하는 데 전념해 왔으며, 이 분야에서 제미니의 성과는 차세대 AI 도구와 학술 표준을 정의하는 데 중요한 순간을 의미한다고 말했습니다.
경쟁 프로그래밍과 수학적 추론 분야의 이러한 획기적인 발전은 대규모 모델이 추상적 추론 문제를 해결하는 데 있어 성능 향상을 이룰 수 있으며, 인간 전문가와 협력하여 훨씬 더 복잡한 과제를 해결할 수도 있음을 보여줍니다.
본 기사는 위챗 공개 계정 "지동희"(ID: zhidxcom) 에서 발췌하였으며, 저자는 정첸, 편집자는 리수이칭이고, 36Kr.의 허가를 받아 게재되었습니다.