전 마이크로소프트 AI 부사장이자 저명한 과학자였던 세바스찬 부벡은 GPT-5 Pro가 수학 논문의 미해결 구간을 처음부터 해결했다는 사실에 놀라움을 표하는 글을 올렸습니다. 이 발견은 널리 공유되었으며, OpenAI의 대표는 AI가 수학 연구를 가속화할 수 있다고 믿습니다.
AI가 정말로 인류의 최첨단 문제를 해결할 수 있을까?
예를 들어, 푸앵카레 추측, 맥스웰 방정식 풀기, 페르마의 마지막 정리, 리만 가설과 같은 문제입니다.
오늘은 이 질문에 대한 답변이 나왔습니다.
AI는 정말 할 수 있습니다! 완전히 독립적이며 인간의 기존 방식을 전혀 참조하지 않습니다.
어젯밤, GPT-5 Pro는 복잡한 수학 문제를 처음부터 완벽하게 풀 수 있었습니다.
그리고 다시 말씀드리지만, 기존의 인간적 증명 방법은 사용하지 않았습니다.
그리고 그 답은 논문의 해답보다 더 낫습니다.
다행히도 인류에게 있어서 이 논문의 저자들은 나중에 AI를 능가하는 새로운 방법을 제시했습니다.
세바스찬 부벡 은 OpenAI의 연구 엔지니어이며, 이전에는 Microsoft에서 인공지능 부문 부사장 겸 수석 과학자로 재직했습니다.
그는 GPT-5 Pro에 직접 논문을 던졌습니다.
이 논문에서는 매우 자연스러운 질문을 연구합니다. 즉, 매끄러운 볼록 최적화에서 반복 지점에 해당하는 함수 값이 형성하는 곡선이 볼록하게 되도록 경사 하강법의 단계 크기 η가 어떤 조건에서 충족되어야 하는가?
논문 주소: https://arxiv.org/pdf/2503.10138v1
논문의 v1 버전에서는 η가 1/L(여기서 L은 매끄러움)보다 작은 경우 이 속성이 성립한다는 것을 증명했습니다.
η가 1.75/L보다 큰 경우, 저자는 반례를 구성했습니다.
따라서 해결되지 않은 질문은 [1/L,1.75/L] 구간에서 무슨 일이 일어나는가입니다.
먼저, 문제를 간략하게 설명하겠습니다.
경사 하강법은 언덕을 내려가는 것과 같습니다. 각 단계마다 단계 크기 η를 선택합니다. L은 지형의 곡률로 생각할 수 있습니다(곡률이 클수록 더 가파르고 민감합니다).
이 논문은 단순히 "하락할 것인가"(단조롭게 감소할 것인가)에만 관심을 두는 것이 아니라, 하락 궤적이 "볼록할 것인가"에 대해서도 관심을 두고 있습니다. 즉, 각 단계의 진행이 변동하지 않고 "앞은 플랫폼이고 뒤는 갑자기 절벽에서 뛰어내리는 것"과 같은 일이 일어나지 않을 것입니다.
이는 언제 멈춰야 할지 아는 데 유용합니다. 볼록한 모양은 점점 더 안정되고 갑자기 다시 떨어지지 않는다는 것을 의미합니다.
세바스찬은 GPT-5 Pro를 사용하여 이 해결되지 않은 구간을 공격했고, 모델은 알려진 하한을 1/L에서 1.5/L로 확장했습니다.
다음은 GPT-5 Pro가 제시한 증명입니다.
처음에는 인상적이지 않아 보일 수 있지만, 전반적인 증명 과정은 매우 우아해 보입니다.
이 발견은 원래 세바스찬을 한동안 들뜨게 했고, 심지어 arXiv에 논문을 직접 출판하고 싶어했습니다.
하지만 인간은 아직 AI보다 한발 앞서 있습니다.
논문 원저자들은 완전히 완성된 버전 v2를 신속하게 출시했습니다. 그들은 임계값을 1.75/L 로 변경했습니다.
세바스찬은 이 발견이 여전히 매우 고무적이라고 생각합니다. 왜 그럴까요? AI가 인간을 이긴 게 아닌가요?
증명 과정에서 GPT-5 Pro는 1.75/L 대신 1.5/L을 증명하려고 했고, 이는 GPT-5 Pro가 v2 버전을 직접 검색하지 않았음을 보여줍니다.
또한, 위의 증명은 v2 증명과도 매우 다릅니다. v1 증명의 진화된 형태에 가깝습니다.
이런 관점에서 볼 때, 오늘날의 AI 역량은 박사 수준에 그치지 않고 종종 그 이상을 달성하고 있습니다.
이러한 발견으로 인해 많은 전문가는 AI가 변화시키고 영향을 미칠 수 있는 다음 분야는 수학이라고 말합니다.
AI의 도움으로 인간 지식의 경계가 다시 넓어질 것입니다.
OpenAI의 사장인 그렉 브록먼은 이것이 수학 분야에서 AI의 활력을 보여주는 신호일 수도 있다고 제안했습니다.
또한 이번 발견은 OpenAI가 이전에 공식적으로 발표한 IMO와 IOI 금메달 수상과는 다른 점이다.
이번에 수학 문제를 푸는 데 사용된 모델은 내부 추론 모델이 아닌 GPT-5 Pro의 사용자 중심 버전입니다.
세바스찬은 이 결론이 25분 만에 스스로 검증되었다고 말했습니다.
전직 인공지능 부사장이자 마이크로소프트의 저명한 과학자인 그가 증명한 내용은 훌륭할 것으로 보이며, AI가 실제로 수학적 문제를 증명한 것으로 보입니다.
GPT-5는 출시 이후 엇갈린 평가를 받았습니다.
하지만 GPT-5 Pro는 알트만이 말하는 "박사 수준"의 AI에 도달했고, 심지어 이를 넘어섰습니다.
이번에 해결된 문제가 인간의 문제를 뛰어넘지는 못했지만, 완전히 자율적이고 자기발견적인 능력의 표시는 여전히 AI의 역량을 보여줍니다.
이건 마치 《방랑하는 지구》에 나오는 MOSS를 떠올리게 하는데, MOSS 역시 스스로 발견하고, 스스로 조직하고, 스스로 프로그래밍하는 AI입니다.
세바스찬은 매우 유능한 사람이에요.
그는 현재 OpenAI에서 인공지능을 연구하고 있습니다.
이전에 세바스찬은 Microsoft의 부사장 겸 수석 과학자 였으며, Microsoft Research에서 10년간 근무했습니다(처음에는 이론 연구 그룹에서 근무했습니다).
세바스찬은 또한 프린스턴 대학에서 3년간 조교수로 재직했습니다.
세바스찬은 경력 초반 15년 동안 머신러닝(ML)볼록 최적화 , 온라인 알고리즘, 적대적 강건성 분야에 대한 연구를 했습니다.
그는 이러한 연구 작업에 대해 많은 최우수 논문상을 수상했습니다 (STOC2023, NeurIPS2018 및 2021 최우수 논문상, Microsoft Research 인턴과 협력하여 수상한 ALT2018 및 2023 최우수 학생 논문상, COLT2016 최우수 논문상, COLT2009 최우수 학생 논문상 포함).
그는 이제 대규모 언어 모델에서 지능이 어떻게 나타나는지 이해하고, 이러한 이해를 바탕으로 대규모 언어 모델의 지능 수준을 개선하는 방법에 더욱 집중하고 있으며, 궁극적으로는 일반 인공 지능(AGI)을 달성할 수 있을지도 모릅니다.
세바스찬은 이러한 접근 방식을 "AGI 물리학"이라고 부릅니다. 이는 AI 시스템의 각 부분이 서로 다른 규모(매개변수, 뉴런, 뉴런 그룹, 계층, 데이터 과정 등)에서 어떻게 함께 작동하여 이러한 모델의 놀랍고 예상치 못한 동작을 생성하는지 밝히려고 하기 때문입니다.
세바스찬과 같은 수학자와 과학자들은 대형 모델의 블랙박스 미스터리를 풀기 위해 열심히 노력하고 있는 것 같습니다.
AI가 인간 인지의 경계를 넓히는 동안, 인간도 대규모 모델의 비밀을 깨뜨릴 수 있기를 바랍니다.
참고문헌:
https://x.com/세바스티앙부벡/상태/1958198661139009862
본 기사는 위챗 공개 계정 "신지위안" 에서 발췌하였으며, 저자는 신지위안이고, 편집자는 정혜이며, 36Kr.의 허가를 받아 게재되었습니다.