GPT-5가 수학계에 진출해 박사과정 학생보다 빠르게 정리를 증명할 수 있을까? 네티즌들은 AI의 새로운 역할에 대해 뜨거운 논쟁을 벌이고 있다.

이 기사는 기계로 번역되었습니다
원문 표시

9월 초, arXiv에 게시된 한 논문이 학계에 폭탄선언을 던졌습니다. GPT-5가 수학적 연구 결과에 포함되었다는 것입니다.

연구진은 논문에서 다음과 같이 공개적으로 기술했습니다. "GPT-5는 실험에서 이전에 해결된 적이 없는 수학적 과제를 완료했으며, 그 결과를 공식 원고에 직접 반영했습니다."

대규모 언어 모델이 수학 연구 논문에 "정리 기여자"로 등장한 것은 이번이 처음입니다.

이 논문은 Malliavin–Stein 프레임 의 핵심 문제를 다룬다.

GPT-5가 처음으로 수학 논문에 기록되었습니다.

수학 연구에서 "제4 모멘트 정리"는 퍼즐의 기본적이면서도 까다로운 조각입니다.

원래는 Nualart와 Peccati가 특정 유형의 확률 변수가 정규 분포로 수렴하는지 여부를 확인하기 위해 제안했습니다.

하지만 이 정리는 오랫동안 "간격"을 갖고 있었습니다.

단지 "수렴할지 여부"만 알려줄 수 있을 뿐, "얼마나 빨리 수렴할지"를 정량화할 수는 없습니다.

연구팀은 이 틈을 GPT-5에 남겨두기로 결정했습니다.

그들의 질문은 매우 직접적입니다. 멀리아빈-스타인 프레임 에서 4차 모멘트 정리의 "질적 수렴"을 "양적 수렴"으로 업그레이드하고 명확한 속도 제한을 제공할 수 있습니까?

GPT-5가 제시한 답변은 놀랍습니다. 수렴 속도에 대한 새로운 결론을 도출했기 때문입니다.

GPT-5에서 파생된 새로운 정리: 4차 모멘트 정리는 처음으로 명확한 수렴 속도를 가지며 그대로 논문에 포함되었습니다.

즉, 4차 모멘트가 점차 가우스 분포의 값에 접근하면 수렴 속도도 명확하게 특징지을 수 있음을 증명합니다.

이 결과의 의미는 단순히 빈칸을 푸는 것 이상입니다.

수학 연구자들에게 수렴 속도는 종종 어떤 정리가 고차원 난수장, 금융 데이터의 극값 분석, 심지어 물리학에서의 난수 과정 시뮬레이션과 같은 복잡한 모델에 실제로 적용될 수 있는지 여부를 결정합니다.

이전에는 일반적으로 "수렴할 것이다"라고만 말할 수 있었지만, 이제는 정량적 경계가 생겨서 많은 응용이 가능해졌습니다.

더 중요한 점은, 이 과정은 연구팀이 GPT-5를 "미화"하기 위한 것이 아니라, 그 유도 과정을 정식 결과에 직접 통합하기 위한 것이라는 점입니다.

대규모 언어 모델이 수학 연구 논문의 본문에 "정리 기여자"로 포함된 것은 이번이 처음입니다.

일대일 싸움이 아니다

교수+AI의 결합이죠.

사람들이 논문에 GPT-5가 포함되었다고 하면, "AI가 어려운 수학 문제를 독립적으로 해결할 수 있는 능력"을 떠올리기 쉽습니다.

하지만 진실은 그렇게 간단하지 않습니다.

GPT-5는 처음부터 논리적으로 완전해 보이는 정리 문장을 작성했지만, 핵심 연결 Cov(Y², Z²)의 도출 과정에서 잘못된 공식을 사용했습니다.

이 오류를 제때 발견하지 못하면 증명 전체가 망가질 것입니다.

연구자들은 다음과 같이 질문했습니다.

Cov(Y², Z²)에 대한 공식을 확인해 주시고 자세한 내용을 알려주실 수 있나요?

GPT-5는 순종적으로 자세한 설명을 했지만, 여전히 틀렸습니다.

연구자들은 간단히 다음과 같이 지적했습니다.

(p+q)!‖u⊗v‖² = p!q!‖u‖²‖v‖²라고 주장하는 것은 잘못된 것 같습니다.

그제서야 GPT-5는 이전 추론이 틀렸음을 인정하고 생각을 수정했습니다.

연구자들의 지도에 따라 마침내 올바른 유도를 작성하고, 그 결과를 요구에 따라 완전한 논문으로 정리했습니다.

이러한 반복적인 오류 수정 과정은 논문의 저자를 한숨짓게 했습니다. GPT-5를 다루는 것은 똑똑하지만 충동적인 인턴을 훈련하는 것과 같습니다.

이 기계는 빠르게 방향을 제시하고 증거를 생성할 수 있지만, 항상 이를 감시하고, 오류를 지적하고, 이를 수정할 수 있도록 해주는 인간 멘토가 필요합니다.

Mollick: GPT-5 Pro는 새로운 수학 문제를 풀 수 있지만 교수의 지도를 받아야 합니다.

이것은 AI의 일대일 싸움이 아니라, 교수와 AI의 합동 싸움입니다.

외부인들은 소리쳤고 내부자들은 침착함을 유지했다

GPT-5가 논문에 포함되었다는 소식이 퍼지자, 해당 분야 외부의 많은 사람들의 첫 반응은 "역사적인 순간"이었습니다.

8월 20일, Microsoft 연구원 Sébastien Bubeck은 X에 다음과 같이 게시했습니다.

그는 GPT-5 Pro를 사용하여 볼록 최적화 분야의 미해결 문제를 해결했습니다.

단 몇 분 만에 GPT-5는 고전적인 경계를 1/L1/L1/L에서 1.5/L1.5/L1.5/L로 높였습니다.

지루한 수학 기호처럼 들리지만, 왜 이런 반향을 불러일으켰을까요?

볼록 최적화에서 1/L은 알고리즘이 달성할 수 있는 수렴 속도의 상한을 나타내며, 이 상한은 알고리즘의 실행 속도를 직접 결정합니다.

연구자들은 오랫동안 이를 법칙으로 취급해 왔지만, GPT-5는 몇 분 만에 1.5/L라는 더 엄격한 한계를 제시했습니다.

즉, 만약 이것이 맞다면, 이 분야 전체의 알고리즘의 속도를 수학적으로 "향상"시킬 수 있다는 뜻입니다.

이 게시물은 소셜 미디어에서 큰 인기를 끌었고, 많은 사람들은 이를 AI 수학자 시대의 시작으로 여겼습니다.

그러나 수학계 내에서의 해석은 훨씬 더 냉정합니다.

최적화 전문가 Ernest Ryu는 다음과 같이 말했습니다.

GPT-5의 이 데모는 전문가들에게 이미 잘 알려진 도구인 네스테로프 정리에 크게 의존합니다. 숙련된 연구자도 몇 시간 안에 동일한 결과를 얻을 수 있습니다.

다시 말해, 외부인이 "몇 분 만에 완성된 획기적인 기술"이라고 보는 것도 실제로는 내부자의 눈에는 "익숙한 도구를 빠르게 재사용한 것"입니다.

이것은 과학 연구 가속기 인가, 아니면 박사 학위 소지자들에게 걸림돌인가?

GPT-5는 논문에 기술되어 있었고 과학 연구 가속기 처럼 보였지만, 저자는 마지막에 상당한 우려 사항을 적었습니다.

연구자들은 GPT-5의 가장 뛰어난 점은 기존 도구를 빠르게 조합하여 결과를 도출하는 데 있다는 것을 발견했습니다.

기술적으로는 정확하지만 진정한 독창성이 부족합니다.

앞으로 이런 "퍼즐 맞추기 연구"가 학계에 점점 더 많이 쏟아진다면, 문헌은 "정확하지만 평범한" 결과에 압도될 수 있으며, 진정으로 획기적인 연구는 두각을 나타내기가 더 어려워질 것입니다.

우리가 더욱 경계해야 할 부분은 박사과정 학생들의 성장 경로입니다.

전통적인 속도에 따르면, 그들은 반복적인 독서와 시행착오를 통해 천천히 연구 직관을 개발해야 합니다.

하지만 AI가 언제든 기술적으로 정확한 추론을 도출할 수 있다면, 이러한 중요한 시행착오 단계를 건너뛸 수 있습니다. 논문은 이를 매우 직설적으로 다음과 같이 기술합니다.

학생들이 AI에 지나치게 의존하게 되면 이러한 필수적인 기술을 개발하는 데 필요한 기회를 놓칠 수 있습니다.

이런 우려는 근거 없는 것이 아니다.

OpenAI 연구원인 노암 브라운도 공개적으로 다음과 같이 상기시켰습니다.

다시 말해, GPT-5는 이미 새로운 정리를 도출할 수 있지만, 과연 과학 연구를 "패스트푸드 조립 라인"으로 전락시킬까요, 아니면 인류를 새로운 지식 폭발의 시대로 이끌까요? 아무도 그 답을 장담할 수 없습니다.

부벡의 볼록 최적화 사례부터 말리아빈-슈타인 정리의 양적 혁신까지, GPT-5는 더 이상 실험실의 장난감이 아니라 학술 논문의 텍스트에 실제로 등장했습니다.

교수의 지도 하에 정리를 생성하고, 증명을 도출하고, 심지어 전체 연구 과정을 완료할 수도 있습니다.

하지만 다음과 같은 의문도 생깁니다. "정확하지만 평범한" 결과가 대규모로 재현될 수 있게 되면, 원래의 획기적인 발견이 묻히게 될까요?

AI가 박사과정 학생들에게 가장 중요한 시행착오와 탐구 과정을 건너뛰면, 학문적 교육은 기반을 잃게 될까요?

앞으로 몇 년 안에 과학 연구에서 AI의 역할은 누구도 상상하지 못할 만큼 빠르고 극적으로 바뀔 수도 있습니다.

따라서 진짜 질문은 이렇습니다. AI가 이미 논문을 쓸 수 있는 상황에서 인간 연구자들은 또 무엇을 써야 할까요?

참고문헌:

https://x.com/polynoamial/status/1964464373516427491

https://x.com/emollick/status/1964447221853966775

https://x.com/ns123abc/status/1964724813940842934

https://x.com/SebastienBubeck/status/1958198661139009862

https://arxiv.org/abs/2509.03065

본 기사는 위챗 공개 계정 "신지위안" 에서 발췌하였으며, 저자는 신지위안이고, 편집자는 청칭이며, 36Kr.의 허가를 받아 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트