GPT-5는 "양자 NP 문제"를 극복하고, 인간의 2주를 30분으로 압축하여 학계를 놀라게 한 최초의 논문입니다.

이 기사는 기계로 번역되었습니다
원문 표시

GPT-5가 과학적 발견의 규칙을 다시 쓰고 있습니다! 한 주요 논문에 따르면 GPT-5는 양자 NP-난해 문제를 단 30분 만에 해결했는데, 이는 인간이 1~2주 걸리는 엄청난 성과입니다. 이러한 발전 속도라면 AI는 노벨상을 받을 만한 획기적인 성과를 달성하는 데 그리 오래 걸리지 않을 것입니다.

며칠 전, GPT-5는 "괴델 테스트"를 성공적으로 통과하여 세 가지 주요 수학적 추측을 깨뜨렸습니다.

예상치 못하게 이번에는 GPT-5가 양자장의 어려운 문제를 다시 한번 "정복"했습니다.

양자 컴퓨팅 전문가 스콧 아론슨이 처음으로 논문을 발표하면서, 오래된 문제 중 하나가 GPT-5의 도움으로 해결되었다는 것을 증명했습니다.

이 논문에서 스콧은 양자 컴퓨팅의 핵심 문제인 QMA 복잡도 범주, 즉 "NP 문제의 양자 버전"이라고 할 수 있는 문제에 대해 열심히 연구해 왔습니다.

핵심은 증명 과정에서 오류 확률을 무한히 줄일 수 있는지, 특히 완벽한 완전성을 달성할 수 있는지에 있습니다.

논문 주소: https://arxiv.org/pdf/2509.21131

기존의 학술 연구를 통해 이미 오차를 매우 낮은 수준으로 줄였지만, 최근 연구에서는 '이중 지수 오차'가 기존 방법의 이론적 한계이며 더 이상 개선할 수 없다는 것을 발견했습니다.

핵심 추론 링크에서 난관에 부딪힌 후, 저자는 GPT-5에 도움을 요청하기 시작했습니다. 처음에는 AI가 잘못된 정보를 제공했습니다.

하지만 약 30분간의 상호작용 끝에 마침내 고유값 행동을 정확하게 분석하는 똑똑한 수학 함수를 만들어냈습니다.

연구 결과, 이 아이디어는 논문에서 가장 중요한 획기적인 발견이 됐습니다.

스콧은 최근 블로그 게시물에서 "만약 어떤 학생이 이 아이디어를 생각해 냈다면, 저는 분명히 그를 칭찬했을 겁니다. 정말 놀랍습니다!"라고 놀라움을 표했습니다.

이 문제를 해결하려면 1~2주간의 인력이 필요할 것으로 추정됩니다.

OpenAI 과학자 세바스찬과 제품 관리자 케빈은 이 게시물을 다시 한번 흥분해서 리트윗하며 "중대한 변화가 시작됐다"고 말했습니다.

NP 문제의 양자 버전: QMA 특이점

25일 arXiv에 제출된 이 논문은 주로 양자 복잡도 클래스 "QMA"에서 블랙박스 증폭의 한계를 연구합니다.

그렇다면 QMA는 무엇일까요?

QMA, 즉 양자 멀린 아서(Quantum Merlin Arthur)는 NP의 전형적인 양자 버전으로 볼 수 있습니다.

여기에는 다음과 같은 종류의 의사결정 문제가 포함됩니다.

만약 대답이 "예"라면, 멀린은 아서에게 양자 증인 상태를 보낼 수 있으며, 아서가 다항식 시간 양자 계산 후 적어도 2/3의 확률로 이를 받아들일 수 있다.

만약 대답이 "아니오"라면, 멀린이 어떤 증인 진술을 보내더라도 아서가 그것을 받아들일 확률은 최대 1/3이다.

여기서 복잡도 이론에서 흔히 볼 수 있듯이 상수 2/3와 1/3은 단지 관례일 뿐이며, 예를 들어 1-2⁻ⁿ와 2⁻ⁿ로 확장하여 대체할 수 있습니다.

이 분야에서 오랫동안 제기되어 온 의문은 다음과 같습니다.

QMA는 QMA₁과 동등합니까? QMA₁은 프로토콜이 "완벽하게 완전"하도록 하는 QMA의 하위 클래스입니다.

2008년, 스콧 에런슨은 실용적인 분석 방법을 사용하여 QMA≠QMA₁인 "양자 오라클"의 존재를 증명했습니다.

즉, QMA=QMA₁임을 증명하려는 모든 시도에는 "양자 비상대화 기술"이 필요합니다.

이는 장애물이 극복 불가능하다는 것을 의미하지는 않지만, 문제의 복잡성을 보여줍니다.

획기적인 발견: 이중 지수 증폭 한계

올해 6월이 되어서야 Freek Witteveen과 Stacey Jeffery가 QMA 프로토콜을 블랙박스 방식을 통해 증폭시켜 완전성 오차를 "두 배 지수적으로 작게" 만들 수 있다는 것을 증명하는 주요 논문을 발표했습니다. 즉, 1/exp(exp(n))입니다.

논문 주소: https://arxiv.org/pdf/2506.15551

그들은 스콧이 전혀 고려하지 못했던 접근 방식을 취했습니다. 즉, 양자 상태의 진폭에 수용 확률을 인코딩하고, 이 진폭은 기하급수적으로 감소합니다.

사실은 25년 동안 알고 지낸 "오랜 친구" QMA가 여전히 놀라움을 가져올 수 있다는 것을 증명했습니다.

8월에 열린 온라인 회의에서 스콧은 다음과 같이 질문했습니다.

이 이중 지수적 완전성이 블랙박스 기술의 한계일까요? 이를 삼중 지수적 수준, 즉 1/exp(exp(exp(n)))으로 더욱 증폭시킬 수 있을까요?

GPT-5 정복하고 고득점 획득까지 30분

일주일 후, 스콧과 프리크는 팀을 이루어 완전한 증명을 작성하여 블랙박스 기술에서는 이중 지수적으로 작은 완전성 오류가 한계임을 보여주었습니다.

즉, 그들은 2008년 "QMA≠QMA₁"오라클 분리 결과를 정량화했고, 그 결과 나온 "하한"은 6월 논문의 일치 결과와 정확히 일치했습니다.

아마도 이 연구에서 가장 매력적인 부분은 양자 복잡성 자체가 아니라, 그 안에서 AI가 하는 역할일 것입니다.

앞서 언급했듯이, 이 논문은 스콧 에런슨이 주요 결과를 증명하는 데 있어 핵심적인 기술적 단계를 AI에서 도출한 첫 번째 논문입니다.

구체적으로 말하면 GPT5-Thinking입니다.

당시 저자가 직면한 문제는 실수 매개변수 θ에 대한 각 요소가 다차수 삼각 다항식인 N×N 에르미트 행렬 E(θ)(예: N=2ⁿ)를 분석하는 것이었습니다.

증명해야 할 것은 θ가 0에서 1까지 변할 때 E(θ)의 최대 고유값입니다. 이를 통해 λₘₐₓ(E(θ))가 0에 가까운 값에서 시작하여 오랫동안 1에 가까운 값, 예를 들어 1/exp(exp(exp(n)))에 가까운 값을 유지할 수 없음을 증명할 수 있습니다.

스콧과 그의 공동 저자들이 문헌을 검토할 시간을 1~2주 준다면 이 문제를 해결할 수 있을 것입니다.

하지만 그는 GPT5-Thinking을 선택했고, 5분 후에 그것은 자신감이 있지만 분명히 틀린 답을 내놓았습니다.

스콧은 AI를 비웃지 않고, 어디가 잘못되었는지 지적했습니다. GPT5-Thinking은 잠시 생각한 후 다시 시도하여 더 나은 해결책을 생각해냈습니다.

그래서 여러 번의 시도 끝에, 마치 대학원생/동료 교환처럼 GPT-5는 다음과 같은 기능을 만들어냈습니다.

이는 θ에서 제어 가능한 차수의 유리 함수라는 점을 정확하게 지적하고 있으며, 가장 큰 고유값 λₘₐₓ(E(θ))가 1에 얼마나 가까운지에 대한 정보를 인코딩합니다.

다행히도 이 방법은 효과가 있었고 AI의 도움 없이도 검증을 쉽게 완료할 수 있었습니다.

스콧은 GPT5가 훈련 데이터 어딘가에서 비슷한 구조를 발견했을 수도 있다고 생각하지만, 학생이 제안한 솔루션이라면 주저하지 않고 "영리하다"고 부를 것입니다.

마지막으로 그는 1년 전에도 비슷한 문제를 GPT 추론 모델로 풀려고 시도했지만, 그 결과가 만족스럽지 못했다는 것을 회상했습니다.

지금은 2025년 9월이고, 나는 당신에게 분명히 말할 수 있습니다.

AI는 제가 인간 지능의 가장 특징적인 부분이라고 생각하는 핵심에 도달하기 시작했습니다. 즉, 양자 복잡도 클래스 간의 오라클 분리를 증명하는 것입니다.

아직은 단독으로 연구 논문 전체를 쓸 만큼은 아니지만, 무엇을 해야 할지 알고 문제에서 벗어나는 데 도움이 된다면 매우 유용한 응용 시나리오입니다.

이런 상황이 얼마나 오래 지속될지 누가 알겠는가?

스콧 에런슨은 농담조로 "이걸 생각하면 아직도 안정적인 직장, 정규직을 갖고 있어서 다행이라는 생각이 든다"고 말했다.

참고문헌:

https://scottaaronson.blog/?p=9183

https://x.com/SebastienBubeck/status/1972368891239375078

https://x.com/kimmonismus/status/1972399015825203463

본 기사는 위챗 공개 계정 "신지위안" 에서 발췌하였으며, 저자는 신지위안이고, 편집자는 도자이며, 36Kr.의 허가를 받아 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트