인공지능이 수학적 가설을 증명하고 있는데, 이번에는 정말로 증명됐습니다.
OpenAI의 최신 모델인 GPT-5.2 Pro가 에르되시 추측을 독자적인 방식으로 입증했습니다.
이 주장은 필즈상 수상자인 테렌스 타오에 의해 검증되었으며, "현재까지 나온 1급 인공지능 결과 중 가장 명확한 결과(인공지능의 주요 공헌)"라는 찬사를 받았습니다.
이 문제는 전설적인 수학자 폴 에르되시와 로널드 그레이엄이 1980년에 제안한 에르되시 문제 모음집의 281번째 문제로, 합동 피복 시스템과 자연 밀도 사이의 심오한 관계를 다룹니다.
이 질문은 45년 동안 조용히 질문 은행에 자리 잡고 답을 기다리고 있었습니다.
2025년 1월 17일까지 Neel Somani라는 연구원이 이 문제를 GPT-5.2 Pro에 제출했습니다.
이 검증 과정에서는 GPT 5.2 Pro만 사용했습니다.
Erdös Problem 웹사이트에는 AI로 입증된 결과가 포함되어 있습니다.
이 논증 전체는 무한 아델 정수환에서 전개되며, 하르 측도와 점상태 에르고딕 정리, 그리고 콤팩트성 논증을 결합하여 점별 수렴에서 균일 수렴으로의 전환을 완성합니다.
테렌스 타오의 말에 따르면, 이는 에르고딕 이론과 조합론이 교차하는 지점에서 표준적인 도구로 사용되는 "퓌르스텐베르크 대응 원리"의 변형입니다.
하지만 GPT-5.2 Pro는 약간 다른 방식으로 사용되며, 일반적인 논증 방식보다는 버크호프 정리에 더 많이 의존합니다.
하지만 테렌스 타오를 진정으로 감탄시킨 것은 증명 방법 자체가 아니라 인공지능이 어떤 오류도 범하지 않았다는 점이었다.
더욱 놀라웠던 점은 극단적인 치환이나 수량사 순서 오류와 같은, 이 문제에서 가장 쉽게 발생하는 함정들을 모델이 피했다는 것입니다. 이전의 대규모 언어 모델들은 이러한 미묘한 부분에서 분명히 오류를 범했을 것입니다.
이 증명을 검증하기 위해 테렌스 타오는 직접 전체 에르고딕 논증을 조합론 언어로 번역하고, 버크호프 정리를 하디-리틀우드 최대 부등식으로 대체했으며, 전체 유도 과정을 다시 그렸습니다.
결론: 증명은 타당하다.
예상치 못한 발견
모두가 GPT-5.2 Pro의 증명에 대해 논의하는 동안, KoishiChan이라는 사용자가 댓글 섹션에서 예상치 못한 사실을 발견했습니다.
사실 이 문제에는 더 간단한 해결책이 있으며, 필요한 두 가지 정리는 이미 1936년과 1966년에 존재했습니다.
첫 번째는 밀도 수렴 정리인데, 이는 해럴드 데이븐포트와 에르되시 자신이 1936년에 증명한 것이다.
두 번째는 1966년 할버스타인-로스의 저서 *수열* 5장에 처음 발표된 로저스 정리입니다. 이 두 가지 고전적인 결과를 결합하면 문제 281은 거의 직접적으로 유도될 수 있습니다.
이상하군. 에르되시 본인도 1936년 논문의 공동 저자였는데, 1980년에 그 질문을 던졌을 때는 답이 이렇게 가까이 있다는 사실을 깨닫지 못했으니 말이다.
테렌스 타오는 이 문제에 대해 자문을 구하기 위해 프랑스 수학자 테넨바움에게 특별히 이메일을 보냈습니다.
터넌바움은 "언급하신 두 가지 고전적인 결과(대븐포트-에르도스 정리와 로저스 정리)가 충족되는 한 문제는 즉시 해결될 수 있다"고 확인했지만, "문제의 공식이 어느 시점에 수정되었을 수도 있다"고 추측하기도 했습니다. 그러나 현재까지 다른 공식은 발견되지 않았으므로, 이 공식은 있는 그대로 취급해야 합니다.
더욱 흥미로운 점은 2007년 피라세타, 포드, 코냐킨, 포메란스, 유를 포함한 다섯 명의 최고 전문가들이 또 다른 에르되시 문제를 풀고 있을 때에도 트남바움이 로저스의 정리를 추가하라고 상기시켜주기 전까지는 그 정리에 대해 알지 못했다는 것입니다.
테렌스 타오는 "로저스 정리는 마땅히 받아야 할 만큼 널리 알려지지 못했습니다. 할버스탐-로스의 책에만 실려 있을 뿐 별도로 출판된 적도 없고, 인용 횟수도 매우 적습니다. 이번 논의를 통해 체와 합동 덮개를 연구하는 더 많은 연구자들이 이 정리에 주목하게 되기를 바랍니다."라고 한탄했습니다.
결론적으로, 이 문제에 대한 증명은 이제 두 가지가 있습니다. 하나는 GPT-5.2 Pro의 에르고딕 경로에서 얻은 증명이고, 다른 하나는 KoishiChan이 발굴한 고전 문헌들을 조합하여 얻은 증명입니다.
테렌스 타오는 두 가지가 개념적으로 일부 겹치는 부분이 있지만 "서로 다른 증명"이라고 확인했습니다.
인공지능 수학의 진정한 성공률을 어떻게 평가할 수 있을까요?
이 소식이 퍼진 후, 교차 검증을 위해 다양한 AI 모델이 투입되었습니다.
Gemini 3 Pro는 증명이 완벽하다고 판단했습니다. 또 다른 연구원은 GPT-5.2 Pro를 사용하여 증명의 세부 사항을 반복적으로 확인했습니다. 그 결과, AI는 엄밀성이 요구되는 유일한 부분은 두 번째 단계이며, 이는 파투 보조정리를 사용하여 우회하고 에르고딕성 없이 직접 완료할 수 있다고 결론지었습니다.
하지만 테렌스 타오는 파투의 보조정리의 방향이 여기서는 반대로 되어 있다고 지적했습니다. "저는 방금 측도론 대학원생들을 가르치는 일을 마쳤는데, 이와 같은 오류를 너무 많이 봤습니다."
그 결과, 정규 그래프 정리가 여집합에 적용되었고, 방향이 올바르며, 증명이 타당하다는 것이 확인되었습니다.
하지만 테렌스 타오는 또한 씁쓸한 현실을 일깨워주는 말을 남겼습니다. 그는 이렇게 썼습니다.
AI 도구의 실제 성공률을 평가할 때 가장 큰 통계적 편향은 부정적인 결과가 거의 공개되지 않는다는 보고 편향에서 비롯됩니다.
개인이나 AI 기업이 미해결 문제에 도구를 사용했지만 아무런 진전을 보지 못했다면, 부정적인 결과를 보고할 동기가 없습니다. 설령 보고하더라도 긍정적인 결과만큼 소셜 미디어에 널리 퍼지지 않을 가능성이 높습니다.
비록 대다수의 문제가 난이도 측면에서 쉬운 쪽에 집중되어 있지만, 이것이 반드시 중간 난이도의 에르되시 문제가 인공지능의 해결 능력 범위에 포함되었다는 것을 의미하는 것은 아닙니다.
그는 파타 이바니스빌리와 메흐멧 마스 세븐이 시작한 오픈 소스 프로젝트를 추천했는데, 이 프로젝트는 에르되시 문제에 대한 최첨단 대규모 언어 모델의 긍정적 및 부정적 결과를 체계적으로 기록하고 있다.
데이터에 따르면 이러한 도구들이 에르되시 문제를 해결하는 데 있어 실제 성공률은 1~2%에 불과한 것으로 나타났습니다.
하지만 문제 라이브러리에 미해결 문제가 600개 이상 있다는 점을 고려하면, 이 비율은 여전히 상당하고도 이례적인 인공지능 기여도를 나타냅니다.
참고 링크:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812
이 글은 위챗 공식 계정 "퀀텀 비트" 에서 가져온 것으로, 저자는 최첨단 기술에 중점을 두고 있으며, 36Kr의 허가를 받아 게시되었습니다.




