Trí tuệ nhân tạo đang chứng minh các giả thuyết toán học, lần là có thật.
Mô hình mới nhất của OpenAI, GPT-5.2 Pro, vừa chứng minh một cách độc lập một giả thuyết của Erdős.
Luận điểm này đã được Terence Tao, người đoạt giải Fields Medal, xác nhận và cũng được ca ngợi là "kết quả hạng I rõ ràng nhất cho đến nay (đóng góp chính của AI)".
Bài toán này là bài số 281 trong Thư viện Bài toán Erdős, được đề xuất vào năm 1980 bởi các nhà toán học huyền thoại Paul Erdős và Ronald Graham, và liên quan đến mối quan hệ sâu sắc giữa các hệ phủ đồng dư và mật độ tự nhiên.
Suốt 45 năm qua, câu hỏi này vẫn nằm im lìm trong ngân hàng câu hỏi, chờ đợi câu trả lời.
Cho đến ngày 17 tháng 1 năm 2025, một nhà nghiên cứu tên là Neel Somani đã đệ trình vấn đề này lên GPT-5.2 Pro.
Bản chứng minh chỉ sử dụng GPT 5.2 Pro.
Trang web Vấn đề Erdős đã đưa ra các kết quả đã được AI chứng minh.
Toàn bộ lập luận được triển khai trên một vành số nguyên Adel vô hạn, và với sự trợ giúp của phép đo Haar và định lý ergodic trạng thái điểm, kết hợp với lập luận về tính compact, nó hoàn thành quá trình chuyển đổi từ hội tụ điểm sang hội tụ đều.
Theo lời của Terence Tao, đó là một biến thể của "nguyên lý tương ứng Furstenberg", một công cụ tiêu chuẩn ở giao điểm của lý thuyết ergodic và tổ hợp học.
Tuy nhiên, GPT-5.2 Pro được sử dụng theo một cách hơi khác; nó dựa nhiều hơn vào định lý Birkhoff hơn là các lập luận thông thường.
Tuy nhiên, điều thực sự gây ấn tượng với Terence Tao không phải là phương pháp chứng minh mà chính là việc trí tuệ nhân tạo không mắc bất kỳ lỗi nào.
Điều khiến tôi ngạc nhiên hơn nữa là nó đã tránh được những lỗi như hoán đổi quá mức hoặc sai sót về thứ tự lượng từ, vốn chính là những cạm bẫy dễ gặp nhất trong bài toán này. Các thế hệ mô hình ngôn ngữ lớn trước đây hầu như chắc chắn đã vấp phải những điểm tinh tế này.
Để kiểm chứng chứng minh này, Terence Tao đã đích thân dịch toàn bộ lập luận ergodic sang ngôn ngữ tổ hợp, thay thế định lý Berkhoff bằng bất đẳng thức cực đại Hardy-Littlewood và vẽ lại toàn bộ quá trình chứng minh.
Kết luận: Chứng minh này là hợp lệ.
Một khám phá bất ngờ
Trong khi mọi người đang thảo luận về bằng chứng của GPT-5.2 Pro, một người dùng có tên KoishiChan đã đưa ra một phát hiện bất ngờ trong phần bình luận:
Thực ra có một giải pháp đơn giản hơn cho vấn đề này, và hai định lý cần thiết đã tồn tại từ năm 1936 và 1966.
Đầu tiên là định lý hội tụ theo mật độ, được chính Harold Davenport và Erdős chứng minh vào năm 1936.
Thứ hai là định lý Rogers, được công bố lần đầu trong Chương 5 của chuyên khảo *Sequences* của Halberstam-Ross vào năm 1966. Kết hợp hai kết quả kinh điển này, bài toán 281 gần như là một phép chứng minh trực tiếp.
Điều này thật kỳ lạ. Chính Erdős là đồng tác giả của bài báo năm 1936 đó, vậy mà khi ông đặt câu hỏi vào năm 1980, ông lại không nhận ra câu trả lời đã ở rất gần.
Terence Tao đã gửi email trực tiếp cho nhà toán học người Pháp Tenenbaum để tham khảo ý kiến về vấn đề này.
Turnenbaum xác nhận rằng "vấn đề có thể được giải quyết ngay lập tức miễn là hai kết quả kinh điển mà bạn đã đề cập (định lý Davenport-Erdos và định lý Rogers) được thỏa mãn," nhưng ông cũng suy đoán rằng "cách đặt vấn đề có thể đã được sửa đổi ở một thời điểm nào đó." Tuy nhiên, chưa ai tìm thấy bất kỳ phiên bản nào khác của cách đặt vấn đề, vì vậy nó chỉ có thể được xử lý như hiện trạng.
Điều thú vị hơn nữa là, vào năm 2007, khi năm chuyên gia hàng đầu, bao gồm Firaseta, Ford, Konyakin, Pomerans và Yu, đang giải một bài toán Erdős khác, họ cũng không biết đến định lý Rogers cho đến khi Tnambaum nhắc nhở họ bổ sung nó vào.
Terence Tao than thở: "Định lý của Rogers chưa được phổ biến rộng rãi như nó xứng đáng. Nó chỉ xuất hiện trong cuốn sách của Halberstam-Ross mà không được xuất bản riêng, và có rất ít trích dẫn. Có lẽ cuộc thảo luận này sẽ giúp kết quả này được nhiều nhà nghiên cứu hơn nữa quan tâm, những người đang nghiên cứu về sàng và các lớp phủ đồng dư."
Cuối cùng, hiện đã có hai bằng chứng cho vấn đề này: một từ đường dẫn ergodic trong GPT-5.2 Pro, và một từ sự kết hợp các tài liệu kinh điển được KoishiChan tìm thấy.
Terence Tao xác nhận rằng hai chứng cứ này là "những chứng cứ khác nhau", mặc dù có một số điểm trùng lặp về khái niệm.
Làm thế nào để đánh giá tỷ lệ thành công thực sự của toán học trí tuệ nhân tạo?
Sau khi tin tức lan truyền, nhiều mô hình AI khác nhau đã được đưa vào để kiểm chứng chéo.
Gemini 3 Pro cho thấy bằng chứng hoàn hảo. Một nhà nghiên cứu khác đã sử dụng GPT-5.2 Pro để kiểm tra kỹ lưỡng các chi tiết của bằng chứng. Trí tuệ nhân tạo cho rằng khu vực duy nhất cần được kiểm tra chặt chẽ là bước thứ hai, có thể bỏ qua bằng cách sử dụng bổ đề Fatu và hoàn thành trực tiếp mà không cần kiểm tra tính ergodic.
Tuy nhiên, Terence Tao chỉ ra rằng hướng của bổ đề Fatu bị đảo ngược ở đây: Tôi vừa dạy xong môn lý thuyết đo lường cho sinh viên cao học, và tôi đã thấy quá nhiều lỗi như thế này.
Sau đó, người ta xác nhận rằng bổ đề đồ thị chuẩn được áp dụng cho tập hợp phần bù, chiều hướng là chính xác và chứng minh là hợp lệ.
Nhưng Terence Tao cũng đưa ra một lời nhắc nhở nghiêm túc. Ông viết:
Khi đánh giá tỷ lệ thành công thực sự của các công cụ AI, sai lệch thống kê lớn nhất đến từ sự thiên vị báo cáo, với những kết quả tiêu cực hầu như không bao giờ được công bố.
Nếu một cá nhân hoặc một công ty AI sử dụng các công cụ để giải quyết một vấn đề chưa được giải quyết nhưng không đạt được tiến bộ nào, họ sẽ không có động lực báo cáo kết luận tiêu cực; ngay cả khi báo cáo, thông tin đó cũng khó có thể lan truyền trên mạng xã hội nhiều như một kết quả tích cực.
Mặc dù phần lớn các bài toán này tập trung ở mức độ dễ, điều đó không nhất thiết có nghĩa là bài toán Erdős có độ khó trung bình đã nằm trong khả năng của AI.
Ông đề xuất một dự án mã nguồn mở do Paata Ivanisvili và Mehmet Mars Seven khởi xướng, dự án này ghi lại một cách có hệ thống các kết quả tích cực và tiêu cực của các mô hình ngôn ngữ lớn tiên tiến đối với bài toán Erdős.
Dữ liệu cho thấy các công cụ này chỉ có tỷ lệ thành công thực tế khoảng một đến hai phần trăm trong việc giải quyết vấn đề Erdős.
Tuy nhiên, nếu xét đến việc có hơn 600 bài toán chưa được giải quyết trong thư viện bài toán, tỷ lệ này vẫn thể hiện một con số đóng góp đáng kể và đặc biệt cho trí tuệ nhân tạo.
Liên kết tham khảo:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812
Bài viết này được đăng tải từ tài khoản WeChat công cộng "Quantum Bit" , tác giả: chuyên về công nghệ tiên tiến, được xuất bản với sự cho phép của 36Kr.




