Thưa ngài Tổng thống, tòa tháp thứ tư của toán học sụp đổ!
Đêm qua, meme tổng thống thì thầm với ai đó đã gây ra một cuộc tranh luận nảy lửa trong giới học thuật Mỹ.
Bài toán số 281 của Paul Erdos đã được giải quyết bởi một "người ngoài" sử dụng trí tuệ nhân tạo thông qua phương pháp vét cạn.
Những đỉnh cao trí tuệ đáng kính nhất của nhân loại đã bị thu nhỏ lại thành một chú thích trong một meme. Các quy tắc của thế giới cũ đã sụp đổ.
Báo cáo trực tiếp: Vấn đề tồn tại cả thế kỷ đã được giải quyết bởi GPT-5.2
Đây không chỉ là hành vi bẻ khóa, mà là "xâm nhập trái phép".
Một "kẻ man rợ" cầm trên tay cụm tỷ lệ băm H100 đã đá tung cánh cửa dẫn vào tháp ngà.
Chỉ cần nhìn vào sơ yếu lý lịch của Neel Somani thôi cũng đủ khiến các nhà toán học truyền thống cảm thấy niềm tin của họ lung lay:
Từng là nhà nghiên cứu định lượng tại Citadel (một gã khổng lồ phố Wall nổi tiếng với giao dịch tần suất cao);
Cựu nhà sáng lập của Eclipse (một dự án blockchain hiệu năng cao trong hệ sinh thái Solana );
Đang tích cực khám phá sự giao thoa giữa trí tuệ nhân tạo và blockchain.
Anh ấy đến từ Eclipse và đắm mình trong thế giới phức tạp của crypto và blockchain. Trong thế giới của anh ấy, tỷ lệ băm là sức mạnh, và sự đồng thuận là chân lý.
Vào tháng 1 năm 2026, ông đã gây chấn động cộng đồng toán học với sự sùng bái tỷ lệ băm của Thung lũng Silicon — thông qua đầu tư hoặc hợp tác, ông đã quảng bá nền tảng ErdosProblems.com, biến kho tàng toán học đồ sộ mà Paul Erdős để lại thành một "cuộc săn tìm" mở.
Vũ khí của ông không phải là một bộ óc thiên tài, mà là chiếc GPT-5.2Pro.
Lý luận của Somani rất đơn giản và dễ hiểu: vì các chứng minh toán học có thể được hình thức hóa, nên về cơ bản chúng không khác gì khai thác Bitcoin .
Chỉ cần tôi có đủ card đồ họa và trí tuệ nhân tạo có thể kiểm tra và phát hiện lỗi đủ nhanh, tôi có thể sử dụng phương pháp tìm kiếm toàn diện để mở ra cánh cửa dẫn đến sự thật.
Và chuyện gì đã xảy ra? Anh ta thắng cược.
Chỉ vài ngày trước, như một thành tựu lớn của tháng thu hoạch này, GPT-5.2 đã giải quyết thành công Bài toán Erdős số 281.
Bài toán Erdős số 281, xuất phát từ công trình nghiên cứu năm 1980 của Erdős và Graham, tập trung vào hành vi cực đoan của "các hệ thống được bao phủ":
Cho một dãy số nguyên dương tăng vô hạn n₁<n₂<⋯, nếu với bất kỳ lớp dư aᵢmodnᵢ nào được chọn, toàn bộ tập hợp các số nguyên có thể được "bao phủ gần như hoàn toàn" bởi các lớp dư này (tức là mật độ các số nguyên không được bao phủ là 0), liệu có nhất thiết tồn tại một tiền tố hữu hạn k sao cho chỉ sử dụng k lớp dư đầu tiên, mật độ các số nguyên không được bao phủ có thể giảm xuống dưới một giá trị ε nhỏ tùy ý, và sự giảm này đúng một cách đồng nhất cho tất cả các lựa chọn lớp dư?
Bài toán này đã bị bế tắc suốt 46 năm, liên quan đến những công cụ phức tạp như lý thuyết duyệt và phép đo Haar trên các số nguyên hữu hạn.
Phần mềm GPT-5.2Pro của Somani cung cấp bằng chứng sử dụng lý thuyết ergodic, định lý ergodic trạng thái điểm và định lý Dini. Terence Tao nhận xét rằng cách tiếp cận này khá khác biệt so với bằng chứng Rogers/Davenport-Erdős đã biết.
Người dùng trên X cũng ca ngợi nó là "trí tuệ nhân tạo đầu tiên thực sự đạt đến trình độ tiến sĩ".
Đây đã là vấn đề thứ ba của Erdős bị GPT-5.2Pro giải quyết vào tháng 1 năm 2026.
Kể từ Giáng sinh, 15 bài toán trên ErdosProblems.com đã chuyển từ trạng thái "chưa giải quyết" sang "đã giải quyết", trong đó 11 bài toán chỉ rõ sự tham gia của trí tuệ nhân tạo.
Terence Tao thậm chí còn tạo một trang wiki riêng để ghi lại "những đóng góp của AI vào bài toán Erdős".
https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com
Cộng đồng toán học đã chuyển thẳng từ câu hỏi "liệu điều đó có xảy ra hay không" sang giai đoạn hoảng loạn "nó sẽ đến nhanh như thế nào và sẽ cuốn trôi những gì".
Somani đang chứng minh cho cả thế giới thấy rằng bạn không cần phải hiểu vẻ đẹp của toán học; miễn là bạn có đủ điện và GPU hoạt động hết công suất, bạn có thể đạt được "chén thánh" của toán học.
Tuy nhiên, giữa bầu không khí hân hoan này, nếu bạn xem xét dữ liệu hậu trường do Somani công bố, bạn sẽ thấy rằng thực chất ẩn sau "chiến thắng" này là một vùng đất hoang tàn đầy rẫy xác chết.
Các cơ sở dữ liệu đầy rẫy xác chết
Neel Somani đã thắng, nhưng đó là một chiến thắng rất xấu xí.
Đăng nhập vào ErdosProblems.com và tắt bộ lọc "Chỉ hiển thị các thành công". Bạn sẽ thấy hàng ngàn "thất bại" nằm im ở phía sau.
Theo số liệu thống kê thực tế từ cơ sở dữ liệu, tỷ lệ vượt qua bài kiểm tra loại này của GPT-5.2 Pro ngay lần đầu tiên chỉ đạt từ 1% đến 2%.
Điều này có nghĩa là, để đạt được bằng chứng hoàn hảo nhằm gây chú ý trên các trang báo, AI đã lặp đi lặp lại hàng trăm hoặc hàng nghìn lần trong nền.
Nó có thể tạo ra những bổ đề không tồn tại, mắc kẹt trong các vòng lặp logic, và thậm chí biến các chứng minh toán học thành những câu thơ vụng về.
Nếu chỉ có một phiên bản GPT-5.2 duy nhất, thì đống rác rưởi này đã nhấn chìm cộng đồng toán học từ lâu rồi.
Do đó, trong trò chơi này, MVP thực sự không phải là GPT mà là một công cụ lạnh lùng bị công chúng bỏ qua - "Aristotle".
Aristotle thực chất là một công cụ chuyên dụng được phát triển bởi Harmonic. Nó dịch tự động và chuyển đổi bắt buộc đầu ra ngôn ngữ tự nhiên của GPT (thường là vô nghĩa) thành ngôn ngữ dạng Lean, sau đó chuyển giao cho nhân Lean để kiểm tra nghiêm ngặt.
Điều này tương đương với việc trang bị cho AI một hệ thống biên dịch và kiểm thử đơn vị tự động cho phép "thử và sai không giới hạn và không chấp nhận lỗi".
Nếu không có nó, tỷ lệ thành công từ 1% đến 2% của GPT sẽ không bao giờ được biết đến.
Quy trình giải quyết vấn đề bằng trí tuệ nhân tạo hiện nay đang ngày càng được chuẩn hóa. GPT đoán mò một cách điên cuồng → Phương pháp chính thức hóa bắt buộc và loại bỏ rác thải của Aristotle → Quy trình xác minh tinh gọn đã vượt qua → xem xét của con người.
Một lần, lần, mười nghìn lần. Aristotle chỉ cho phép họ vượt qua khi xuất hiện "người sống sót" cực kỳ hiếm hoi đó.
Điều mà công chúng coi là "phép màu" thực chất là một điều tất yếu về mặt thống kê.
Terence Tao đã nói trúng trọng tâm vấn đề trong cuốn sách Mastodon. Ông từ chối sử dụng thuật ngữ "Trí tuệ" và thay vào đó đặt ra một thuật ngữ mới: "Sự thông minh tổng quát nhân tạo".
Hãy lưu ý từ này: sự khôn ngoan nhỏ nhặt.
Nó giống như một học sinh nghèo không bao giờ nghe giảng hay hiểu sách giáo khoa, nhưng bằng cách nào đó lại đoán ra được đáp án của một bài toán toán học nâng cao bằng cách gian lận và thử mọi cách.
Và đó chính xác là điều NeelSomani muốn. Đối với những người "khai thác", miễn là họ có thể đào được vàng, thì ai quan tâm đến việc máy khai thác có hiểu về địa chất hay không?
Tuyến phòng thủ cuối cùng: Con người chỉ có trách nhiệm "đặt câu hỏi", chứ không còn trách nhiệm "cung cấp câu trả lời".
Vậy, các nhà toán học con người có sẽ mất việc không?
Không nhất thiết. Nhưng công việc của họ sẽ trải qua một Đột biến hoàn toàn.
Trong phiên bản cấp tiến của Neel Somani, nghiên cứu toán học không còn là những lời tụng niệm của các nghệ sĩ, mà là bản thiết kế của các kiến trúc sư.
Trước đây, các nhà toán học phải đích thân xuống hầm mỏ, đào bới tìm kiếm chân lý từng chút một bằng cuốc chim. Giờ đây, GPT-5.2 đã thay thế chiếc cuốc chim đó.
Đặc quyền duy nhất còn lại và tuyến phòng thủ cuối cùng của nhân loại được gọi là "xác định vấn đề".
Bạn cần phải nói với con AI thợ đào điên rồ đó: Khai thác ở đâu? Khai thác cái gì? Và quan trọng nhất là tại sao việc khai thác lại đáng giá?
Nghe có vẻ như đây là một sự thăng tiến, từ "thợ đào" lên "nhà thầu". Nhưng đằng sau đó là một mối lo ngại lớn: chúng ta đang mất kiểm soát về "lý do tại sao".
Khi GPT-5.2 đưa cho bạn một đoạn mã chứng minh Lean dài hàng nghìn dòng, Aristotle sẽ nói với bạn "đúng rồi", nhưng có lẽ bạn sẽ không hiểu chuyện gì đang diễn ra ở giữa.
Nhìn bề ngoài, nhân loại đã được nâng tầm từ "thợ đào" lên "nhà thầu". Nhưng trên thực tế, chúng ta đang đánh mất quyền giải thích "tại sao".
Toán học từng là ngôn ngữ mà nhân loại dùng để hiểu vũ trụ, theo đuổi sự thanh lịch và đơn giản tối thượng.
Dưới sự thống trị của trí tuệ nhân tạo, toán học có thể trở thành một mớ hỗn độn logic, đúng nhưng thiếu tính thẩm mỹ.
Đây có thể là cái giá phải trả cho điều mà Terence Tao gọi là "sự thông minh". Chúng ta đánh đổi tỷ lệ băm để lấy hiệu quả, nhưng lại giao phó nhiệm vụ thấu hiểu cho máy móc.
Dĩ nhiên, Terence Tao cũng nhiều lần nhấn mạnh rằng hầu hết các bài toán Erdős mà AI có thể giải quyết nhanh chóng đều thuộc loại "bài toán đơn giản nhất" - loại bài toán có thể giải quyết bằng các công cụ tiêu chuẩn, nhưng trước đây chưa ai bận tâm kết hợp chúng lại với nhau.
Trí tuệ nhân tạo vẫn chưa thể chạm tới hàng tá lĩnh vực thực sự khó khăn nhất (chẳng hạn như những lĩnh vực đòi hỏi những ý tưởng hoặc đối tượng hoàn toàn mới).
Vấn đề là khi tỷ lệ băm nhân với mô hình tiếp tục tăng theo cấp số nhân, những gì "khó nhằn nhất" ngày hôm qua có thể trở thành "dễ dàng nhất" ngày mai. Đây không phải là kết thúc, mà chỉ là sự tăng tốc.
Tờ séc trị giá 500 đô la đã được thuật toán của Neel Somani rút tiền.
Số tiền không nhiều, nhưng cái giá phải trả thì rất cao. Nó đã làm mất đi sự kỳ diệu của thiên tài và phá vỡ những tàn tích cuối cùng của sự thiêng liêng trong toán học.
Sự thật không còn là lời thì thầm của Chúa nữa; nó chỉ là một dòng mã được phun ra từ các quạt của máy chủ sau khi chúng quay điên cuồng.
Từ đó trở đi, điều quyết định sự thật không còn là trình độ trí tuệ, mà là số lượng card đồ họa.
Hãy tỉnh dậy! Thời đại Khám phá đã kết thúc, và Cách mạng Công nghiệp đã bắt đầu.
Động cơ hơi nước làm giảm giá trị của sức mạnh cơ bắp, điện năng làm giảm giá trị của khoảng cách, và các cụm GPU ngày nay đang làm giảm giá trị của "sự khan hiếm trực giác toán học".
Mục tiêu tiếp theo được khai thác có thể không phải là bài toán Erdős, mà là một bài toán tối ưu hóa công nghiệp trị giá 50 triệu đô la, hoặc một định lý quan trọng trong thiết kế phân tử thuốc đã bị bế tắc suốt hai mươi năm.
Tháp ngà toán học sụp đổ— giống như meme lời thì thầm của tổng thống, ngành của bạn có thể là nạn nhân tiếp theo.
Tham khảo:
https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/
https://www.erdosproblems.com/forum/thread/281
https://x.com/neelsomani/status/2012695714187325745
https://mathstodon.xyz/@tao/115911902186528812
https://www.erdosproblems.com/forum/thread/281#post-3327
Bài viết này được đăng tải từ tài khoản WeChat chính thức "New Zhiyuan" , tác giả: New Zhiyuan, biên tập viên: Qingqing, và được xuất bản với sự cho phép của 36Kr.





