GPT-5 đang viết lại các quy tắc khám phá khoa học! Một bài báo quan trọng tiết lộ rằng GPT-5 đã giải được một bài toán NP-khó lượng tử chỉ trong 30 phút, một kỳ tích mà con người phải mất 1-2 tuần mới làm được. Với tốc độ tiến bộ này, AI không còn xa để đạt được những đột phá mang tầm vóc Nobel.
Vài ngày trước, GPT-5 đã vượt qua thành công "bài kiểm tra Gödel" và giải quyết được ba giả thuyết toán học quan trọng.
Không ngờ lần này, GPT-5 lại một lần nữa “chinh phục” được những bài toán khó trong lĩnh vực lượng tử.
Chuyên gia máy tính lượng tử Scott Aaronson đã lần đầu tiên công bố một bài báo, chứng minh rằng một trong đó những vấn đề cũ đã được giải quyết với sự trợ giúp của GPT-5.
Trong bài báo, Scott đã nghiên cứu rất kỹ về một vấn đề cốt lõi trong điện toán lượng tử - phạm trù độ phức tạp QMA, có thể được gọi là "phiên bản lượng tử của bài toán NP".
Điều quan trọng nằm trong đó xác suất lỗi trong quá trình chứng minh có thể giảm vô hạn hay không, và đặc biệt là liệu có thể đạt được tính hoàn chỉnh hoàn hảo hay không.
Địa chỉ bài báo: https://arxiv.org/pdf/2509.21131
Các nghiên cứu học thuật trước đây đã giảm lỗi xuống mức rất thấp, nhưng nghiên cứu mới nhất phát hiện ra rằng "lỗi mũ kép" là giới hạn lý thuyết của phương pháp hiện có và không thể cải thiện thêm được nữa.
Sau khi gặp trở ngại trong liên kết suy luận chính, tác giả bắt đầu tìm kiếm sự trợ giúp từ GPT-5. Ban đầu, AI đã đưa ra những ý tưởng sai lầm.
Nhưng sau khoảng 30 phút tương tác, cuối cùng nó đã đưa ra một hàm toán học thông minh có thể phân tích chính xác hành vi giá trị riêng.
Nghiên cứu đã chỉ ra rằng ý tưởng này đã trở thành bước đột phá quan trọng nhất trong bài báo.
Trong bài đăng trên blog mới nhất, Scott đã bày tỏ sự kinh ngạc của mình: “Nếu bất kỳ học sinh nào nghĩ ra ý tưởng này, tôi chắc chắn sẽ khen ngợi người đó – nó thực sự tuyệt vời!”
Vấn đề này ước tính mất 1-2 tuần nhân lực để hoàn thành
Nhà khoa học Sebastien của OpenAI và giám đốc sản phẩm Kevin đã hào hứng chia sẻ lại bài đăng này và nói rằng "một sự thay đổi lớn đã bắt đầu".
Phiên bản lượng tử của các bài toán NP: điểm kỳ dị QMA
Bài báo này, được gửi tới arXiv vào ngày 25, chủ yếu nghiên cứu những hạn chế của khuếch đại hộp đen trong lớp phức tạp lượng tử "QMA".
Vậy QMA là gì?
QMA, hay Quantum Merlin Arthur, có thể được coi là phiên bản lượng tử điển hình của NP.
Nó bao gồm một lớp các vấn đề quyết định:
Nếu câu trả lời là "có", Merlin có thể gửi cho Arthur một trạng thái chứng kiến lượng tử mà Arthur có thể chấp nhận với xác suất ít nhất là 2/3 (sau khi tính toán lượng tử theo thời gian đa thức);
Nếu câu trả lời là "không", bất kể Merlin cử nhân chứng nào, khả năng Arthur chấp nhận câu trả lời cũng chỉ là 1/3.
Ở đây, giống như thường lệ trong lý thuyết phức tạp, các hằng số 2/3 và 1/3 chỉ là các quy ước và có thể được thay thế bằng cách mở rộng lên, chẳng hạn như 1-2⁻ⁿ và 2⁻ⁿ.
Một câu hỏi tồn tại từ lâu trong lĩnh vực này là:
QMA có tương đương với QMA₁, trong đó QMA₁ là một lớp con của QMA cho phép các giao thức được "hoàn thiện một cách hoàn hảo" không?
Năm 2008, Scott Aaronson đã sử dụng phương pháp phân tích thực tế để chứng minh sự tồn tại của "oracle tri lượng tử" sao cho QMA≠QMA₁.
Điều này có nghĩa là bất kỳ nỗ lực nào nhằm chứng minh QMA=QMA₁ đều yêu cầu "công nghệ phi tương đối hóa lượng tử".
Điều này sụp đổ có nghĩa là trở ngại này không thể vượt qua, nhưng nó cho thấy tính phức tạp của vấn đề.
Đột phá: Giới hạn khuếch đại hàm mũ kép
Phải đến tháng 6 năm nay, Freek Witteveen và Stacey Jeffery mới công bố một bài báo quan trọng chứng minh rằng giao thức QMA có thể được khuếch đại thông qua phương pháp hộp đen, khiến lỗi hoàn thiện đạt đến "nhỏ gấp đôi theo cấp số nhân", tức là 1/exp(exp(n)).
Địa chỉ bài báo: https://arxiv.org/pdf/2506.15551
Họ áp dụng một phương pháp mà Scott chưa từng cân nhắc: mã hóa xác suất chấp nhận theo biên độ của trạng thái lượng tử và các biên độ này giảm dần theo chuỗi cấp số nhân.
Sự thật đã chứng minh rằng QMA, một “người bạn cũ” mà chúng ta đã quen biết trong 25 năm, vẫn có thể mang đến những điều bất ngờ.
Trong một cuộc họp trực tuyến vào tháng 8, Scott đã hỏi:
Liệu độ hoàn thiện theo cấp số nhân kép này có phải là giới hạn của công nghệ hộp đen không? Liệu nó có thể được khuếch đại thêm lên cấp số nhân ba, tức là 1/exp(exp(exp(n))).
30 phút để chinh phục GPT-5 và đạt điểm cao
Một tuần sau, Scott và Freek đã hợp tác để viết một bằng chứng hoàn chỉnh, cho thấy rằng theo công nghệ hộp đen, lỗi hoàn chỉnh nhỏ theo cấp số nhân gấp đôi chính là giới hạn.
Nói cách khác, họ đã định lượng kết quả phân tách oracle “QMA≠QMA₁” năm 2008 và “giới hạn dưới” thu được hoàn toàn khớp với sự đồng thuận trong bài báo tháng 6.
Có lẽ phần hấp dẫn nhất của nghiên cứu này không phải là độ phức tạp lượng tử mà là nhân vật của AI trong trong đó .
Như đã đề cập trước đó, đây là bài báo đầu tiên của Scott Aaronson trong đó bước kỹ thuật quan trọng trong quá trình chứng minh các kết quả chính của bài báo đến từ AI.
Cụ thể hơn, đó là GPT5-Thinking.
Vào thời điểm đó, vấn đề mà tác giả gặp phải là: phân tích ma trận Hermitian E(θ) N×N (ví dụ, N=2ⁿ), trong đó mỗi phần tử là đa thức lượng giác lần poly(n) đối với tham số thực θ.
Điều cần chứng minh là giá trị riêng lớn nhất của E(θ) khi θ thay đổi từ 0 đến 1, để chứng minh rằng λₘₐₓ(E(θ)) không thể bắt đầu từ một giá trị gần 0 rồi "duy trì" gần 1 trong một thời gian dài, ví dụ gần 1/exp(exp(exp(n))).
Nếu Scott và các đồng tác giả có 1-2 tuần để xem xét tài liệu, họ có thể giải quyết được vấn đề này.
Nhưng anh ấy đã chọn GPT5-Thinking, và năm phút sau, nó đã đưa ra một câu trả lời tự tin nhưng rõ ràng là sai.
Scott không cười AI, mà chỉ ra chỗ sai của nó. Sau một hồi suy nghĩ, GPT5-Thinking thử lại và đưa ra một giải pháp tốt hơn.
Và như vậy, sau lần lần lặp lại, giống như một cuộc trao đổi giữa sinh viên sau đại học và đồng nghiệp, GPT-5 đã đưa ra chức năng sau:
Nó chỉ ra một cách chính xác rằng đây là một hàm hữu tỉ có bậc có thể kiểm soát được trong θ và nó mã hóa thông tin về mức độ gần của giá trị riêng lớn nhất λₘₐₓ(E(θ)) với 1.
May mắn thay, phương pháp này hiệu quả và việc xác minh có thể dễ dàng hoàn thành mà không cần sự trợ giúp của AI.
Scott cho rằng có lẽ GPT5 đã thấy một cấu trúc tương tự ở đâu đó trong dữ liệu đào tạo, nhưng nếu đó là giải pháp do một sinh viên đề xuất, anh ấy sẽ không ngần ngại gọi nó là "khéo léo".
Cuối cùng, ông nhớ lại rằng một năm trước, ông đã cố gắng giải quyết một vấn đề tương tự bằng mô hình lý luận GPT vào thời điểm đó và kết quả không mấy khả quan.
Bây giờ là tháng 9 năm 2025 và tôi có thể nói rõ với bạn rằng -
AI đã bắt đầu thực sự đi sâu vào cốt lõi mà tôi cho rằng là đặc trưng nhất của trí thông minh con người: chứng minh sự tách biệt giữa các lớp phức tạp lượng oracle.
Công cụ này vẫn chưa có khả năng tự viết toàn bộ một bài nghiên cứu, nhưng nếu bạn biết mình đang làm gì và nó có thể giúp bạn thoát khỏi rắc rối thì đây là một ứng dụng tuyệt vời.
Ai biết tình trạng này sẽ kéo dài bao lâu?
Scott Aaronson nói đùa: "Nghĩ đến điều này, tôi không khỏi cảm thấy may mắn vì vẫn có một công việc ổn định - một vị trí có thời hạn."
Tham khảo:
https://scottaaronson.blog/?p=9183
https://x.com/SebastienBubeck/status/1972368891239375078
https://x.com/kimmonismus/status/1972399015825203463
Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, biên tập: Taozi và được 36Kr cấp phép xuất bản.