Vị cha đẻ 88 tuổi của ngành thuật toán đã vô cùng kinh ngạc: Claude, hợp tác với GPT, đã giải quyết một vấn đề tồn tại suốt 30 năm chỉ với một bài báo dài 14 trang mà không cần chỉnh sửa gì thêm.

Bài viết này được dịch máy
Xem bản gốc

[Giới thiệu] Bài toán phân tích thừa số Hamilton cuối cùng đã được giải quyết! "Ông tổ của các thuật toán" 88 tuổi, Donald Knuth, đã công bố một bài báo khác, với sự hợp tác giữa Claude 4.6 và GPT-5.4 để giải quyết trường hợp chẵn-lẻ. Hơn nữa, GPT-5.4 đã trực tiếp công bố một bài báo dài 14 trang, và bài báo này đã lan truyền rộng rãi trên mạng.

Cuối cùng thì người đàn ông 88 tuổi cũng đã lấp đầy được cái hố mà chính ông ta tự đào hồi đó!

Ba tuần trước, Donald Knuth, "cha đẻ của thuật toán" và người trẻ nhất từng đoạt giải Turing, đã vô cùng kinh ngạc trước Claude: một bài toán thuật toán lâu đời đã được Claude Opus 4.6 giải quyết.

Ngay từ đầu bài báo, ông ấy đã thốt lên: " Thật sốc! Thật sốc !"

Link bài báo: https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

Tuy nhiên, nghiên cứu sâu hơn cho thấy thực tế có tới 760 phương pháp phân rã tương tự, và Claude chỉ tìm ra một trong đó.

Nó chỉ chinh phục được "pháo đài" nơi m là số lẻ; đối với trường hợp m là số chẵn, vẫn chưa có lời giải tổng quát .

Bài báo được cập nhật cho thấy đã có những tiến bộ đáng kể trong việc giải quyết vấn đề này!

GPT-5.4 Pro kế thừa từ Claude , trực tiếp xuất ra các bài báo 14 trang cho tất cả các số chẵn m≥8 và xác minh trường hợp lên đến m=2000 thông qua tính toán.

Hơn nữa, sau khi GPT và Claude hợp tác, một phương pháp đơn giản hơn để xây dựng các số lẻ và số chẵn m đã được tìm ra thông qua quy trình làm việc đa tác nhân.

Một số người cũng đã sử dụng ngôn ngữ Lean để chính thức hóa chứng minh của Claude về trường hợp lẻ.

Như vậy, bài toán phân rã Hamilton đã được giải quyết hoàn toàn.

Từ Claude 4.6 đến GPT-5.4, và với những nỗ lực chung của nhiều nhà lãnh đạo trong ngành, rào cản kéo dài hàng thập kỷ cuối cùng đã được vượt qua.

Cuối bài viết, ông lão xúc động nhận xét—

Chúng ta quả thực đang sống trong một thời đại rất thú vị. Cầu mong Thần Lực luôn ở bên bạn.

Nhà tiên phong 88 tuổi trong lĩnh vực thuật toán đã tự đào một cái hố khổng lồ.

Trong tổ hợp học, đường đi Hamilton luôn được xem như một pháo đài dễ phòng thủ nhưng khó tấn công.

Nói một cách đơn giản, điều này đòi hỏi phải tìm một vòng khép kín trong một mạng đồ thị phức tạp đi qua mọi nút mà không lặp lại bất kỳ nút nào khác.

Mặt khác, bài toán phân rã Hamilton nhằm mục đích phân rã hoàn hảo một đồ thị thành nhiều chu trình như vậy. Đây không chỉ là một trò chơi về độ phức tạp tính toán, mà còn là một thử thách cực kỳ khó khăn đối với khả năng xây dựng toán học.

Cái hố này do chính Knuth đào.

Trong quá trình viết nên tác phẩm đồ sộ về khoa học máy tính, Nghệ thuật lập trình máy tính (The Art of Computer Programming - TAOCP), phép phân rã Hamiltonian luôn là một "giải pháp tạm thời" mà ông luôn ghi nhớ.

Vấn đề này đã không được giải quyết trong nhiều thập kỷ và có thể được mô tả bằng thuật ngữ kỹ thuật như sau:

Trước đây, giới học thuật chưa thể đưa ra một giải pháp hoàn chỉnh bao trùm cả số lẻ và số chẵn.

Khi nút tăng lên, không gian tìm kiếm bùng nổ theo cấp số nhân, và bộ não con người thường cảm thấy bất lực về mặt sinh lý khi đối mặt với bóng tối độ sâu như vậy.

Trong ba mươi năm qua, vô số thiên tài đã cố gắng lấp đầy những khoảng trống, nhưng hầu hết đều thất bại ở tuyến phòng thủ cuối cùng của "tất cả các giải pháp chẵn và lẻ".

Cho đến mùa xuân năm 2026, Knuth quyết định chuyển sang sử dụng một loại vũ khí khác.

Có lời giải nào cho số chẵn m không?

Trong tác phẩm cuối cùng của Claude, Opus 4.6, sau lần lần thử nghiệm, một bộ quy tắc đơn giản cuối cùng đã được đề xuất—

s = (i + j + k) mod m

Dựa trong đó các điều kiện của s, i và j, chúng ta sẽ quyết định tăng i, tăng j, hay tăng k theo các quy tắc sau:

Nếu s=0, hướng chuyển động được xác định bởi giá trị của j. Nếu 0<s <m−1, hướng được xác định bởi giá trị của i. Nếu s=m−1, một quy tắc khác được sử dụng.

Kết quả là, Claude đã xác minh thông qua chương trình rằng các đường dẫn hợp lệ khi m=3,5,7,9,11.

Như chúng ta thấy, Claude chỉ giải được trường hợp m là số lẻ; ông ấy vẫn chưa tìm ra lời giải thực sự cho trường hợp m là số chẵn.

Ngày 3 tháng 3, Filip Stappers viết thư cho ông lão và nói rằng, "Câu chuyện này còn nhiều điều chưa kể."

Stappers lại sử dụng Claude Opus 4.6 cho các số chẵn của m, và sau khoảng 4 giờ tính toán, cuối cùng ông cũng đạt được một số tiến bộ, nhưng vẫn chưa có lời giải hoàn chỉnh.

Cuối cùng, Claude đã xây dựng một cấu trúc sợi cục bộ tương tự như trường hợp hiếm gặp, và sau đó hoàn thiện nó bằng cách thực hiện tìm kiếm.

Ở giai đoạn cuối, nó dành phần lớn thời gian để "tăng tốc quá trình tìm kiếm" thay vì tìm ra một phương pháp xây dựng thực sự.

Nó đã chạy nhiều chương trình, cố gắng tìm ra giải pháp bằng cách sử dụng các thuật toán "ủ nhiệt" hoặc "quay lui" mô phỏng.

Theo gợi ý của Stappers, Claude được hướng dẫn sử dụng ORTools CP-SAT (một phần của bộ công cụ mã nguồn mở của Google, với các ràng buộc AddCircuit) để giải quyết vấn đề, và một điều kỳ diệu đã xảy ra.

Các chương trình hiện đại có thể cho ra kết quả chỉ trong vài giây!

Sau đó, vào ngày 4 tháng 3, Ho Boon Suan, một người bạn từ Singapore, đã mang đến một tin tức còn gây sốc hơn nữa.

Ông đã sử dụng gpt-5.3-codex để tạo ra một đoạn mã thực hiện thành công việc phân tích các số chẵn m≥8.

Để kiểm chứng độ tin cậy, ông đã thử nghiệm tất cả các số chẵn m từ 8 đến 200, cũng như một số số chẵn ngẫu nhiên từ 400 đến 2000, và kết quả đều chính xác.

Hãy nhớ rằng khi m=2000, đó là một cấu trúc đồ thị khổng lồ với 8 tỷ đỉnh!

Nếu chỉ dựa vào nỗ lực của con người, việc chứng minh tính đúng đắn thông qua tính toán thủ công sẽ hoàn toàn là điều viển vông.

Gần như cùng lúc đó, Kim Morrison từ cộng đồng Lean đã hành động cực kỳ nhanh chóng.

Ông đã chính thức hóa và kiểm chứng lại bằng chứng trước đó của mình rằng cách xây dựng của Claude là chính xác, và nhanh chóng đăng tải nó lên mạng vào ngày 4 tháng 3.

Những thiên tài toán học, tập trung lại với nhau trong nghiên cứu.

Một nhà nghiên cứu nặc danh khác, có tên là "Exocija," đã tìm ra một cấu trúc mới hoạt động được với các số lẻ m.

Xét từ góc độ tính toán thuần túy, đây có lẽ là giải pháp đơn giản nhất hiện có, mặc dù chứng minh của nó có thể không phải là đơn giản nhất.

Trong lập trình C, việc phân tách hiệu quả có thể đạt được bằng cách đơn giản thay thế một vài dòng mã cụ thể bằng mã logic cực kỳ ngắn gọn.

Hơn nữa, hầu như mọi bước khéo léo sử dụng phép thế đồng nhất "012".

  • nếu (s == 0) d = (j == m - 1 ? "201" : "021");
  • ngược lại nếu (s == m - 1) thì d = (j == 0 ? "102" : "120");
  • Ngược lại, d = "012";

Anh ấy đã làm điều đó như thế nào? Câu trả lời là: sự hợp tác giữa các mô hình khác nhau.

Exocija liên tục dán văn bản giữa hai mô hình hàng đầu, GPT-5.4 và Claude 4.6 Sonnet, sử dụng các chiều tư duy khác nhau của chúng để truyền cảm hứng cho nhau, và cuối cùng đã thành công ghép nối lại thành một bằng chứng hoàn chỉnh.

Không có chỉnh sửa nào, bài báo 14 trang được xuất trực tiếp từ GPT-5.4.

Đỉnh điểm thực sự liên quan đến việc xây dựng các số chẵn m vẫn chưa đến.

Vì thuật toán được tạo ra bởi gpt-5.3-codex quá phức tạp, Ho Boon Suan quyết định đưa ra chỉ thị cuối cùng cho GPT-5.4 Pro:

Nhiệm vụ của bạn là chứng minh một cách chặt chẽ rằng thuật toán đã cho trước đó thực sự luôn tạo ra ba vòng lặp có độ dài m³ khi m là một số chẵn ≥ 8.

Tốt nhất là nên giải thích chi tiết lý do tại sao thuật toán này hoạt động và xem xét liệu có phương pháp xây dựng nào đơn giản hơn hay không.

Ai mà ngờ rằng GPT-5.4 Pro lại mang đến kết quả tuyệt vời đến vậy—

Một bài luận học thuật dài 14 trang, được trình bày đẹp mắt và lập luận chặt chẽ.

Từ phần "Tóm tắt" đến phần "Kết luận", cấu trúc được hoàn chỉnh, với sự chuyển tiếp liền mạch.

Hơn nữa, nó sử dụng chuẩn TeX, và chính Knuth là người phát minh ra TeX. Trí tuệ nhân tạo dường như đang bày tỏ lòng kính trọng đối với ông bằng ngôn ngữ này.

Quan trọng nhất, bài báo đã vượt qua bài kiểm tra của công cụ xác thực chính thức Lean.

Theo lời của chính Ho, đây là một kỳ tích được thực hiện hoàn toàn chỉ bằng phần mềm GPT-5.4 Pro; nó thậm chí không cần phải sửa đổi một dấu chấm câu nào!

Điều này có nghĩa là chuỗi logic của nó là "chân lý tuyệt đối" theo nghĩa toán học.

Trí tuệ nhân tạo "tự đấu tranh với chính nó", và Claude+GPT cuối cùng đã cung cấp bằng chứng hoàn hảo.

Đỉnh điểm của câu chuyện này chính là Keston Aquino-Michaels.

Phương pháp này không chỉ cung cấp một cách phân rã hiệu quả khác cho trường hợp m lẻ, mà còn cung cấp một cách phân rã thanh lịch cho trường hợp m chẵn, đơn giản hơn nhiều so với phương pháp trước đây.

Ngoài ra, ông cũng phát hiện ra một tham khảo quan trọng mà Knuth trước đó đã bỏ sót (tức là tham khảo cuối cùng trong hình bên dưới).

Bài báo chưa xuất bản: https://arxiv.org/abs/2203.11017

Đáng chú ý nhất, ông cũng đã phân tích tỉ mỉ mô hình tương tác hợp tác này, điều này có thể mang lại những ý nghĩa quan trọng đối với cách thức giải quyết các vấn đề mới trong tương lai.

  • Báo cáo đầy đủ: https://github.com/no-way-labs/residue/blob/main/paper/completing_claudes_cycles.pdf
  • Dự án mã nguồn mở: https://github.com/no-way-labs/residue
  • Tóm lại, Keston Aquino-Michaels không chỉ đơn thuần đặt câu hỏi cho trí tuệ nhân tạo; thay vào đó, ông đã xây dựng một "quy trình làm việc cộng tác" vô cùng khéo léo.

Đây giống như một bài tập hợp tác bao gồm các hệ thống dựa trên carbon và silicon, một sự hợp tác chặt chẽ giữa Claude, GPT và nhân loại.

Trong đó tác nhân hoạt động độc lập, sử dụng cùng một lời nhắc "Dư lượng".

Các từ khóa gợi ý khám phá có cấu trúc được sử dụng bởi hai tác nhân.

Nhưng mỗi bên đều có thể tận dụng thế mạnh của mình:

Đặc vụ O: Giải quyết vụ án số lẻ lần 5 bước tìm hiểu (chứng minh tượng trưng)

Đặc vụ C: Tìm các giải pháp cụ thể (dữ liệu) cho m=4, 6, 8, 10, 12.

Tuy nhiên, hai tác nhân này không giao tiếp trực tiếp; thay vào đó, họ giao tiếp thông qua một Bộ điều phối — dữ liệu và công cụ được truyền qua người chỉ huy (một Opus 4.6 do con người điều khiển).

Người điều phối cần xác định "khi nào truyền tải, truyền tải nội dung gì và truyền tải ở định dạng nào", điều mà chỉ hai tác nhân không thể thực hiện được.

Ví dụ, Đặc vụ O bị kẹt ở m=10 trong các trường hợp chẵn và không thể tiếp tục; Người điều phối chuyển giải pháp từ Đặc vụ C cho Đặc vụ O; khi nhận được giải pháp, Đặc vụ O ngay lập tức xác định được quy luật: m−2 lớp "lớp xử lý theo lô" + 2 lớp "lớp sửa chữa".

Cuối cùng, "giải pháp hoàn chỉnh cho các trường hợp chẵn lẻ" đã làm đau đầu nhân loại hàng thập kỷ cuối cùng đã được giải mã hoàn toàn trong cuộc chiến khốc liệt giữa hai trí tuệ nhân tạo.

Con người định hình chiến trường, máy móc lấp đầy vực sâu.

Việc "lấp đầy khoảng trống"lần đánh dấu một sự thay đổi hoàn toàn trong mô hình nghiên cứu khoa học.

Vai trò của các nhà khoa học đã thay đổi. Ví dụ, Knuth không còn là người thợ tính toán từng dòng mã trên giấy nữa; ông xác định phạm vi của vấn đề, thiết kế logic để kiểm chứng, và sau đó hướng dẫn trí tuệ nhân tạo lấp đầy khoảng trống của quá trình thử và sai.

Mô hình nghiên cứu đã thay đổi. Trước đây, con người là người xác định ranh giới, trong khi trí tuệ nhân tạo lấp đầy khoảng trống đó.

Khả năng quý giá nhất của các nhà toán học ngày nay không còn là tỷ lệ băm, mà chính là "trực giác để đặt câu hỏi" và "cảm nhận thẩm mỹ để kiểm chứng câu trả lời".

Trí tuệ nhân tạo (AI) chịu trách nhiệm tìm ra con đường thông qua quá trình thử và sai không ngừng, trong khi con người chịu trách nhiệm xác nhận cuối cùng xem đó có phải là chân lý mà chúng ta đang tìm kiếm hay không.

Ai tiếp theo?

Khi ngay cả một chuyên gia thuật toán 88 tuổi cũng bắt đầu sử dụng trí tuệ nhân tạo để lấp đầy những khoảng trống kiến ​​thức, chúng ta phải nhận ra rằng cách thức nghiên cứu toán học đang trải qua một sự chuyển đổi không thể đảo ngược.

Đây không chỉ là một chiến thắng dành cho Knuth, mà còn là một "nâng cấp vượt trội" cho trí tuệ con người.

Trong thời đại mà "máy móc đang chiến đấu với nhau", ngay cả những viện toán học danh tiếng nhất cũng đã mở cửa đón nhận trí tuệ nhân tạo.

Nếu bạn vẫn đang tự hỏi "Liệu trí tuệ nhân tạo có thay thế tôi?", thì có lẽ bạn đã bỏ lỡ cơ hội trở thành "kiến trúc sư trí tuệ" tiếp theo rồi.

Liệu vấn đề tồn tại hàng thế kỷ tiếp theo được trí tuệ nhân tạo giải quyết sẽ là giả thuyết Riemann hay lý thuyết trường thống nhất trong vật lý?

Trong "kỷ nguyên vô cùng thú vị" này, nỗi sợ hãi duy nhất của chúng ta nên là phớt lờ tốc độ tiến hóa này.

Tham khảo:

https://x.com/slow_developer/status/2038399555490791765

https://x.com/mubeitech/status/2038388810157826467

https://x.com/BoWang87/status/2037648937453232504

Bài viết này được lấy từ tài khoản chính thức WeChat "New Intelligence" , do KingHZ Peach biên tập và được đăng tải với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận