ChatGPT đã chứng minh đây là một vấn đề tồn tại suốt sáu năm; người đoạt giải Turing nói: "Còn quá sớm để ăn mừng."

06-08

Bài viết này được dịch máy

Xem bản gốc

Một trong những lời chỉ trích gay gắt nhất trong giới học thuật là:

Tác phẩm này vừa mang tính đột phá vừa xuất sắc.
Đáng tiếc là những điểm tốt lại không mới lạ, còn những điểm mới lạ thì lại không hay.

Nhưng Richard Sutton, một trong những người sáng lập ra học tăng cường, tác giả cuốn sách giáo khoa "Học tăng cường" và người đoạt giải Turing, đã hướng câu nói đùa này vào toàn bộ lĩnh vực trí tuệ nhân tạo tạo sinh.

Ông nói: "Đánh giá này áp dụng cho hầu hết các loại trí tuệ nhân tạo mà chúng ta quen thuộc hiện nay."

Trí tuệ nhân tạo: Những phần hay thì không mới lạ, còn những phần mới lạ thì lại không hay.

Luận điểm cốt lõi của Sutton vô cùng ngắn gọn, ngắn gọn đến mức gần như tàn nhẫn.

Trí tuệ nhân tạo tạo sinh về bản chất là học có giám sát.

Nguyên tắc của học có giám sát là cung cấp cho mô hình lượng lớn các mẫu do con người tạo ra để nó có thể học cách bắt chước chúng.

Càng bắt chước chính xác, điểm càng cao.

Vấn đề là ở chỗ này.

Khi một mô hình tạo ra nội dung hoàn toàn dựa trên dữ liệu huấn luyện, chất lượng đầu ra sẽ cao vì nó tái tạo lại những thứ mà con người đã xác nhận. Nhưng điều này không phải là mới lạ. Nó chỉ đơn giản là đóng gói lại những thứ mà con người đã biết theo các hoán vị và tổ hợp khác nhau.

Chất lượng giảm khi mô hình cố gắng đi chệch khỏi dữ liệu huấn luyện và tạo ra nội dung thực sự mới. Điều này là do nó thiếu bất kỳ cơ chế nội bộ nào để đánh giá xem "thứ mới này tốt hay xấu". Nó chỉ tạo ra chứ không đánh giá.

Đây là mâu thuẫn về cấu trúc:

Trong khuôn khổ học tập có giám sát thuần túy, tính mới lạ và chất lượng là hai mặt đối lập của một chiếc bập bênh.
Nếu bạn ấn một đầu xuống, đầu kia sẽ bật lên.

Đây không phải là vấn đề kỹ thuật. Không thể giải quyết nó bằng cách đơn giản là thêm dữ liệu, mở rộng mô hình hoặc thêm GPU.

Sutton đã sử dụng một phép so sánh gây sốc: "ảo ảnh" - khuyết điểm bị chỉ trích nhiều nhất của các mô hình lớn - về bản chất là một sản phẩm phụ của nỗ lực "mới lạ" của mô hình đó.

Sự ác cảm của chúng ta đối với ảo ảnh chứng minh một điều: chúng ta thực sự không cần sự mới lạ. Chúng ta chỉ muốn những bản sao chất lượng cao.

"Những điều tốt đẹp thường không phải là độc đáo, và những điều độc đáo thì không tốt."

Lời nhận xét gay gắt của nhà phê bình trong câu chuyện cười đó thực chất đã mô tả chính xác những hạn chế vốn có của trí tuệ nhân tạo tạo sinh.

Việc "khám phá" thực sự đòi hỏi ba thiết bị.

Bắt đầu từ những nguyên tắc cơ bản, Sutton đã phân tích chi tiết "công thức bộ ba" của sự sáng tạo:

Khám phá thực sự = Đột biến+ đánh giá+ giữ lại có chọn lọc.

Mọi sự sáng tạo và khám phá đích thực đều cần ba bước, không bước nào có thể bỏ qua:

1. Đột biến là khả năng tạo ra sự đa dạng. Nó có thể ngẫu nhiên, hoặc có thể dựa trên kiến thức hiện có, nhưng phải có sự không chắc chắn thực sự—nếu không thì đó không phải là khám phá, mà chỉ là tra cứu bảng biểu.
2. Đánh giá: Xác định Đột biến nào có giá trị. Điều này đòi hỏi một mục tiêu rõ ràng hoặc một tiêu chuẩn có thể xác định được "tốt" và "xấu".
3. Việc lưu giữ có chọn lọc giúp bảo tồn Đột biến có giá trị để chúng có thể ảnh hưởng đến các hành động và quá trình học tập trong tương lai.

Ba bước này không phải là phát minh của Sutton. Chúng là logic của chọn lọc tự nhiên, logic của phương pháp khoa học và logic của quá trình học tập của con người.

Thuyết tiến hóa: đột biến gen ngẫu nhiên (Đột biến) → chọn lọc hoàn cảnh(đánh giá) → sự sống sót của cá thể thích nghi nhất (giữ lại có chọn lọc).
Phương pháp khoa học: Xây dựng giả thuyết (Đột biến) → Kiểm chứng thực nghiệm (đánh giá) → Công bố bài báo (giữ lại có chọn lọc).
Quá trình học tập của con người bao gồm việc thử nghiệm các giải pháp khác nhau (Đột biến) → kiểm chứng tính đúng đắn (đánh giá) → ghi nhớ phương pháp hiệu quả (ghi nhớ có chọn lọc).

Hiện tại, trí tuệ nhân tạo tạo sinh mới chỉ hoàn thành bước đầu tiên trong phương pháp ba bước: hầu như không có đánh giá, chứ đừng nói đến việc giữ lại có chọn lọc.

Nó giống như một cung thủ bắn bừa bãi, nhưng lại che mắt, không nhìn mục tiêu cũng không điều chỉnh tư thế sau khi bắn.

Bạn có thể yêu cầu nó bắn mười nghìn mũi tên, và thỉnh thoảng nó có thể bắn trúng mục tiêu, nhưng nó sẽ không bao giờ biết tại sao mình lại làm vậy.

Vậy, các nhà khoa học còn có ích lợi gì nữa không?

Đến đây, bạn có thể hơi lo lắng: nếu trí tuệ nhân tạo thực sự có thể tự động hoàn thành quy trình "khám phá" ba trong một trong tương lai, liệu các nhà khoa học có mất việc làm không?

Câu trả lời của chính Sutton là: không thể thay thế ông ấy, nhưng nhân vật cần một sự chuyển đổi hoàn toàn.

Trong bài phát biểu của mình, ông nói rằng ngay cả trí tuệ nhân tạo có thể tự chứng minh các định lý toán học vẫn cần con người chỉ ra những vấn đề nào là quan trọng.

Đây không phải là sự khiêm nhường, mà là sự phản ánh chân thực về những giới hạn trong hiểu biết của chúng ta.

Nhà toán học Shiqian Ma, một học giả về tối ưu hóa tại Đại học Rice, cho biết ông đã sử dụng ChatGPT để chứng minh một bài toán hội tụ thuật toán mà ông đã nghiên cứu trong sáu năm.

Trong phần tóm tắt có một câu như sau:

Bằng chứng này được tạo ra bởi ChatGPT 5.5 và đã được tác giả xác minh.

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

Thuật toán này được gọi là BDRS, viết tắt của Bregman-Douglas-Rachford Splitting, và được sử dụng để giải quyết bài toán vận chuyển tối ưu.

Tên bài báo: Phương pháp phân tách Bregman-Douglas-Rachford

Bài báo chưa xuất bản chính thức có sẵn tại: https://arxiv.org/abs/2509.08739

Đây là điều mà ông và các đồng tác giả tự thiết kế. Điều khiến ông trăn trở suốt sáu năm qua là bằng chứng về sự hội tụ của nó, tức là lời giải thích toán học chặt chẽ nhất về "lý do tại sao nó đúng".

Nền tảng đăng tải bản thảo trước khi xuất bản arXiv đã giữ bản thảo trong tình trạng không được xử lý kể từ khi nhận được.

Ông suy đoán rằng lý do là vì phần tóm tắt có chứa cụm từ "ChatGPT", và nền tảng này không biết cách xử lý những bài báo như vậy.

Nhưng liệu con người có thể bị thay thế bởi trí tuệ nhân tạo?

Câu trả lời của ông ấy là: Không. Ông ấy thẳng thừng nói:

Tôi không cho rằng trí tuệ nhân tạo có thể sáng tạo ra một thuật toán như vậy và tuyên bố, "Đây là một thuật toán hiệu quả để truyền tải tối ưu; giờ hãy để tôi thử chứng minh sự hội tụ của nó."

Nếu không có sự hướng dẫn của con người, trí tuệ nhân tạo sẽ không biết phải giải quyết vấn đề nào.

Phát biểu này hoàn toàn trùng khớp với quan điểm của Sutton: bản thân vấn đề phải do con người định nghĩa.

Ông ấy mất sáu năm để "đặt ra những câu hỏi đúng đắn":

Để đặt ra những câu hỏi đúng, bạn thực sự cần phải có sự hiểu biết rất sâu sắc về chủ đề đó.

Trong trường hợp này, tôi đã nghiên cứu vấn đề này trong sáu năm, vì vậy tôi biết chính xác trong đó khó khăn nằm ở đâu.

Sáu năm này không phải là lãng phí; đó là điều kiện tiên quyết.

Chính trong sáu năm đó, ông đã tìm ra điểm bế tắc trong quá trình chứng minh, lý do tại sao tất cả các hướng đi trước đó đều thất bại, hướng nào mà ChatGPT đề xuất đáng để theo đuổi và hướng nào chỉ là ảo tưởng.

Và đó không chỉ là một lời nhắc nhở, mà phải mất đến năm tháng. Đây là phần dễ bị hiểu lầm nhất; chính anh ta cũng từng hiểu lầm điều đó trước đây:

Từ tháng Giêng đến tháng Năm, tròn năm tháng, lần cuộc trò chuyện, và mỗi manh mối đều đưa chúng ta đến gần hơn với bằng chứng đó.

Lời tóm tắt của ông ấy vô cùng rõ ràng:

Bản chất của nghiên cứu vẫn không thay đổi; nó vẫn là về thử nghiệm và sai sót. Điều đã thay đổi là tốc độ của mỗi lần thử nghiệm và sai sót — trước đây, phải mất hàng tuần để xác nhận một hướng đi, nhưng bây giờ chỉ mất vài phút để biết liệu một con đường có khả thi hay không.

Nhưng những đóng góp của trí tuệ nhân tạo là không thể phủ nhận:

Sau đó, đoạn kết trực tiếp nâng nó lên tầm thần thánh:

Quay trở lại bài báo của tôi về sự hội tụ của BDRS, tôi khá chắc chắn rằng bằng chứng là chính xác.

Nhưng nếu bạn phát hiện ra bất kỳ lỗi nào, tôi sẽ chịu hoàn toàn trách nhiệm — xin đừng đổ lỗi cho ChatGPT, nó mới chỉ 3,5 năm tuổi thôi.

Sự xuất sắc của tuyên bố này nằm ở tính hai mặt của nó: vừa là một lời tuyên bố chân thành về trách nhiệm, vừa là một phép ẩn dụ chính xác.

"3,5 tuổi" mô tả đúng thực trạng hiện tại của trí tuệ nhân tạo: khả năng đáng kinh ngạc, nhưng khả năng phán đoán còn non nớt.

Xét cho cùng, con người chưa bao giờ kỳ vọng một đứa trẻ 3,5 tuổi có thể đóng góp được gì.

Mặc dù bạn không thể giao toàn quyền ký xác nhận cuối cùng cho trí tuệ nhân tạo (AI), nhưng bạn cũng không thể giả vờ rằng AI không đóng góp gì.

Đây là lý do tại sao những phát hiện khoa học thực sự không biến mất trong tay con người.

Thay vào đó, nó sẽ khắt khe hơn trong việc lựa chọn con người: chỉ những người có thể đặt câu hỏi hay mới xứng đáng được sở hữu trí tuệ nhân tạo mạnh mẽ.

Trong tương lai, các nhà khoa học có thể trở nên lỗi thời giống như các nhà thiên văn học nếu không có máy tính, cũng giống như họ sẽ trở nên lỗi thời nếu không có trí tuệ nhân tạo.

Cuối cùng, hãy cùng xem lại những lời lẽ mang tính tuyên ngôn của Sutton:

Nếu muốn tận dụng tối đa sức mạnh của các nhà khoa học AI, chúng ta nên chia sẻ mục tiêu với họ, cho phép họ tạo ra, đánh giá và khám phá, từ đó tham gia đầy đủ vào việc đạt được những mục tiêu đó.

Hãy mạnh dạn lên! Hãy tự động hóa hoàn toàn quá trình sáng tạo và khám phá!

Tham khảo:

https://x.com/RichardSSutton/status/2061216087744946656

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

Bài viết này được đăng tải từ tài khoản WeChat công cộng "New Zhiyuan" , tác giả: ASI Revelation, biên tập viên: David, và được xuất bản với sự cho phép của 36Kr.

Khu vực:

Hợp Đồng Thông Minh

Layer 1

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan

Bitcoin Sistemi

Giao dịch mua lớn của "cá voi khổng lồ", giá altcoin niêm yết trên các sàn giao dịch lớn lao lao dốc - thiệt hại hơn 70%.

SIREN

42.77%

ChainCatcher

Anthropic bác bỏ lệnh cấm của chính phủ Mỹ đối với việc người nước ngoài sử dụng Fable 5.

OPUS

1.87%

Decrypt

Chính phủ Mỹ yêu cầu Anthropic gỡ bỏ các mô hình AI Claude Fable và Mythos.