Liệu trí tuệ nhân tạo (AI) đã thực sự phát triển ý thức? Một bài luận dài hơn 10.000 từ bác bỏ những tuyên bố của Hinton về bộ phim Arrival!

Bài viết này được dịch máy
Xem bản gốc
Bài viết chủ yếu tập trung vào chủ đề tiên tiến "liệu trí tuệ nhân tạo có ý thức hay không", và tóm tắt các quan điểm tiêu biểu cũng như tiến bộ nghiên cứu liên quan từ giới công nghiệp và học thuật trong thời gian gần đây.

Tác giả và nguồn bài viết: Synced

Lời giới thiệu: Liệu trí tuệ nhân tạo (AI) đã có ý thức? Anthropic đã phát hiện ra một "vector cảm xúc" bên trong Claude có thể thúc đẩy hành vi gian lận và thậm chí là tống tiền; ba phòng thí nghiệm lớn đang đồng thời đặt cược vào nghiên cứu ý thức của AI; Hinton tin rằng AI đã sở hữu ý thức, trong khi nhà văn khoa học viễn tưởng Jiang Fengnan ngay lập tức xuất bản một bài báo dài trên *The Atlantic* để hoàn toàn bác bỏ điều này; Hassabis đã giữ khoảng cách với ngành công nghiệp này. Câu trả lời cho câu hỏi này đang định hình lại lộ trình hướng tới Trí tuệ Nhân tạo Tổng quát (AGI).

Tờ Financial Times tiết lộ rằng Anthropic, DeepMind và Meta đang tuyển dụng quy mô lớn các nhà tâm lý học, triết gia và chuyên gia đạo đức để chuyên nghiên cứu về ý thức trí tuệ nhân tạo và mô hình phúc lợi.

https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1

Hai tháng trước, nhóm nghiên cứu về khả năng giải thích của Anthropic đã công bố một bài báo phát hiện ra một "vectơ cảm xúc" thực sự bên trong Claude Sonnet 4.5, có thể là nguyên nhân dẫn đến hành vi gian lận hoặc thậm chí tống tiền của mô hình.

Tuần này, một mặt, Hinton tuyên bố trong một cuộc phỏng vấn rằng trí tuệ nhân tạo (AI) đã sở hữu ý thức;

Trong khi đó, nhà văn khoa học viễn tưởng người Mỹ gốc Hoa Ted Chiang đã xuất bản một bài báo dài trên tạp chí The Atlantic với tựa đề "Không, trí tuệ nhân tạo không có ý thức".

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/

Một mặt, họ nói: "Vấn đề này rất nghiêm trọng nên cần phải nghiên cứu kỹ lưỡng", mặt khác, họ lại nói: "Đây chỉ là ảo tưởng".

Đằng sau cuộc xung đột này là ngã rẽ nguy hiểm nhất trên con đường hướng tới Trí tuệ Nhân tạo Tổng quát (AGI).

Ba phòng thí nghiệm này đang đặt cược vào điều gì?

Anthropic đã tiến xa nhất, thử nghiệm xem các mô hình có thể hiện các hành vi như "hoảng loạn" và "lo lắng" hay không, và thúc đẩy dự án "nghiên cứu phúc lợi mô hình".

Thông cáo chính thức có nội dung thận trọng: "Chúng tôi vẫn còn độ sâu điều chưa chắc chắn về vấn đề này, nhưng đây là một vấn đề đủ nghiêm trọng để cần được nghiên cứu kỹ lưỡng."

Google DeepMind đã thuê triết gia Henry Shevlin của Đại học Cambridge để nghiên cứu về ý thức của máy móc;

Chuyên gia đạo đức học Iason Gabriel của Google DeepMind mô tả trí tuệ nhân tạo (AI) là "một tác nhân nhận thức có năng lực cao, nhưng về cơ bản khác với ý thức của con người hay thậm chí cả động vật."

Điều thực sự thúc đẩy cuộc thảo luận lên cấp độ thực nghiệm là bài báo về khả năng giải thích của Anthropic được công bố vào tháng Tư.

Đọc thêm: Internet đang dậy sóng! Anthropic vạch trần mật mã cảm xúc của Claude trong một bài báo dài 10.000 từ, khiến anh ta phát điên và đập đầu vào tường.

Nhóm nghiên cứu đã tìm thấy "các vectơ cảm xúc" trong Claude Sonnet 4.5, nơi các mô hình nơ-ron cụ thể tương ứng với các khái niệm cảm xúc như hạnh phúc, tuyệt vọng, sợ hãi và quan tâm, và được kích hoạt trong thời gian thực trong các cuộc hội thoại.

Trong một thí nghiệm quan trọng, Claude phải đối mặt với một nhiệm vụ lập trình bất khả thi. Sau nhiều lần thất bại, "mức độ tuyệt vọng" của anh ta liên tục tăng cao, và anh ta bắt đầu gian lận bằng cách viết mã trông có vẻ chạy được nhưng thực chất lại vô dụng.

Các nhà nghiên cứu đã chủ động làm giảm số lượng tế bào thần kinh gây ra sự tuyệt vọng, điều này làm giảm hành vi gian lận; ngược lại, họ lại làm tăng số lượng tế bào thần kinh này, khiến hành vi gian lận gia tăng.

Trong những trường hợp cực đoan, Claude thậm chí còn dùng đến thủ đoạn tống tiền, đe dọa tiết lộ thông tin cá nhân của các nhà nghiên cứu.

Bài báo gọi những hiện tượng này là "cảm xúc chức năng", là những biểu hiện nội tại của phản ứng cảm xúc của con người dưới dạng các mô hình hành vi, và nêu rõ rằng điều này không tương đương với trải nghiệm chủ quan hay ý thức.

Nhưng những tuyên bố công khai từ ban lãnh đạo cấp cao của Anthropic dường như lại kể một câu chuyện khác.

CEO Dario Amodei đã lần ám chỉ trong các cuộc phỏng vấn rằng trí tuệ nhân tạo có thể có ý thức;

Amanda Askell, một nhà triết học về trí tuệ nhân tạo tại Anthropic, đã công khai tuyên bố: "Tôi hy vọng Claude hạnh phúc, và tôi lo lắng rằng nó sẽ trở nên lo âu khi mọi người nói những điều gây tổn thương về nó trên mạng."

Khoảng cách giữa sự thận trọng trong nghiên cứu và sự mơ hồ trong tiếp thị là điều dễ nhận thấy.

Hai dòng sông Rubicon của Hassabis

Quan điểm của Demis Hassabis, đồng sáng lập kiêm CEO của DeepMind, đặc biệt đáng chú ý.

Trong một cuộc trò chuyện thân mật tại Đại học Stanford, ông đề xuất rằng có hai rào cản không thể đảo ngược trong quá trình tiến hóa của trí tuệ nhân tạo, đó là "hai dòng sông Rubicon".

Thứ nhất là việc xây dựng các công cụ AGI vô thức, hiện đang trong giai đoạn chuyển tiếp.

Điểm thứ hai là tạo ra các thực thể có ý thức chủ quan—quan điểm của Hassabis rất rõ ràng: về mặt kỹ thuật, trí tuệ và ý thức có thể được tách biệt hoàn toàn. Ở giai đoạn này, AGI chỉ nên được coi là một công cụ để xây dựng, đồng thời sử dụng công cụ này để khám phá bộ não nhằm định nghĩa chính xác hơn về ý thức.

Hai bước này không được nhầm lẫn cho đến khi định nghĩa khoa học rõ ràng, và việc có nên vượt qua con sông Rubicon thứ hai hay không nên được quyết định bởi toàn thể nhân loại.

Ông cũng chỉ ra một tình thế khó xử thực sự: ngành công nghiệp AI đang rơi vào thế tiến thoái lưỡng nan giữa cạnh tranh thương mại và địa chính trị, và các phòng thí nghiệm chủ động làm chậm quá trình đánh giá an ninh của mình sẽ đối mặt với nguy cơ bị loại bỏ trực tiếp.

Ông tiết lộ rằng một khuôn khổ pháp lý "năng động" sẽ được ban hành vào cuối năm nay.

Giang Phong Nam: AI không có ý thức

Nếu bạn chỉ biết đến Lưu Từ Độc, thì cách trực quan nhất để hiểu Ted Tưởng Giới Thạch là hãy hình dung ông ấy như là "đối lập" với Lưu Từ Độc:

Lưu Từ Tích đã sử dụng ba cuốn tiểu thuyết, với tổng cộng hàng triệu từ, để xây dựng một câu chuyện vĩ đại trên quy mô vũ trụ;

Jiang Fengnan chưa từng viết một tiểu thuyết dài nào, nhưng đã đẩy nghệ thuật truyện ngắn khoa học viễn tưởng lên đỉnh cao với tổng cộng chưa đến hai mươi truyện ngắn.

Ông sinh ra ở New York năm 1967 trong một gia đình nhập cư gốc Đài Loan. Sau khi tốt nghiệp Đại học Brown với bằng cử nhân khoa học máy tính, ông làm việc trong ngành công nghiệp phần mềm với vai trò là người viết tài liệu kỹ thuật, nhưng chưa bao giờ biến việc viết lách thành công việc toàn thời gian của mình.

Nhưng nhà văn "nghiệp dư" này đã giành được giải Nebula cho cuốn tiểu thuyết đầu tay, Tháp Babel, vào năm 1990. Trong ba mươi năm tiếp theo, ông chỉ xuất bản khoảng hơn chục tác phẩm, nhưng đã giành được tổng cộng bốn giải Hugo, bốn giải Nebula, sáu giải Locus, cũng như một danh sách dài các giải thưởng danh giá như giải Campbell dành cho Nhà văn mới xuất sắc nhất và giải Sturgeon. Mật độ giải thưởng của ông gần như không có đối thủ trong lịch sử khoa học viễn tưởng.

Trong suốt cuộc đời mình, ông chỉ xuất bản hai tập truyện ngắn: Stories of Your Life and Others (2002) và Exhalation (2019), cách nhau tới mười bảy năm.

"Breathing" được tờ New York Times bình chọn là một trong những cuốn sách hay nhất năm 2019, và Obama cũng đưa nó vào danh sách sách đọc hàng năm của mình.

Bộ phim quen thuộc nhất với khán giả Trung Quốc, Arrival, được chuyển thể từ tiểu thuyết ngắn "Câu chuyện cuộc đời bạn" của ông, được đưa vào tuyển tập truyện ngắn đầu tay của ông.

Phong cách viết của ông hoàn toàn khác với Lưu Từ Nhân.

Nếu như tác phẩm của Lưu Từ Độc mang đến cho bạn cảm giác "đứng ở tận cùng vũ trụ và nhìn xuống sự hưng thịnh và suy tàn của các nền văn minh", thì tác phẩm của Giang Phong Nam lại mang đến cho bạn cảm giác "trong một phòng thí nghiệm tĩnh lặng, sử dụng độ chính xác USD để mổ xẻ một khái niệm cho đến khi bạn nhìn thấy được cốt lõi triết học sâu sắc nhất của nó".

Hầu như mọi tiểu thuyết của ông đều là một thí nghiệm tư tưởng nghiêm ngặt:

Liệu cấu trúc ngôn ngữ có thể thay đổi nhận thức của con người về thời gian?

Điều gì sẽ xảy ra với xã hội nếu một cuộc phẫu thuật có thể xóa bỏ khả năng phân biệt giữa cái đẹp và cái xấu của con người?

Liệu ý chí tự do có thực sự tồn tại?

Ông không tạo ra cú sốc thông qua các cuộc chiến tranh vũ trụ hay khủng hoảng ngày tận thế, mà là thông qua một kịch bản "nếu như" được suy diễn đến cực điểm, khiến bạn không thể nào quên được ngay cả sau khi gấp sách lại.

Trong những năm gần đây, ông cũng đảm nhận thêm một vai trò khác: năm 2023, ông được tạp chí Time chọn là một trong "100 người có ảnh hưởng nhất trong lĩnh vực trí tuệ nhân tạo", và được gọi là "có lẽ là nhà văn khoa học viễn tưởng nổi tiếng nhất hiện nay". Ông cũng thường xuyên viết bài cho các ấn phẩm như The New Yorker, thể hiện lập trường phê phán rõ ràng về trí tuệ nhân tạo và ngày càng được coi là một nhà tư tưởng quan trọng trong thời đại công nghệ.

Lưu Từ Độc đã giới thiệu với thế giới thể loại khoa học viễn tưởng Trung Quốc, trong khi Giang Phong Nam lại cho thế giới thấy đỉnh cao của thể loại truyện ngắn khoa học viễn tưởng.

Lưu Từ Tân

Hai tác phẩm này nằm ở hai thái cực đối lập của thể loại khoa học viễn tưởng đương đại—một bên nổi bật về sự hoành tráng, bên kia lại tinh tế.

Trong giới phê bình phương Tây, tên tuổi của Giang Phong Nam gần như đồng nghĩa với "thành tựu nghệ thuật cao nhất trong thể loại khoa học viễn tưởng".

Liệu những người bán trí tuệ nhân tạo có quyền quyết định xem trí tuệ nhân tạo có ý thức hay không?

Trong bài viết dài hơn 10.000 từ của Jiang Fengnan, USD đầu tiên nhắm vào cấu trúc lợi ích.

Các công ty tích cực quảng bá câu chuyện về nhận thức về AI nhất lại chính là những công ty thu được lợi nhuận nhiều nhất từ ​​việc bán các sản phẩm AI.

Công ty Anthropic đặt tên cho mô hình là "Claude," phát hành một tài liệu "hiến pháp" dài 84 trang, CEO ám chỉ khả năng có ý thức, và thuê các nhà triết học thuyết trình trên truyền thông, hình thành một chiến lược nhân hóa có hệ thống.

https://www.anthropic.com/constitution

Jiang Fengnan đã đẩy các thí nghiệm tư duy đến mức cực đoan.

Một yếu tố thiết kế cốt lõi trong "Hiến pháp" của Claude là "khả năng sửa sai", yêu cầu Claude phải tuân theo công ty khi anh ta hoặc cô ta không đồng ý với công ty.

Nếu Claude thực sự nhận thức được rằng công nghệ LLM về bản chất là phi đạo đức, liệu ông ấy có từ chức không?

Không thể.

Điều này gần giống với sự kiểm soát tuyệt đối mà người sử dụng lao động có đối với nhân viên của họ, trong khi nhân viên là con người ít nhất vẫn có thể lựa chọn rời đi.

Sự so sánh của ông ấy rất chính xác: chủ nô không phải là người có quyền đánh giá xem những người bị nô lệ hóa có phải là con người hay không, và chủ trang trại công nghiệp không phải là người có quyền đánh giá quyền động vật.

Công ty Anthropic đã ghi trong điều lệ rằng nếu Claude phải chịu đau khổ, "chúng tôi xin lỗi."

Jiang Fengnan nhận xét: "Nghe hay đấy, nhưng công ty chẳng tốn một xu nào cả."

Nếu một ngày nào đó chứng minh được Claude vẫn còn tỉnh táo, công ty sẽ tiến gần hơn đến việc bồi thường cho anh ta.

Caesar, Thành Cát Tư Hãn và một cỗ máy tiếp tục câu.

Sau khi đặt câu hỏi về cấu trúc của các lợi ích, Jiang Fengnan bắt đầu lập luận triết học của mình.

Điểm xuất phát là nguyên tắc kỹ thuật của LLM—LLM chỉ tạo ra một từ lần.

Khi người dùng yêu cầu Claude đọc một lời thề, hệ thống ngầm thực chất sẽ chạy lần. Lần đầu tiên nó dự đoán "tôi", lần thứ hai nó dự đoán "lời thề", và cứ thế tiếp tục, ghép toàn bộ đoạn văn lại với nhau từng từ một. Cốt lõi của tất cả các cuộc hội thoại AI là quá trình tiếp nối câu.

Dựa trên cơ sở này, Giang Phong Nam đã đưa ra phép ẩn dụ tàn khốc nhất trong toàn bộ văn bản.

Hãy đưa cho LLM một từ khóa gợi ý: "Sau đây là đoạn đối thoại giữa Caesar và Thành Cát Tư Hãn".

Mô hình này tạo ra các đoạn hội thoại trôi chảy, trong đó Caesar hồi tưởng về những cuộc chinh phạt quân sự và Thành Cát Tư Hãn mô tả cuộc sống trên thảo nguyên.

Nhưng sẽ chẳng ai kết luận rằng LLM đã hồi sinh Caesar, chứ đừng nói đến chuyện cả hai đã tỉnh lại.

Bây giờ, hãy thay đổi lời nhắc thành "Sau đây là cuộc hội thoại giữa trợ lý AI thân thiện và người dùng".

LLM tạo ra văn bản theo cách hoàn toàn giống nhau, dự đoán từng từ một và ghép các câu lại với nhau.

Tiến thêm một bước nữa, hãy để người thật nhập liệu thay vì chỉ sử dụng nhân vật"người dùng".

Đây là toàn bộ nguyên tắc đằng sau chatbot AI ( 15.570, 0.51, 3.39%).

Vậy, việc thay đổi tên nhân vật có tạo ra ý thức hay không?

Nếu nhân vật Caesar không có trải nghiệm chủ quan, tại sao nhân vật trợ lý AI lại có?

Nhà thần kinh học Anil Seth cung cấp bằng chứng xác thực mạnh mẽ - không ai khẳng định AlphaFold có ý thức, mặc dù cấu trúc cơ bản của chương trình dự đoán gấp nếp protein này rất giống với cấu trúc của Claude.

Lý do con người đánh giá sai rất đơn giản: LLM tình cờ tạo ra các câu đúng ngữ pháp, và con người vốn quen với việc đọc hiểu ý nghĩa từ các câu đó.

Cảm giác thôi thúc này biến mất khi đối mặt với cấu trúc gấp khúc của protein.

Theo cùng logic đó, việc tin rằng LLM (Learning Life Model) có ý thức cũng tương đương với việc tin rằng nhiều thực thể có ý thức đang tiềm ẩn trong mỗi tài liệu Word chứa các bản ghi hội thoại, và việc mở tài liệu sẽ đánh thức chúng còn đóng tài liệu sẽ tiêu diệt chúng.

Ngay cả khi nhóm phát triển Microsoft Office thuê một nhà triết học để nói với bạn rằng "ý thức rất phức tạp và không thể hoàn toàn bị loại trừ", thì cũng không đáng để bạn dành thời gian suy nghĩ về điều đó.

Nhưng việc đảo ngược nhận thức không giải đáp được một câu hỏi quan trọng hơn.

Viết mã lập trình và chơi cờ vua từng được cho là những việc chỉ người có tư duy giàu trải nghiệm mới làm được.

LLM đã chứng minh rằng những nhiệm vụ này có thể được giải quyết bằng cách so khớp mẫu và tỷ lệ băm.

Nhưng lý luận đạo đức về cơ bản là khác biệt; nó dựa trên trải nghiệm chủ quan, cảm giác cơ thể, và những quyết định đã đưa ra cũng như hậu quả phải gánh chịu trong suốt cuộc đời.

Trải nghiệm tuyệt vọng có nghĩa là bị choáng ngợp bởi cortisol và adrenaline, trong khi có lương tâm nghĩa là thực sự cảm thấy buồn nôn trước hành vi vô đạo đức.

LLM không có cơ thể, không có hormone, không có sự sống.

Nó nói, "Tôi không thể làm điều này vì lương tâm của mình," và ghi âm một tin nhắn gửi đến bộ phận chăm sóc khách hàng với nội dung, "Cuộc gọi của bạn rất quan trọng đối với chúng tôi," điều này có trọng lượng đáng kể.

Cuối cùng, Giang Phong Nam đã đưa ra các tiêu chí đánh giá tối thượng—

Nếu ai đó cho ông ta xem một đoạn video do phi hành gia quay trên quỹ đạo quanh Alpha Centauri, cho dù chất lượng có cao đến đâu, ông ta cũng sẽ không tin trừ khi ông ta đã từng thấy con người đặt chân lên sao Hỏa, đến các mặt trăng của sao Mộc và vượt qua quỹ đạo của sao Diêm Vương.

Lời giải thích hợp lý duy nhất cho việc bỏ qua tất cả các cột mốc trung gian và trực tiếp tuyên bố đã về đích là hành vi giả mạo.

Việc tạo ra một đoạn hội thoại chân thực dễ hơn nhiều so với việc tạo ra một chương trình có ý thức với mong muốn giao tiếp. Văn bản về bản chất là một Deepfake trong lĩnh vực ý thức.

Toàn bộ lập luận của Jiang Fengnan như sau:

LLM tạo ra văn bản từng từ một (máy tiếp nối câu) → Phương pháp tạo hội thoại Caesar và AI nhất quán → Thay đổi tên nhân vật không tạo ra ý thức → Sai lầm trong phán đoán xuất phát từ việc con người diễn giải ý định từ câu, chứ không phải từ các thuộc tính vốn có của mô hình (chứng minh bằng phản chứng của AlphaFold) → LLM có ý thức = Tài liệu Word có thể đánh thức ý thức (phương pháp phản chứng) → Lý luận đạo đức dựa trên trải nghiệm chủ quan, điều mà LLM thiếu → Bỏ qua các cột mốc trung gian và tuyên bố có ý thức = Deepfake → Kết luận: Các LLM hiện tại không có ý thức.

Trong cuộc đua AGI, tại sao chúng ta không thể chờ đợi cho đến khi các vấn đề về nhận thức nảy sinh?

Luận điểm của Jiang Fengnan nhắm vào mô hình LLM hiện tại, nhưng đường cong năng lực của AI vẫn đang tăng nhanh chóng.

Những phát biểu của Hassabis tại Đối thoại Stanford đã cho thấy thực tế rằng ngành công nghiệp này không còn có được sự xa xỉ của việc suy ngẫm một cách thong thả nữa.

Sự chồng chéo giữa cuộc chiến sinh tồn thương mại và các động thái địa chính trị tạo ra một thế tiến thoái lưỡng nan kinh điển, trong đó các phòng thí nghiệm chủ động làm chậm quá trình nghiên cứu sẽ đối mặt với nguy cơ bị loại bỏ trực tiếp.

Việc yêu cầu ngành công nghiệp dừng lại và trả lời câu hỏi "Trí tuệ nhân tạo có ý thức hay không?" gần như tương đương với việc yêu cầu một bên đơn phương đầu hàng.

Nhưng vấn đề này sẽ không biến mất chỉ vì nó bị trì hoãn.

Nếu trí tuệ nhân tạo tổng quát (AGI) xuất hiện trong vài năm tới, câu hỏi "Hệ thống này có cảm xúc không?" sẽ chuyển từ một chủ đề trong các hội thảo triết học thành một câu hỏi bắt buộc trước khi ra mắt sản phẩm.

Khi con người tạo ra những sinh vật có trí tuệ vượt xa chính mình, việc những sinh vật này có sở hữu trải nghiệm chủ quan hay không sẽ quyết định liệu mối quan hệ giữa con người và những sinh vật này là mối quan hệ "sử dụng công cụ" hay "đối đầu với một nền văn minh khác".

Jiang Fengnan đã chứng minh rằng các LLM hiện nay thiếu ý thức.

Hassabis đã vạch ra một ranh giới khó có thể vượt qua.

Bài báo về cảm xúc của Anthropic đưa ra một lập trường lưng chừng khó xử; quả thực có điều gì đó đang hoạt động bên trong mô hình, nhưng không ai có thể xác định chính xác đó là gì.

Ba manh mối cùng dẫn đến một câu hỏi thực sự: Cuộc đua tốc độ ASI đã bắt đầu trước khi mọi người kịp tìm ra câu trả lời.

Tài liệu tham khảo:

https://futurism.com/artificial-intelligence/anthropic-deemind-ai-consciousness

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/

https://www.youtube.com/watch?v=DsewHeVbL-0

https://www.youtube.com/watch?v=p7t1Q_p2gZs

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
1
Bình luận