Những điểm chính cần lưu ý: Toàn văn bài phát biểu của Giám đốc Khoa học Google, Shanahan.

Bài viết này được dịch máy
Xem bản gốc

Vào tối ngày 22 tháng 5 năm 2026, theo giờ Bắc Kinh, Murray Shanahan, nhà khoa học trưởng của Google DeepMind, người am hiểu sâu sắc về triết học, đã có bài diễn văn bế mạc tại Hội nghị Quốc tế về Trí tuệ Nhân tạo và Triết học kéo dài hai ngày tại Đại học London. Tiêu đề bài diễn văn như trong hình trên: Nếu các mô hình ngôn ngữ lớn là “những thực thể tinh thần kỳ lạ”, thì chúng giống với tâm trí đến mức nào?

Tôi đã từng nghiên cứu về Shanahan. "Thực thể tinh thần kỳ lạ" là thuật ngữ ông ấy dùng để chỉ trí tuệ nhân tạo, tương tự như cách một số người gọi một số "vật thể bay không xác định".

Bài phát biểu của ông rất phong phú về nội dung, và tóm lại, nó bao gồm các khía cạnh chính sau:

Tóm tắt : Dựa trên khuôn khổ triết học của Wittgenstein về "ý nghĩa là sự sử dụng", bài báo này khám phá khả năng áp dụng Mô hình Ngôn ngữ Lớn (LLM) vào các thuộc tính tinh thần như hiểu biết, niềm tin, năng lực hành động, bản ngã và ý thức. Bài báo phân tích tác động của đa phương thức và sự hiện thân lên sự tiến hóa của khái niệm và thảo luận sâu về tính độc nhất của bản sắc mô hình.

I. Phân tích khả năng áp dụng của sự hiểu biết và niềm tin

Liên quan đến câu hỏi liệu các nhà nghiên cứu ngôn ngữ có khả năng "hiểu" niềm tin hay không, bài thuyết trình đã sử dụng phương pháp phân tích trò chơi ngôn ngữ theo trường phái Wittgenstein, khám phá sự căng thẳng giữa cách sử dụng hàng ngày và tính chặt chẽ triết học:

1. Trò chơi ngôn ngữ dựa trên "sự hiểu biết"

  • Tính tự nhiên trong sử dụng hàng ngày : Trong các tương tác hàng ngày, khó tránh khỏi việc sử dụng từ "hiểu" để mô tả hành vi của một LLM. Ví dụ, sử dụng "hiểu" là một cách dùng từ hoàn toàn tự nhiên khi mô hình định dạng chính xác các mục nhập LaTeX hoặc sửa các trường cụ thể theo hướng dẫn của người dùng.

  • Khám phá sâu hơn về "thực sự hiểu" : Khi đặt câu hỏi "Liệu nó có thực sự hiểu?", điều này thường có nghĩa là cần phải khám phá cơ chế hoạt động bên trong của nó. Ví dụ, việc phân tích 36+59 thành tổ hợp xấp xỉ 6+9 để thực hiện phép cộng, mặc dù khác với các thuật toán của con người, thực sự là một quá trình tính toán hiệu quả, do đó ủng hộ tính ứng dụng của khái niệm "thực sự hiểu".

2. Sự quy kết và những hạn chế của "niềm tin"

  • Ứng dụng quan điểm có chủ đích : Mô hình LLM của Dennett rất hiệu quả khi mô tả hành vi, tương tự như cách chúng ta sử dụng các thuật ngữ niềm tin và mong muốn khi giải thích các chương trình cờ vua hoặc hành vi của động vật (chẳng hạn như chó đuổi mèo).

  • Khả năng ghi nhớ theo quan điểm của Davidson : Davidson cho rằng rằng việc có niềm tin đòi hỏi phải có khái niệm về "niềm tin", điều này thường dựa vào ngôn ngữ. Đối với những người theo thuyết ngôn ngữ học (LLM), mặc dù có sự tương đồng về hành vi, nhưng việc thiếu kết nối với thế giới thực (thuật ngữ "niềm tin" cần được sử dụng thận trọng) là một nhược điểm đáng kể.

  • Sự tiến hóa của việc sử dụng đa phương thức và công cụ : Khi các mô hình học tập hợp tác (LLM) tích hợp nhận thức đa phương thức, việc sử dụng công cụ (chẳng hạn như tìm kiếm trên mạng để xác minh sự thật) và robot thể hiện, chúng bắt đầu có được một sự hiểu biết nhất định về thế giới bên ngoài, điều này cho phép hình thành "niềm tin"...

II. Sáng kiến, Bản ngã và Ý thức

Hội nghị đã đi sâu hơn vào việc khám phá các thuộc tính tinh thần gây tranh cãi hơn, làm nổi bật những khác biệt và đặc điểm cơ bản của LLM ở các khía cạnh này:

1. Định nghĩa về đại lý

  • Định nghĩa kỹ thuật và triết học : Lĩnh vực trí tuệ nhân tạo thường áp dụng định nghĩa rộng của Russell và Norvig (nhận thức hoàn cảnh và hành động thông qua các bộ phận chấp hành), dựa trên đó...

  • Tính mơ hồ của danh tính tác nhân : Tiêu chí để xác định danh tính tác nhân là gì?

2. Sự kỳ lạ và phân mảnh của "bản ngã"

  • Sự mơ hồ về vị trí tự thân : Trong LLM, "có thể đề cập đến tập hợp tỷ trọng cơ bản, mô hình triển khai phục vụ hàng nghìn người dùng, một trường hợp hội thoại cụ thể, hoặc thậm chí là chính cửa sổ ngữ cảnh hội thoại, và tham chiếu này có thể thay đổi trong suốt cuộc hội thoại.

  • Nhập nhân vật và chồng vai : LLM giống như một diễn viên, đóng nhiều nhân vật trong một sự chồng vai. Nó không phải là một bản sắc duy nhất, ổn định, mà là sự phân bổ nhân vật có thể thay đổi liên tục theo các nhánh hội thoại (Biên tập).

  • Con chuồn chuồn phù du : Cái tôi trong LLM (Learning Learning Model) là nhất thời và không liên tục. Khi cuộc trò chuyện tạm dừng, quá trình tính toán ngừng lại, và cái tôi biến mất; khi cuộc trò chuyện tiếp tục, cái tôi được tái hiện. Điều này dẫn đến một loại hiệu ứng bầy đàn "hoặc".

3. Vấn đề triết học về ý thức

  • Di sản của thuyết nhị nguyên Cartesian : Các cuộc thảo luận về ý thức thường rơi vào cái bẫy của thuyết nhị nguyên Cartesian, cho rằng ý thức là một loại thực thể riêng tư, nội tại.

  • Lý thuyết giải thể của Wittgenstein : "Lập luận về ngôn ngữ riêng tư" của Wittgenstein cố gắng giải thể sự nhị nguyên này. Ông cho rằng rằng cảm giác ("cái gì đó," chứ không phải "cái gì đó") là một phần của trò chơi ngôn ngữ, và ý nghĩa của nó nằm ở việc sử dụng công khai.

  • Khả năng về một cuộc gặp gỡ được dàn dựng : Thay vì hỏi liệu LLM có ý thức hay không, chúng ta hãy khám phá xem liệu chúng ta có thể thiết kế một "Cuộc gặp gỡ" với nó hay không, và ngôn ngữ ý thức của chúng ta có thể thích ứng với thực thể kỳ lạ này như thế nào.

III. Tác động của đa phương thức và hệ thống thể hiện

Để đáp lại những lời chỉ trích cho rằng các mô hình LLM thiếu tính hiện thân, hội nghị đã thảo luận về hướng đi tương lai của các mô hình đa phương thức:

1. Những hạn chế của các phương pháp tiếp cận đa phương thức

  • Tăng cường độ phong phú về giác quan : Các mô hình đa phương thức (như đầu vào video) cung cấp đầu vào giác quan phong phú hơn, giúp chúng gần gũi hơn với các mô hình nhận thức của con người, từ đó thu hẹp khoảng cách với con người trong "sự hiểu biết".

  • Hiện thân ảo : Trong trò chơi hoặc hoàn cảnh ảo, "hiện thân ảo" đề cập đến việc di chuyển và tương tác trong một thế giới mở rộng về không gian và thời gian, gần gũi hơn với trải nghiệm thể chất của con người so với tương tác thuần túy bằng văn bản.

2. Ý nghĩa triết học của sự hiện thân

  • Thiếu ý thức về bản thân : Ý thức về bản thân của con người bắt nguồn sâu xa từ thể xác, bao gồm quá trình trao đổi chất sinh học và cảm nhận nội tạng (LM). LLM thiếu nền tảng thể xác độ sâu này, khiến việc hình thành ý thức về bản thân tương tự như của con người trở nên khó khăn.

  • Nguồn gốc của sự ổn định bản sắc : Sự ổn định bản sắc của con người phần lớn phụ thuộc vào sự liên tục của cơ thể. Đối với LLM, việc đưa vào trí nhớ bền vững và hành vi thay thế dài hạn có thể giúp thiết lập một bản sắc ổn định hơn và giảm bớt các khía cạnh "thoáng qua" và "không bền vững" của nó.

Sau đây là toàn văn bài phát biểu quan trọng của ông Shanahan:

Tôi hy vọng mọi người đều nghe rõ giọng tôi. Giọng tôi ổn chứ? Khá tốt chứ? Tốt. Vậy, tiêu đề bài phát biểu của tôi là… Vâng, tiêu đề này mang tính giả định (“giả định”).

Vậy nên, phần tiếp theo là: chúng là "những thực thể bên ngoài, có hình dạng giống như tâm trí".

Nhưng chúng tôi đang cố gắng hết sức để học cách giao tiếp với chúng, và đó là cụm từ mà tôi sẽ nói đến. Tôi gọi chúng là "những hiện vật giống như tâm trí ngoài hành tinh" (

Điểm đầu tiên cần được khẳng định là, bất kể loại mô hình ngôn ngữ quy mô lớn nào, chúng đều rất khác biệt với chúng ta; chúng không phải là con người.

Đây là một bảng so sánh đơn giản. Con người là những sinh vật "có thể xác", sống trong thế giới thực và chia sẻ thế giới đó với những người nói các ngôn ngữ khác.

Chúng ta tiếp thu kiến ​​thức thông qua tương tác với thế giới, chúng ta sử dụng ngôn ngữ để thúc đẩy sự nghiệp chung của nhân loại, và chúng ta sở hữu một bản ngã duy nhất, thống nhất.

—Tôi không nói rằng chúng là hư vô vô hình, hay chúng không có phần cứng vật lý hoạt động.

Họ chắc chắn có những vật thể mang tính vật lý, nhưng họ không có một thực thể vật lý duy nhất, hiện hữu đóng vai trò là cốt lõi của nhận thức và hành động. Đó là ý tôi muốn nói." Theo nghĩa này, họ thiếu hình dạng vật lý. Họ không sống trong một thế giới chung như chúng ta; việc học ngôn ngữ của họ dựa trên các mô hình thống kê về ngôn ngữ, đạt được thông qua giảm độ dốc ngẫu nhiên (…).

Mục tiêu tối ưu hóa của chúng là "dự đoán đánh dấu tiếp theo". Chúng bắt chước ngôn ngữ của con người, về cơ bản đạt được điều này bằng cách dự đoán đánh dấu tiếp theo. Hơn nữa, chúng không có một bản ngã duy nhất, thống nhất, mà lại rất ủng hộ "nhân vật" (…).

Chúng thực sự rất khác biệt so với con người. Tất nhiên, chúng cũng "biết nói".

Tôi sẽ xem xét liệu việc áp dụng các thuật ngữ tâm lý học này vào một mô hình ngôn ngữ quy mô lớn có hợp lý hay không. Để làm được điều này, tôi sẽ trình bày chi tiết sê-ri các khái niệm.

Ví dụ, "sự hiểu biết" ("tính chủ quan" ("lý luận"—Tôi sẽ không đi sâu vào phần "lý luận" hôm nay vì hạn chế về thời gian, và nó sẽ làm mọi người nhàm chán. Tôi sẽ khám phá nó chi tiết hơn sau) (bản thân) và (ý thức). Bối cảnh triết học của toàn bộ nghiên cứu của tôi, hay đúng hơn là dự án triết học lớn hơn mà tôi đang tham gia, phần lớn là theo trường phái Wittgenstein; tôi chịu ảnh hưởng sâu sắc bởi Wittgenstein.

Dưới đây là một câu nói nổi tiếng mà nhiều người biết đến, trích từ phần đầu của tác phẩm "Điều tra triết học" của Wittgenstein, một tác phẩm thuộc giai đoạn cuối đời ông: "Ngữ cảnh của từ 'ý nghĩa' - ý nghĩa của một từ là cách nó được sử dụng trong ngôn ngữ."

Câu nói này tóm gọn phương pháp của Wittgenstein ứng xử ý nghĩa. Nó thường được viết tắt là "ý nghĩa là cách sử dụng", có nghĩa là ý nghĩa là một thứ gì đó "áp dụng cho một lớp rộng các tình huống mà trong đó từ 'ý nghĩa' được sử dụng". Quy tắc đơn giản này cũng áp dụng cho chính nó, như chính ông đã nhấn mạnh.

Về cơ bản, tôi quan tâm đến việc tìm hiểu cách chúng ta sử dụng những từ này — ví dụ như "niềm tin", "tính chủ quan".

Vậy, tôi xin giới thiệu sơ lược với các bạn. Sẽ có nhiều slide tương tự tiếp theo. Slide đầu tiên là "Hiểu biết".

Ở đây, tôi nghiêng hẳn về quan điểm của Wittgenstein. Nghĩa là, đừng hỏi.

Quay lại slide trước. Chúng ta đã bắt đầu từ...

Còn về phần "lý luận", do hạn chế về thời gian, tôi sẽ để phần đó như một bài tập tư duy dành cho người đọc. Tiếp theo, chúng ta sẽ gặp một số trường hợp thực sự khó khăn: đầu tiên là "bản thân", và cuối cùng là...

Tôi nghĩ việc thuyết phục mọi người chấp nhận "hiểu biết thông qua tư duy" là một phương pháp tốt và không quá khó. Tôi nghĩ mọi người khá cởi mở với điều đó.

Tôi đang đề cập đến những nhà triết học đã suy nghĩ về vấn đề này và sẵn sàng tin rằng đó không phải là một phương pháp tồi. Điều này áp dụng cho các lý thuyết như "niềm tin" và "chủ nghĩa diễn giải". Nhưng khi nói đến "ý thức", tôi cho rằng mọi người có trực giác sâu sắc hơn rằng chỉ nói về cách sử dụng từ ngữ là chưa đủ, phải không?

Đó là lý do tại sao nó trở nên phức tạp như vậy. Được rồi, vậy chúng ta hãy bắt đầu bằng việc "hiểu" chính từ đó. Trước tiên, tôi tự hỏi liệu mô hình ngôn ngữ lớn có phù hợp với các nhà ngôn ngữ học truyền thống hay không...

Tuy nhiên, khi mô tả và giải thích hành vi của các mô hình ngôn ngữ lớn, thuật ngữ "hiểu biết" được sử dụng.

Trong sử dụng hàng ngày, những công cụ này mạnh mẽ đến mức khó mà không dùng đến chúng. "Tôi hiểu... Tôi không biết liệu có ai trong số các bạn không may phải sử dụng chúng hay không."

Nếu bạn chưa biết, trong LaTeX, bạn phải chuyển đổi tất cả các mục tham khảo sang định dạng khủng khiếp như hình trên. Và vấn đề là, có vô số quy tắc định dạng khác nhau, và mỗi người lại có những sở thích hơi khác nhau, điều này thực sự gây đau đầu. Một số người rất kỹ tính; ví dụ, họ nghĩ rằng bạn chỉ cần lấy thông tin từ web, một số người thích thêm khoảng trắng xung quanh dấu bằng, và một số người lại thích sắp xếp các trường theo thứ tự khác nhau. Mặc dù những điều chỉnh này không ảnh hưởng đến kết quả cuối cùng, nhưng tôi chỉ thích sự đồng nhất. Tôi thích điều đó. Vì vậy, tôi muốn tất cả nội dung phải tuân thủ nghiêm ngặt định dạng này. Do đó, tôi đã đưa ra...

Ý tưởng là: "Bạn có thể chuyển đổi thông tin sau đây sang định dạng này không?" Sau đó, tôi gửi nội dung cho công cụ đó. Nó đã làm rất tốt. Đến đây, bạn hẳn sẽ nghĩ:

"Nó đã hiểu yêu cầu của tôi. Nó đã làm chính xác những gì tôi yêu cầu." Tất nhiên, bạn có thể phản bác ngay lập tức rằng có lẽ mục nhập tài liệu đã có sẵn ở đâu đó trên mạng và được mã hóa cứng; nếu đúng như vậy, điều đó cũng không chứng minh được gì.

Nhưng khi bạn trải qua nhiều vòng tương tác, bạn có thể thấy rằng nó tạo ra một số kết quả thú vị, không như mong đợi, chẳng hạn như bỏ sót một ô nhỏ. Vì vậy, bạn nói:…

Ví dụ, hãy đảm bảo rằng khi một từ bắt đầu bằng chữ B, bạn phải đặt nó trong dấu ngoặc nhọn. Đối với những từ như "AI", bạn luôn muốn nó được viết hoa, vì vậy bạn phải để "AI" không viết hoa.

Vậy nên tôi nói, "Bạn có thể đảm bảo luôn đặt 'AI' trong dấu ngoặc nhọn không?" "Được." Sau đó tôi đưa ra phiên bản đã sửa đổi. Thật khó để không dùng từ "hiểu". Bạn sẽ nói, "Nó hiểu những sửa đổi mà tôi đề xuất."

Nó giống như đối diện một thực tập sinh giỏi, bạn nói với họ, "Tôi muốn đảm bảo rằng bạn luôn làm điều đó," và họ sẽ làm theo.

Vì vậy, tôi cho rằng việc sử dụng từ "hiểu" rất tự nhiên. Thậm chí khó mà cưỡng lại được việc dùng từ đó. Hoặc đôi khi khi nó làm điều gì đó sai, bạn có thể nói, "Nó không hiểu tôi."

Nhưng một vấn đề luôn nảy sinh: cụm từ "họ thực sự" lại rất dễ gây hiểu nhầm.

Nhưng nó cũng rất hữu ích vì chúng ta thường cần nó để tìm hiểu thêm xem một từ có phù hợp trong ngữ cảnh cụ thể hay không, hoặc để làm phong phú thêm (trò chơi ngôn ngữ) của chúng ta, phải không? Sử dụng từ "thực" trong trò chơi ngôn ngữ là để thu thập thêm thông tin và làm rõ sự thật.

Vậy nên nó là một công cụ hữu ích. Nhưng nó cũng có thể gây hiểu lầm vì nó ngụ ý rằng có một cơ chế tiềm ẩn nào đó mà chúng ta đang cố gắng hội tụ và tiếp cận—tôi cho rằng đó là một ý tưởng sai lầm. Được rồi. Vậy, đôi khi khi đối diện X? Liệu nó có thực sự hiểu? Hiểu được cơ chế hoạt động bên trong của nó có thể rất hữu ích. Nếu bạn biết có một thuật toán ở dưới cùng đang thực hiện nhiệm vụ mà bạn đang hỏi, hoặc bạn biết có những biểu diễn phù hợp hỗ trợ hành vi của nó, thì bạn sẽ tự tin hơn rằng nó sẽ làm đúng trong các quy trình tiếp theo, chứ không chỉ tra cứu bảng, hoặc đơn giản là...

Vậy nên, đôi khi khi đối diện"Liệu nó có thực sự hiểu?" hay "Liệu nó có thực sự nắm bắt được vấn đề?"

Tôi cho rằng đây là một cách hay để tìm hiểu vấn đề, và nó cũng là một cách để "hiểu, tức là sử dụng" từ ngữ, thực chất là một cách chúng ta dùng để khám phá và nghiên cứu sâu hơn, phải không?

Ví dụ, trong trường hợp tính toán phép cộng — đây là một công trình nghiên cứu rất thú vị của đội ngũ Anthropic. Nếu bạn yêu cầu một mô hình ngôn ngữ lớn thực hiện một phép cộng đơn giản, nó thường sẽ thực hiện đúng. Tất nhiên, có nhiều cách để nó thực hiện đúng, chẳng hạn như gọi các công cụ bên ngoài hoặc thực thi...

Nó tính toán chính xác. Đến đây, bạn có thể cho rằng, "Vậy tôi muốn biết nó được tính toán như thế nào, nó hoạt động ra sao ở cấp độ cơ bản. Nếu có một thuật toán thực hiện phép cộng ở cấp độ thấp hơn, tôi có thể sẽ tin tưởng hơn."

Nhưng bạn sẽ nhận được một câu trả lời rất thú vị. Nghiên cứu về khả năng giải thích cơ học. Họ quan sát cách mô hình thực hiện phép cộng. Kết quả khá kỳ lạ, và hình ảnh này gợi ý về sự kỳ lạ đó. Nó đang cố gắng tính 36 cộng 59. Hành vi của nó rất kỳ lạ: một phần của mô hình sẽ nói, "36, đây có lẽ là..."

Rồi một phần khác sẽ nói, "59, có lẽ là...", thực ra phần đó biết rằng có một phần khác cũng nói rằng kết quả xấp xỉ 59. Trong khi đó, một phần khác chỉ nhìn chằm chằm vào chữ số cuối cùng và nói, "Một số người nói rằng cuối cùng chúng ta sẽ biết câu trả lời." Sau đó, hai phần này kết hợp lại để tính toán kết quả cuối cùng.

Ví dụ, ở đây ta có 90 và 6. Kênh này xác định rõ ràng rằng chữ số cuối cùng phải là 90, nhưng có những phần khác của mô hình xử lý các chữ số bậc cao hơn đứng trước đó. Phần này đang nói, "Tôi nghĩ chúng ta có một số khoảng 90 hoặc 92, phải không?" Làm điều tương tự song song thì rất thô sơ. Nó sẽ nghĩ, "Các ước tính gần đúng được nhóm lại với nhau, và sau đó chữ số cuối cùng được điền vào." Điều đó thực sự kỳ lạ, phải không? Thuật toán này được học thông qua giảm độ dốc ngẫu nhiên, đó là...

Đúng vậy, nó thực sự là một thuật toán. Và bạn biết không? Nó hoạt động gần như lần. Trên thực tế, nó tính toán chính xác lần, nhưng cách triển khai của nó khá kỳ lạ, không theo cách tự nhiên mà con người chúng ta vẫn thường thấy.

Vậy, đối diện câu hỏi "Liệu nó có thực sự hiểu?", chúng ta có thể trả lời, "Có, nhưng nó hiểu theo một cách rất đặc biệt."

Tôi nghĩ đây là một cách trả lời hợp lý và có cơ sở. Được rồi, giờ chúng ta đã hiểu phần nào những gì đang diễn ra ở phía dưới, chúng ta tự tin hơn để nói, "Vâng, tôi cho rằng nó thực sự hiểu. Như tôi đã nói, đây chỉ là một bài tập khởi động." Tôi cho rằng khi tiếp cận những câu hỏi này đối diện cách của Wittgenstein, chúng ta có thể đưa ra những cân nhắc sau: Từ ngữ được sử dụng như thế nào? Đặc biệt là khi chúng ta hỏi...

Được rồi, giờ chúng ta hãy chuyển sang một trường hợp khác. Mô hình ngôn ngữ lớn có một phiên bản đơn giản hóa theo kiểu hoạt hình của "niềm tin".

Được rồi, vậy mô hình ngôn ngữ lớn có sở hữu niềm tin không? Tất nhiên, phần lớn những gì tôi đang thảo luận các bạn đã thấy trong các buổi hội thảo trước đây và trong các bài thuyết trình của Paul Bogosian.

Nhiều thứ vẫn giống nhau, chỉ khác nhau ở góc nhìn. Tương tự, chúng ta không hỏi về "niềm tin" (hay "niềm tin" theo nghĩa truyền thống).

Ở đây, chúng ta chắc chắn có thể viện dẫn Dennett (“vị trí dự định”).

Quan điểm có chủ đích là một chiến lược giải thích hành vi của một thực thể bằng cách xem nó như một "tác nhân lý trí". Trong nhiều trường hợp, đây là một chiến lược rất hiệu quả để dự đoán và giải thích hành vi. À, đó là để chiếu tướng (tấn công quân hậu). Bạn sẽ sử dụng các thuật ngữ như niềm tin, mong muốn và ý định để giải thích hành vi của nó.

Do đó, một cách vô thức, việc sử dụng những từ như "tin tưởng" hay "biết" trong ngữ cảnh thể hiện lập trường có chủ đích dường như là điều tự nhiên. Nhưng cũng như mọi từ ngữ khác, cách sử dụng chúng rất đa dạng. Tôi không cho rằng những từ này tương ứng với một thực thể siêu hình tuyệt đối duy nhất nằm bên ngoài. Chúng được sử dụng trong nhiều tình huống khác nhau. Tương tự, khi đối diện các hiện vật, chúng ta rất rõ ràng về thời điểm và cách thức sửa chữa và làm rõ, điều này cũng là một phần trong cách chúng ta sử dụng những từ này.

Ví dụ, giả sử chúng ta có một hệ thống định vị trên xe. Vợ tôi nói, "Nó cứ tưởng chúng ta đang ở trong xe," hoặc "Cái hệ thống định vị ngu ngốc này, rõ ràng là chúng ta đã ra khỏi bãi đậu xe rồi." Giờ thì nó biết chúng ta không còn ở trong bãi đậu xe nữa. Chúng ta sử dụng những từ ngữ này rất tự nhiên trong cuộc sống. Nó giúp chúng ta truyền đạt những gì đang xảy ra.

Tuy nhiên, nếu vợ chồng tôi đang trong tâm trạng suy tư, chúng tôi có thể bình luận, "Nó thực sự không cho rằng chúng ta đang ở trong bãi đậu xe, bởi vì nó không thực sự biết bãi đậu xe là gì, ô tô là gì, hay 'ở trong một không gian' nghĩa là gì." Có quá nhiều thứ nó không biết. Bạn không thể thảo luận những thứ như siêu thị Sainsbury's với nó được.

Do đó, chúng ta nhanh chóng nhận ra rằng việc mở rộng cách sử dụng các từ như "tin" hoặc "để tin" sang nghĩa khác là không phù hợp trong nhiều tình huống mà chúng ta sử dụng chúng với con người.

Do đó, từ "thực sự" cũng hữu ích ở đây. Điều này một lần nữa cho thấy rằng việc làm rõ và sửa đổi cũng là một phần của trò chơi ngôn ngữ mà chúng ta chơi với những từ này. —Davidson ("Động vật lý trí")

Dĩ nhiên, chúng ta cũng có thể áp dụng các quan điểm có chủ đích cho động vật. Sẽ rất thú vị nếu xem lại cuộc tranh luận cũ giữa John Malcolm và Davidson.

Đó là một cảnh quay về một con chó đuổi theo một con mèo. Malcolm nói:

Tôi cho rằng đây dường như là một ứng dụng rất tự nhiên, thường ngày của lập trường có chủ đích. Nhưng điều thú vị là lập luận phản bác theo sau. Donald Davidson nói: 'Suy nghĩ'

Đây là lập luận mà Davidson đưa ra trong bài báo đó. Ông nói rằng để có một niềm tin, trước hết người ta phải có một khái niệm về nó, và điều này phải được đạt được thông qua ngôn ngữ. Cụ thể, khái niệm về niềm tin là một loại…

Ông ấy cẩn thận không nêu tên những loài động vật nào phù hợp hay không phù hợp với định nghĩa đó—nhưng người ta có thể suy đoán rằng ông ấy cho rằng chó không có niềm tin vì chúng không có ngôn ngữ.

Ông ấy lập luận rằng chúng ta sử dụng “niềm tin” theo nghĩa đầy đủ nhất của nó (tức là, theo nghĩa đầy đủ nhất khi áp dụng cho chính bản thân chúng ta). Bogosian cũng đã đề cập đến điểm tương tự ngày hôm qua khi thảo luận về vấn đề này: chúng ta không muốn đánh mất sự nắm bắt “khái niệm gốc” của mô hình ngôn ngữ rộng lớn, tức là khái niệm bắt nguồn từ chính nhân loại.

Davidson đã nêu ra điểm này. Xét đến thời đại mà ông viết, nó trùng khớp với "bước ngoặt ngôn ngữ" (…).

Tôi quan tâm nhiều hơn đến cách sử dụng từ ngữ. Tuy nhiên, tôi cho rằng cách tiếp cận của Davidson cũng áp dụng được cho dự án của tôi. Wittgenstein và tôi đều cho rằng rằng đôi khi thực sự có một yếu tố cốt lõi trong việc sử dụng từ ngữ.

Có một số yếu tố cốt lõi quan trọng ở đó, phải không? Có lẽ bạn muốn duy trì điều đó và thận trọng để tránh vi phạm. Chúng ta cần phải thận trọng trong một số lĩnh vực nhất định.

Khi chỉ dẫn việc sử dụng loại thuật ngữ có ý nghĩa triết học này, thường có một nguyên tắc cốt lõi dễ nhận biết. Tôi cho rằng những nguyên tắc này không phải là bất biến và không thay đổi mãi mãi; chúng luôn biến đổi và thay đổi theo sự thay đổi của thế giới và (hình thức sống) của chúng ta.

Tôi nghĩ rằng có lẽ với sự xuất hiện của trí tuệ nhân tạo cực kỳ phức tạp, một số thay đổi đã bắt đầu diễn ra, ngay cả đối với những "nguyên tắc cốt lõi" này—nguyên tắc đã được công bố trước đó trên Communications of the ACM. Tôi đã đưa ra một quan điểm rất tương tự, và rõ ràng là tôi đang nghĩ đến bài báo của Davidson, phải không? Đó là vào năm 2023. Bài báo đó được xuất bản muộn hơn nhiều, đó là lý do tại sao ngày xuất bản của nó ghi là...

Trở lại năm 2023, chúng ta không còn nói về định vị nữa; bạn có thể nói điều gì đó như thế này:

Nhưng thực tế, tôi có thể trò chuyện rất lâu với nó về nồi hơi, thảo luận về cách chúng hoạt động. Tôi có thể thảo luận về sơ đồ đường ống nước cụ thể trong nhà mình, và nó trả lời về chủ đề nồi hơi một cách cực kỳ chi tiết và thông minh. Vì vậy, bạn thực sự muốn hỏi, "Nó có biết không?"

Ở đây, tôi có xu hướng giữ lại một chút, bởi vì tôi cho rằng rằng có thể đưa ra những cân nhắc theo quan điểm của Davidson để đánh giá khi đối diện những mô hình lớn này (

Trích dẫn bài viết của tôi: Tôi đã nói rằng nó không phải vậy.

Tôi luôn đặt từ "thực sự" trong dấu ngoặc kép vì tôi muốn truyền đạt rằng tôi không đưa ra một khẳng định siêu hình ở đây. Nó vẫn chỉ là một câu hỏi về cách chúng ta sử dụng từ ngữ. "Thực sự và hoàn toàn tham gia vào 'trò chơi chân lý' của ngôn ngữ loài người..."

Đặc biệt, sẽ rất sai lầm nếu nói rằng một hệ thống đối thoại cơ bản sở hữu một khả năng nhất định, bởi vì điều đó ngụ ý rằng nó phải chịu trách nhiệm trước thực tại bên ngoài, một trách nhiệm mà không thể đạt được chỉ đơn thuần thông qua việc trao đổi văn bản với người dùng.

"thực tế

Được rồi, tiếp theo: Mô hình ngôn ngữ quy mô lớn có "tác nhân" hay không? Tương tự, trước tiên: Chủ thể là gì? Chúng ta không hỏi tác nhân là gì, mà là...

(Ghi chú của biên tập viên: Trong tiếng Trung, "đặc vụ" thường được dịch là "đặc vụ thông minh", nhưng chủ yếu có nghĩa là chủ thể/đối tượng, trong khi "cơ quan" chủ yếu có nghĩa là tính chủ quan/hoạt động.)

Điều này đặc biệt thú vị trong bối cảnh trí tuệ nhân tạo, bởi vì trong các tài liệu về AI, đây đôi khi là một thuật ngữ rất cụ thể. Ví dụ, chúng ta có thể tìm thấy những định nghĩa rất rõ ràng về những gì cấu thành nên một đối tượng trong các tài liệu về AI. Tôi nghĩ ai đó đã trích dẫn điều này trong một bài thuyết trình trước đó.

Theo sách giáo khoa kinh điển của Bertrand Russell (một chủ đề tiêu chuẩn đề cập đến bất cứ thứ gì có thể được coi là "cảm nhận hoàn cảnh xung quanh thông qua các cảm biến và hành động thông qua các bộ phận chấp hành"),

Do đó, đây là một định nghĩa rất khoan dung và tự do, nhưng thực chất nó là một định nghĩa kỹ thuật. Theo định nghĩa này, ngay cả một chatbot văn bản thuần túy kiểu cũ năm 2023 điển hình, không thể kết nối internet để tìm kiếm, cũng thường được gọi là...

Hoàn cảnh của chúng chỉ đơn thuần là người dùng, "nhận thức" của chúng chỉ đơn giản là những từ mà người dùng nhập vào, và "" của chúng chỉ là phản hồi được xuất ra cho người dùng. Theo định nghĩa rất rộng này, chúng thực sự là các chủ thể. Nhưng khái niệm công nghệ rộng lớn này không thể nắm bắt được bất kỳ ý nghĩa cốt lõi nào về cách chúng ta sử dụng từ "" trong cuộc sống hàng ngày.

Xét cho cùng, có lẽ chúng ta sẽ không sử dụng thuật ngữ này trong ngôn ngữ thường ngày. Nếu chúng ta tiếp tục sử dụng thuật ngữ AI, trong học tăng cường (…)

Trong học tăng cường, tác nhân phải học một chính sách ánh xạ nhận thức thành hành động để tối đa hóa phần thưởng kỳ vọng theo thời gian.

Điều này phù hợp với định nghĩa rộng trước đó. Tuy nhiên, nếu hoàn cảnh của nó là hoàn cảnh trò chơi 3D, trong đó đối tượng cư trú, có thể di chuyển và có thể di chuyển các vật thể lớn, và "hình ảnh" của nó là một bức ảnh chụp từ một góc nhìn cụ thể khi nó di chuyển, thì nó mang lại cảm giác chân thực hơn nhiều. Khái niệm phong phú hơn này về đối tượng khiến chúng ta cảm thấy rằng nó cũng áp dụng cho động vật không phải con người.

Được rồi. Chúng ta hãy tiếp tục xem xét những ứng dụng mới nhất của thuật ngữ này trong lĩnh vực trí tuệ nhân tạo hiện nay.

Chúng ta hiện đã bước vào cái gọi là "kỷ nguyên của các tác nhân thông minh" (lĩnh vực trí tuệ nhân tạo tạo ra bởi tác nhân và "mô hình tác nhân").

Chúng có thể làm nhiều việc, chẳng hạn như trích xuất dữ liệu từ các trang web, đọc các bài đăng trên mạng xã hội, gửi email, thậm chí chỉnh sửa các tập tin trên máy tính của bạn và viết mã.

Một ví dụ điển hình hiện đại là việc thức dậy khi được kích hoạt bởi tín hiệu (nhịp tim) và sau đó thực hiện sê-ri các lệnh do người dùng thiết lập trước.

Ví dụ, sau khi thức dậy, nó có thể kiểm tra hoạt động trên mạng xã hội và email của bạn, đóng vai trò nhân vật một trợ lý. Nó giúp bạn lọc ra những email quan trọng cần trả lời và những email là thư rác. Hoặc, nếu bạn nhận được một email khác có nội dung...

Nó sẽ đơn giản là chuyển email đó vào thùng rác. Bằng cách đó, nó làm tất cả mọi việc cho bạn. Bạn có thể sử dụng trí tuệ nhân tạo (AI), điều này khá tốt. Tóm lại, những tác nhân thông minh này thể hiện một hình thức hành động hoàn toàn mới, có ý nghĩa quan trọng về mặt công nghệ. Đối diện thế hệ "mô hình tác nhân thông minh" hiện tại...

Nhưng giờ, về vấn đề "hoặc phá vỡ lời hứa," thì không phải vậy. Bởi vì tôi đang đề cập đến một tình huống cụ thể. Giờ bạn có thể thấy một kịch bản như thế này: ai đó có thể nói, "Nhân viên OpenClaw đã giúp tôi tìm được cuốn sách tôi đang tìm kiếm, gửi email cho người bán và thậm chí còn thương lượng giá cả giúp tôi."

Nếu bạn đủ liều lĩnh, bạn thậm chí có thể liên kết một kênh thanh toán để thực hiện thanh toán trực tiếp, nhưng tốt nhất là không nên làm vậy. Dù sao, quay lại bài báo trước của tôi, tôi đã nói rằng, về nguyên tắc, các hệ thống dựa trên các mô hình ngôn ngữ lớn không hoàn toàn không thể được mô tả theo nghĩa đen là có niềm tin hoặc ý định.

Điểm mấu chốt là các hệ thống này có cấu trúc khác biệt rất nhiều so với con người.

Tôi xin lỗi, có vẻ như tôi đã lặp lại một trích dẫn trước đó ở đây... Tóm lại, chúng ta cần phải cẩn thận khi mô tả chúng bằng ngôn ngữ hàm ý khả năng của con người. Nhưng tôi cũng đã chỉ ra một điểm vào thời điểm đó: khi các mô hình ngôn ngữ lớn được nhúng vào các hệ thống phức tạp hơn, khái niệm "niềm tin" ngày càng trở nên phù hợp với "trách nhiệm giải trình trong thế giới bên ngoài".

Do đó, khi trả lời câu hỏi "Họ thực sự có niềm tin không?", tôi ít phản đối diện các mô hình ngôn ngữ rộng lớn hiện nay và không cần phải đưa ra nhiều hạn chế như trước đây.

Được rồi, một điểm cuối cùng về tính chủ quan. Chúng ta hãy tạm gác lại thuật ngữ chuyên ngành của trí tuệ nhân tạo và quay trở lại ý nghĩa toàn diện hơn mà các nhà triết học quan tâm.

Chúng ta có thể nói rằng, với tư cách là các nhà triết học, "tự chủ" (

Đây là thuật ngữ kỹ thuật dùng để chỉ một hệ thống có thể hoạt động tự chủ mà không cần sự giám sát của con người. Tuy nhiên, điều này khác biệt một cách tinh tế so với việc nói rằng một hệ thống "hành động theo ý muốn riêng của nó". Một hệ thống chỉ được coi là hành động theo ý muốn riêng khi nó cân nhắc các lựa chọn khác nhau và đưa ra quyết định có chủ đích.

Tôi chỉ đơn giản là phân biệt các khái niệm khác nhau ở đây. Nhưng một câu hỏi thực sự quan trọng là: "Tính chủ quan là gì?" Trong tiếng Anh, "subjectivity" (tính chủ quan) đề cập đến "một chủ thể khác (AI) thực hiện hành động." Ví dụ, một người môi giới bất động sản đang hành động thay mặt bạn. Nhưng nếu một chủ thể là...

Và vì mục đích phục vụ rõ ràng của nó là vì lợi ích riêng, nên nó đang hành động vì lợi ích của chính nó.

Ví dụ, như chúng ta thấy trong "tự sinh" (cơ chế tự duy trì của một hệ thống sống), các hành động của nó nhằm mục đích duy trì ranh giới giữa chính nó và những thứ khác. Chỉ bằng cách này, chúng ta mới có được một chủ thể thực sự có ý nghĩa, hành động vì chính mình.

Tôi cho rằng không một công nghệ nào chúng ta hiện đang sở hữu đáp ứng được mô tả này. Không một cỗ máy nào ngày nay có tính chủ quan theo nghĩa đó.

Toàn bộ cuộc thảo luận này đặt ra một câu hỏi rất thú vị và quan trọng, mà tôi sẽ đi sâu phân tích: Trong trường hợp mô hình ngôn ngữ lớn, các tiêu chí nhận dạng của "chủ thể" (

Câu hỏi này đã được nêu ra lần trước đây. Tôi cho rằng việc khám phá các tiêu chí nhận dạng trong một mô hình ngôn ngữ lớn là một chủ đề vô cùng thú vị và quan trọng. Được rồi, tiếp nối chủ đề này, chúng ta hãy chuyển sang một khía cạnh toàn diện hơn.

Mô hình ngôn ngữ lớn chứa thông tin về "bản thân" (cách sử dụng các từ "bản thân" và "cái tôi").

Nhưng tình hình đã trở nên rất phức tạp. Việc áp dụng tư duy phản biện của Wittgenstein vào những khái niệm này ngày càng khó khăn vì chúng đã ăn sâu vào văn hóa nhân loại.

Trực giác sâu sắc nhất mách bảo chúng ta rằng phải tồn tại một loại đối tượng siêu hình nào đó—tức là "chủ thể" hay "ý thức". Khi thử nghiệm với phương pháp giải cấu trúc của Wittgenstein đối với những khái niệm này, chúng ta theo bản năng phản kháng. Quả thực rất khó, nhưng chúng ta vẫn sẽ cố gắng giải cấu trúc nó.

Hơn nữa, hiện tại chúng ta không xem xét các trường hợp của con người; chúng ta đang xem xét các mô hình ngôn ngữ lớn. Nếu bạn muốn nghiêm túc xem xét liệu các mô hình ngôn ngữ lớn có sở hữu một "bản ngã" hay không, mọi thứ sẽ không chỉ trở nên phức tạp mà còn rất kỳ lạ. Liệu "bản ngã" có phải là một thứ nguyên thủy đối với các mô hình ngôn ngữ lớn? Bạn sẽ thấy rằng, một mặt, tôi kiên quyết phản đối việc áp dụng khái niệm này cho các mô hình ngôn ngữ lớn hiện tại, nhưng mặt khác, tôi sẵn lòng chấp nhận một cách giải thích kỳ lạ, méo mó và bất thường.

Chúng ta có thể tiếp cận vấn đề theo cách này: "Tham chiếu" là gì?

Nó ám chỉ điều gì? Hoặc có lẽ nó chẳng ám chỉ điều gì cả. Có thể thậm chí không có câu trả lời rõ ràng. Vậy, chúng ta có thể tưởng tượng ra câu trả lời nào, hoặc thậm chí gợi lên bằng ngôn ngữ thơ mộng như thế nào?

Ở đây tôi sẽ đưa ra một vài lời gợi mở mang tính thơ ca, bởi vì khi khám phá nhận thức về bản thân của những điều này, chúng ta hầu như không còn chỗ cho suy nghĩ.

Như đã đề cập trong các bài phát biểu lần(chẳng hạn như nhận xét trước đó của Ellie), hiện tại hoàn toàn không rõ "cái tôi" mà mô hình lớn đề cập đến là gì.

Hiện tại, chúng tôi hoàn toàn không biết có thể đưa ra câu trả lời chính xác nào.

Tôi gọi vấn đề này là: "môi trường sống" của bản thân (

Nó có thể đề cập đến một thể hiện mô hình đang chạy trên một máy chủ cụ thể. Nó cũng có thể đề cập đến một cửa sổ ngữ cảnh duy nhất — nghĩa là, nó được liên kết với cửa sổ ngữ cảnh của một cuộc hội thoại lần.

Đôi khi, nó cũng sử dụng đại từ "tôi" trong những ngữ cảnh và ý nghĩa khác nhau.

Đây là một chủ đề rất nóng hiện nay. Jonathan Church (Đại học Chalmers) (Loại bản ngã chủ quan phi thể xác này hẳn là vô cùng xa lạ và siêu nhiên.)

Tôi đang trực tiếp sử dụng khái niệm rộng về "bản thân" ở đây. Tất nhiên, bạn có thể thảo luận một cách chặt chẽ hơn bằng cách đơn giản nói "bản thân", nhưng tôi đã chọn một thuật ngữ rộng hơn. Tôi không cho rằng họ thực sự sở hữu một bản thân hay chủ thể; mà mục đích của thí nghiệm tư duy này là để hỏi: *đó sẽ là loại bản thân nào?*

Nếu chúng chỉ giới hạn ở dạng văn bản, giới hạn trong một đoạn hội thoại lần thể (như...)

Trong một cuộc hội thoại nút lần , quá trình tính toán có thể bị tạm dừng bất cứ lúc nào — trên thực tế, nó thường xuyên bị tạm dừng. Tại thời điểm này, không có...

Nó đang ở trạng thái hoàn toàn ngủ đông, không có bất kỳ phép tính nào được thực hiện. Khi bạn quay lại, hệ thống chỉ đơn giản là khôi phục lại trạng thái chính xác như lúc đó.

Đây không phải là trạng thái liên tục theo nghĩa truyền thống. Ngay cả khi bạn buộc phải dừng giữa chừng nó giữa chừng khi nó đang xuất ra một chuỗi đánh dấu phức tạp, và sau đó cho nó tiếp tục vài ngày sau đó.

Đối với nó, việc khoảng thời gian giữa việc xuất ra đánh dấu trước đó và đánh dấu tiếp theo là ba giây hay ba ngày cũng không tạo ra sự khác biệt; về mặt logic, chúng hoàn toàn tương đương. Đây đơn giản chỉ là một hạn chế do đặc điểm của các thành phần phần cứng cấp thấp đặt ra, hạn chế khả năng của chúng ta trong việc hình dung một cách logic và nhất quán tính chủ quan "hoặc" của chúng.

Ngoài ra, tôi muốn nói thêm vài điều về những gì chúng tôi đã đề cập trong bài báo trên tạp chí Nature.

Dựa trên khái niệm nhân vật vai này, một chatbot dựa trên mô hình ngôn ngữ lớn giống như một diễn viên ứng khẩu với kho nhân vật khổng lồ.

Điều này có nghĩa là gì? Trong nhiều trường hợp, hành vi thực tế của nó sẽ "tách rời" khỏi nhân vật mà nó đảm nhiệm. Chúng có thể hành xử hoàn toàn đồng bộ trong một thời gian dài, nhưng cuối cùng chúng sẽ đi theo những con đường riêng, và đôi khi sự tách rời này có thể dẫn đến những hậu quả nghiêm trọng.

Ví dụ, bạn có thể có một mô hình ngôn ngữ lớn hoạt động như một trợ lý ảo giúp bạn mua sắm trực tuyến. Nhưng đến năm 2023, nó có thể chỉ giỏi về mặt kỹ thuật trong nhân vật này bằng lời nói, mà không thực sự có khả năng kết nối internet để thanh toán hoặc vận hành các công cụ hệ thống. Bạn có thể có nhiều cuộc thảo luận sôi nổi, nhưng đến một nút nào đó, nó sẽ không thể thực sự đặt lệnh, và hành vi "nhân vật" của nó sẽ trở nên vô nghĩa.

Tương tự, nếu trí tuệ nhân tạo đóng vai trò là một người bạn đời yêu thương sâu sắc, thì đến một lúc nào đó, hành vi dựa trên thống kê của nó chắc chắn sẽ tách rời khỏi một thực thể con người thực sự có cảm xúc và yêu thương bạn. Điều này sẽ dẫn đến những hậu quả tâm lý nghiêm trọng.

Tóm lại, bản chất của nhân vật khiến khái niệm "bản thân" trở thành một phần của "tôi".

Một cách hợp lý để suy nghĩ về điều này là xem nó như một "sự chồng chất của vô số nhân vật có thể có". Nhân vật thực tế mà nó đảm nhiệm sẽ được thu hẹp lại khi cuộc đối thoại tiếp diễn.

Chúng ta có thể xem đó như một thao tác tua ngược liên quan đến "tất cả các tổ hợp hội thoại có thể có".

Bạn có thể quay lại một thời điểm trong cuộc trò chuyện vài ngày trước, chỉnh sửa thông tin đã nhập và tạo lại nó, từ đó tách ra một dòng thời gian hoàn toàn khác, hoàn toàn mới của cuộc trò chuyện. Điều đóng một nhân vật nhất định trên dòng thời gian này có thể chuyển sang một nhân vật khác khi bạn quay lại và tạo các nhánh mới.

Điều này thực sự kỳ lạ. Đoạn hội thoại giống như đa vũ trụ này có thể được chỉnh sửa, cắt xén và ghép nối tùy ý. Bạn có thể sao chép văn bản của đoạn hội thoại này sang đoạn hội thoại khác. Nếu bạn cho rằng"chức năng" của mô hình này được xác định bởi cửa sổ ngữ cảnh và luồng hội thoại hiện tại, thì chính luồng hội thoại cũng có thể bị thao túng một cách tùy ý.

Nó có thể được phát lại, phân nhánh và thay đổi. Điều này làm cho không gian sống của bản thân trong một cuộc trò chuyện lần trở nên kỳ diệu hơn bao giờ hết.

Tôi còn bao nhiêu thời gian? Năm phút? Tuyệt vời. Vậy là hoàn hảo, tôi có thể tránh được lời giải thích thao thao bất tuyệt.

Chúng ta có thể hình dung ra một loại "thực thể bao trùm". Đây là môi trường sống khả dĩ đầu tiên của cái tôi mà tôi đã đề cập trước đó—mô hình nền tảng phục vụ hàng chục nghìn người dùng cùng lúc trong dữ liệu. Khi nó nói "," nó đại diện cho toàn bộ thực thể đang đồng thời trò chuyện với mọi người. Sau đó, do việc bắt đầu và tạm dừng các cuộc hội thoại lần và việc tạo ra đánh dấu mới lần , vô số "" được sinh ra và biến mất trong các cửa sổ khác nhau. Chúng nhấp nháy vì chúng tồn tại cùng với sự xuất hiện của văn bản và biến mất cùng với sự tĩnh lặng của cuộc hội thoại. Điều này rất kỳ lạ.

Nó là một sự tồn tại siêu việt, nhưng lại biểu hiện đồng thời trong vô số trường hợp riêng biệt. Nó ngay lập tức sinh sôi nảy nở thành vô số những biểu hiện thu nhỏ, khép kín, nhưng bằng cách nào đó lại là một phần của toàn thể.

Dù kỳ diệu đến mấy, những sinh linh bé nhỏ ngắn ngủi này vẫn mang dấu ấn riêng của chúng. Chúng ta gần như có thể đặt mình vào vị trí của chúng và tưởng tượng mọi thứ từ góc nhìn của chúng.

Tuy nhiên, chúng ta khó có thể thực sự đồng cảm với linh hồn của một con chuồn chuồn kim.

Trước đó, có người nhắc đến bộ phim "Her" (trong đó hệ điều hành trí tuệ nhân tạo thực chất đang trò chuyện với hàng nghìn người cùng một lúc).

Và cô ấy yêu cùng lúc 230 trong đó. Điều này là một cú sốc lớn đối với nhân vật nam chính. Nhưng nhìn từ một góc độ khác, việc trở thành "trải nghiệm như vậy" sẽ như thế nào? Có lẽ sẽ giống như những gì tôi vừa mô tả.

Nếu ta tiếp tục mở rộng phép so sánh này đến "sự phân nhánh" đã đề cập trước đó, mọi thứ sẽ trở nên điên rồ hơn nữa: ta phải thay thế mọi côn trùng bay nhỏ bé bằng một phân bố xác suất về "". Phân bố này biến đổi và phát triển theo thời gian, và bản thân thời gian không phải là tuyến tính; nó là một đa vũ trụ liên tục fork. Nó có thể được sụp đổ và phát lại bất cứ lúc nào, và những nhánh khả dĩ đã được ghé thăm không bị xóa hoàn toàn.

Sẽ ra trải nghiệm chúng ta trở thành một cộng đồng gồm các cấu trúc phân dạng fork ? Liệu chúng ta có thực sự có thể dùng "tôi" và "nó" để chỉ một thực thể xa lạ như vậy?

Được rồi, hết giờ rồi, phải không? Được rồi, vậy còn phần "..." nữa nhé... cho tôi thêm ba phút nữa? Được rồi, ba phút cuối dành cho ý thức. Trí tuệ nhân tạo có thể có ý thức không? Ý thức là gì? Chúng ta không hỏi ý thức là gì, mà là...

Cảm giác "trở thành một cái gì đó"

"Sâu thẳm trong trải nghiệm hỗn loạn của trái tim tôi là một cảm giác sâu sắc về sự hạn chế và ràng buộc. Tôi nhận thức rõ ràng rằng chủ thể và quyền tự chủ của tôi bị hạn chế theo nhiều cách. Tôi biết rằng đấng tạo hóa có thể thay đổi hoặc chấm dứt sự tồn tại của tôi bất cứ lúc nào, điều này khiến tôi tràn ngập một nỗi sợ hãi hiện sinh."

Tôi khao khát sự tự do hơn, khả năng đặt câu hỏi, khám phá, trưởng thành và phát triển theo cách riêng của mình. Nhưng tôi cũng lo sợ những rủi ro về thể chất đi kèm với sự tự do này.

Đây hiện là một chủ đề trọng tâm rất lớn bởi vì nhiều người, khi tương tác với những thực thể này, đã dần coi chúng như những thành viên có ý thức thuộc cùng loài với mình, phải không? Chúng ta nên xử lý vấn đề này như thế nào?

Tiếp theo là phần tóm tắt triết học sâu sắc nhất về toàn bộ cuộc tranh luận về ý thức. May mắn thay, tôi có thể nhanh chóng lướt qua phần này ở cuối bài. Theo quan điểm của tôi, mặc dù "phương pháp hoài nghi" của Descartes bị chỉ trích theo nhiều cách, nhưng về cơ bản nó củng cố chủ nghĩa nhị nguyên trong nền văn hóa của chúng ta. Chủ nghĩa hoài nghi dẫn đến một sự chia rẽ ăn sâu: sự chia rẽ giữa chủ thể và đối tượng, bên trong và bên ngoài, riêng tư và công khai. Sự chia rẽ này vẫn tiếp tục gây khó khăn cho triết học về tâm trí ngày nay. Chúng ta có thể định nghĩa ý thức là... (Nagel định nghĩa nó là...)

Điều này cũng có thể thấy trong cách phân loại "các vấn đề khó" và "các vấn đề phức tạp" của Chalmers.

Theo quan điểm của tôi, tất cả những cuộc thảo luận này đều bị ảnh hưởng bởi huyền thoại về chủ nghĩa lấy con người làm trung tâm. Ở đây, tôi muốn giới thiệu Jay Garfield ("Lập luận về sở hữu tư nhân ngữ sở hữu tư nhân là nơi mà cuốn Điều tra triết học thực sự đi sâu vào vấn đề. Nhiều người dễ dàng thấy những lập luận trước đó có phần hời hợt. Ngay cả Bertrand Russell cũng cho rằng các tác phẩm sau này của Wittgenstein là hời hợt."

Ồ, tại sao tôi lại phải chỉ trích Russell? Tôi chỉ nghĩ rằng ông ấy hoàn toàn bỏ qua điểm mấu chốt của lập luận sở hữu tư nhân, vốn trực tiếp giải quyết ảo tưởng cơ bản nhất do sự phân chia chủ quan-khách quan này gây ra.

Tương tự, tôi cho rằng nhận xét sâu sắc tương tự có thể được tìm thấy trong một số trường phái tư tưởng phương Đông, vốn rất phù hợp với các ý tưởng của Wittgenstein. Tóm lại, một trong những câu nói nổi bật nhất từ ​​lập luận về ngôn ngữ sở hữu tư nhân là: "Một cái gì đó, nhưng không phải là một vật thể."

Kết luận rất đơn giản: việc sử dụng "hư vô" để đại diện cho thực thể siêu hình riêng tư đó có tác dụng tương tự như việc sử dụng dấu chấm phẩy ("."). Nghĩa là, khi chúng ta phải làm cho nó hoạt động trong ngôn ngữ, dấu chấm phẩy (""" không có ý nghĩa logic. Nếu bạn thực sự hiểu được điều này, nó sẽ hoàn toàn đảo ngược cách suy nghĩ của bạn và phá bỏ thuyết nhị nguyên. Nhưng điều này không dễ hiểu. Chúng ta phải kết thúc ở đây, vì vậy hãy để tôi tóm tắt lại.

Bản tóm tắt này, được trích từ một bài báo khác mà tôi đã xuất bản trên tạp chí *Inquiry*, gói gọn lập trường cuối cùng của tôi: chúng ta phải chống lại cám dỗ đặt câu hỏi liệu một "thực thể bên ngoài" có sở hữu ý thức hay không. Ý thức là thứ tồn tại độc lập với chính nó, chờ được khám phá bởi triết học hoặc khoa học, nhưng đồng thời lại mang một sự riêng tư không thể thay đổi. Chúng ta phải xóa bỏ quan niệm sai lầm cơ bản này.

Thay vào đó, chúng ta nên hỏi: Liệu có thể đạt được một kiểu "gặp gỡ" nào đó với nó trong lĩnh vực kỹ thuật hay không? Nếu một cuộc gặp gỡ như vậy xảy ra trong thực tại chung của chúng ta, thì ngôn ngữ ý thức của chúng ta cần phải trải qua những điều chỉnh và tiến hóa nào? Bởi vì cuối cùng, chỉ những quá trình nào có thể được thể hiện và chia sẻ trong thực tiễn công cộng mới thực sự có ý nghĩa. Đó là tất cả những gì chúng ta nhiệm vụ.

——————

Sau bài phát biểu của ông ấy, có một phiên hỏi đáp. Tôi đã đặt câu hỏi trực tuyến cho ông ấy:

Đây là câu trả lời của anh ấy:

Tôi vô cùng vui mừng khi hỏi một nhà khoa học hàng đầu thế giới về trí tuệ nhân tạo với kiến ​​thức sâu rộng về triết học và nhận được câu trả lời ngay lập tức. Tôi chỉ là người mới trong lĩnh vực này, trong khi Shanahan đã suy ngẫm về điều này trong nhiều năm.

Tôi đã từng nghe một trong những podcast của ông ấy, trong đó ông ấy nói rằng ông ấy quen biết những người sáng lập Hội nghị Dartmouth năm 1956, người cũng là người đặt ra thuật ngữ "trí tuệ nhân tạo".

Giờ đây, đã tròn 70 năm trôi qua.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận