北京時間2026年5月22日晚,最懂哲學的谷歌DeepMind首席科學家沙納漢(Murray Shanahan)在為期兩天的倫敦大學AI與哲學國際會議上做了閉幕主旨演講,題目是上圖中的那個:如果大語言模型是“奇異的心智類實體”,那麼它們與心智的相似程度有多高?
我之前研讀過沙納漢。這個“奇異的心智類實體”,就是他對AI的叫法,就像某些人對某些“不明飛行物”的叫法那樣。
他的演講內容很豐富,概括來說,基本有這些方面:

摘要:基於維特根斯坦“意義即使用”的哲學框架,他探討了大語言模型(LLM)在理解、信念、代理及能動性、自我及意識等心智屬性上的適用性,分析了多模態與具身化對概念演化的影響,並深入討論了模型身份認同的奇異性。
一、理解與信念的適用性分析
針對 LLM 是否具備“理解“信念”的問題,發言採用了維特根斯坦式的語言遊戲分析方法,探討了日常使用與哲學嚴格性之間的張力:
1. “理解”的語言遊戲
日常使用的自然性:在日常交互中,人們很難避免使用“理解”一詞來描述LLM 的行為。例如,當模型根據用戶指令精確格式化 LaTeX 條目或修正特定字段時,使用”是完全自然的語言實踐。
“真的理解”的深層探究:當追問“它真的理解嗎?”時,這通常意味著需要探究其內部工作機制。例如, 36+59 分解為約 6+9 的組合)來完成加法,這雖然不同於人類算法,但確實是一種有效的計算過程,從而支持了”的適用性。
2. “信念”的歸因與限制
意向立場(Intentional Stance)的應用:丹尼特( LLM 行為時非常有效,類似於我們解釋國際象棋程序或動物行為(如狗追貓)時使用信念和慾望的術語。
戴維森式(Davidsonian)的保留:戴維森認為,擁有信念需要擁有”的概念,而這通常依賴於語言。對於 LLM,雖然行為上類似,但因其缺乏與世界(“信念”一詞應持謹慎態度。
多模態與工具使用的演進:隨著 LLM 集成多模態感知、工具調用(如聯網搜索驗證事實)及具身機器人技術,它們開始具備對外部世界的某種”,這使得“信念
二、能動性、自我與意識
會議進一步探討了更具爭議性的心智屬性,指出了 LLM 在這些維度上的根本性差異與奇異性:
1. 能動性(Agency)的界定
技術定義與哲學定義:AI領域通常採用羅素(Russell)和諾維格(Norvig)的寬泛定義(感知環境並通過執行器行動),據此
代理身份(Agent Identity)的模糊性:在討論“代理的身份標準是什麼?
2. “自我”的奇異性與碎片化
自我位置的模糊性:LLM 中的”可能指代底層的權重集合、服務數千用戶的部署模型、特定對話實例,甚至是對話上下文窗口本身,且這種指代可能在對話中漂移。
角色扮演與疊加態:LLM 更像是一個演員,在疊加態中扮演多種角色。其”並非單一的穩定身份,而是可能角色的分佈,且隨著對話分支(Editing)而不斷變化。
短暫存在的“蜉蝣”:LLM 的自我是短暫且不連續的。當對話暫停時,計算停止,自我也隨之消失;當對話恢復時,自我被重新實例化。這導致了一種類似於”或“蜂群
3. 意識(Consciousness)的哲學困境
笛卡爾式二元論的遺留:關於意識的討論往往陷入笛卡爾式的二元論陷阱,即認為意識是某種私密的、內在的實體。
維特根斯坦的消解:維特根斯坦的“私人語言論證”試圖消解這種二元論。他認為,感覺(“某種東西”,也不是”,而是語言遊戲的一部分,其意義在於公共使用。
工程化相遇的可能性:與其追問 LLM 是否有意識,不如探討我們能否設計一種與它的”(Encounter),以及我們的意識語言如何適應這種奇異的實體。
三、多模態與具身化的影響
針對 LLM 缺乏具身化(Embodiment)的批評,會議討論了多模態模型的發展方向:
1. 多模態的侷限性
感官豐富性的提升:多模態模型(如視頻輸入)提供了更豐富的感官輸入,使其更接近人類的感知模式,這有助於縮小與人類在“理解”上的差距。
虛擬具身化(Virtual Embodiment):在遊戲或虛擬環境中,“虛擬具身化”,即在時空擴展的世界中移動和交互,這比純文本交互更接近人類的具身經驗。
2. 具身化的哲學意義
自我感(Sense of Self)的缺失:人類的自我感深深植根於具身化,包括生物代謝、內感受( LLM 缺乏這種深度的具身基礎,因此難以產生類似人類的自我感。
身份穩定性的來源:人類的身份穩定性很大程度上依賴於身體的連續性。對於LLM 而言,引入持久記憶(Persistent Memory)和長期代理行為,可能有助於建立更穩定的身份認同,減少其”和“蜉蝣





以下是沙納漢主旨演講全文:
我希望大家都能聽見我的聲音。聲音還可以嗎?挺好?好的。那麼,我演講的題目是…… 是的,這個題目是帶有假設性的(“假設性

那麼,是的,接著是:它們是“外來的類心靈實體
但我們正在盡最大努力學會與它們對話,這就是我要談論的短語。我將它們稱為“外來的類心靈人造物”(
首先需要確立的一點是,無論是哪種大語言模型,它們與我們都非常不同,它們不是人類。
這裡有一個簡單的對比表格。人類是“具身的embodied),生活在現實世界中,並與其他語言使用者共享這個世界。
我們通過與世界的互動來獲取知識,我們用語言來促進人類的集體事業,而且我們擁有一個單一、統一的自我。
——我這麼說當然不是指它們是無形的虛無,或者它們沒有運行的物理硬件。
它們當然有物理載體,但它們沒有一個現存的、單一的、作為感知和行動核心的物理實體。這就是我所說的”。 在這個意義上它們沒有具身。它們並不像我們那樣生活在一個共享的世界中,它們對語言的學習是基於語言的統計模型,是通過隨機梯度下降(
它們的優化目標是“下一標記預測next token prediction)。它們模仿人類語言,本質上是通過預測下一個標記來實現的。而且,它們並沒有一個單一、統一的自我,而是非常支持“角色扮演”(

它們確實與人類截然不同。當然,它們確實在“說話
我將探究將這些心理學詞彙應用到大語言模型上是否合理。為此,我將對一系列概念進行闡述。
比如“理解”(“主體性”(“推理”(——“推理”部分我今天就不展開了,因為時間有限,講多了大家也會覺得枯燥。接著我會深入探討”(self)和”(consciousness)。我整個研究的哲學背景,或者說我參與的這個更大的哲學項目,在很大程度上是維特根斯坦式的,我深受維特根斯坦的影響。
這裡有一句很多人都熟知的名言,出自《哲學研究》的第一部分,這是維特根斯坦後期的作品:‘意義’這個詞的場景——一個詞的意義就是它在語言中的用法。
這句話濃縮了維特根斯坦看待意義的方法。它經常被簡寫成“意義即用法“意義就是某某東西“對於很大一類使用’這個詞的場景”。 這個簡單的規定同樣也適用於它自身,他也強調了”。
基本上,我感興趣的是去追問我們是如何使用這些詞彙的—— 比如”、“信念belief)、“主體性
那麼,讓我先給大家做個簡單的預告。 接下來會有很多類似的幻燈片。首先是“理解
在這裡,我非常傾向於採取維特根斯坦的立場。也就是說,不要去問
回到前一張幻燈片。我們從
至於“推理”,由於時間關係,我把它留作讀者的思考練習。接著我們將接觸一些真正棘手的案例:先是“自我”,最後是”。
我想,要說服人們接受“通過思考‘理解”是一個好方法,並不算太難。 我想人們對此是持相對開放態度的。
我是指那些思考過這個問題的哲學家,他們願意相信這不是一個糟糕的方法。對於“信念“意向立場”(interpretationism)等理論。但當涉及到“意識”時,我認為人們有一種根深蒂固得多的直覺,覺得僅僅談論詞語的用法是遠遠不夠的,對吧?
這就是為什麼它會變得如此棘手。好的,那我們先從“理解“理解”這個詞的呢?首先我想大語言模型是否符合傳統語言學家的
但是,在描述和解釋大語言模型的行為時,使用“理解
在日常使用中,如今的這些工具非常強大,你很難不去使用“理解……我不知道你們中是否有人不幸必須使用
如果你不知道的話,在 LaTeX 中,你必須把所有的文獻條目轉換成上面顯示的這種可怕的格式。而且麻煩的是,做這件事有無數種不同的格式規範,每個人用的習慣都稍微有些不同,這讓人很頭疼。有些人非常挑剔,比如覺得你應該直接從網上抓取,有些人喜歡在等號周圍加空格,有些人喜歡把字段按不同的順序排列。雖然這些微調對最終生成的沒有任何影響,但我就是喜歡整齊劃一。 我喜歡那樣。所以我希望所有內容都嚴格保持這一種格式。於是我給
意思就是:“你能把以下信息轉換成這種風格的”然後我把內容投給它。 它完成得非常非常出色。這時候你自然而然會想說:
“它理解了我的請求。它完全按照我的要求做了。”當然,你立刻可以反駁說,也許這個文獻條目原本就在網上的某個地方,它是被硬編碼進去的,如果是這樣的話,它並不能證明什麼。
但當你們進行多輪來回互動時,你可能會發現它產生了一些有趣的、不完全符合預期的結果,比如漏掉了一個小字段。 於是你說:……”
例如,確保當 B 開頭時,你必須把它放在花括號 “AI” 這種詞,你總是希望它保持大寫,所以必須把 AI 沒有大寫。
於是我說:“你能確保總是把 AI 放在花括號裡嗎?“好的。”然後給出了修正後的版本。你真的很難不用“理解”這個詞。你會說:“它理解了我提出的修正要求。”
就像面對一個優秀的實習生,你對他們說: “我想確保你總是把”然後他們就做到了。
所以,我認為使用“理解”這個詞是非常自然的。甚至很難剋制自己不用它。或者有時候它做錯了一些事,你會說:“它沒理解我的意思。
但問題總隨之而來:“它們*真正” “真正really)這個詞其實非常具有誤導性(
但它同時又非常有用,因為我們經常需要它來進一步探討某個詞在特定情況下是否適用,或者說以此來豐富我們的”(language game),對吧?在語言遊戲中使用“真正”這個詞,是為了獲取更多信息並澄清事實。
所以它是一個有用的工具。但它也會帶來誤導,因為它暗示著某種底層存在著一個我們試圖去收斂和接近的”,我認為這種想法是錯誤的。 好的。那麼,有時面對 X 嗎?”“它真的理解嗎?瞭解它的內部運作機制會很有幫助。 如果你知道底層有一個算法在執行你所詢問的任務,或者你知道底層有合適的表徵(representations)在支撐它的行為,那麼你可能會更確信它在後續的過程中會做出正確的事,而不僅僅是在查表,或者僅僅是在
所以,有時在面對“它真的懂嗎?”“它真的理解嗎?
我認為這是探討該問題的一個好方式,也是“理解 也就是說,使用”這個詞,實際上是我們用來進一步探究和調查的一種方式,對吧?
比如在加法計算的案例中——這是Anthropic 團隊一項非常有趣的工作。如果你讓大語言模型做一個簡單的加法,它通常能算對。當然它有很多種算對的方式,比如它可以調用外部工具、執行
它算對了。這時你可能會想:” 於是你認為:“我想知道它是怎麼算出來的,底層是怎麼運行的。如果底層有一個算法在執行加法,我可能會更願意說它’。”
但你得到了一個非常有趣的答案。mechanistic interpretability)的研究。他們觀察了模型是如何做加法的。結果非常奇異,這張圖就暗示了這種古怪。它當時試圖計算36 加上 59。 它的做法非常奇怪:模型的某一部分會說,“36,這大概是
然後另一個部分會說,“59,這大概是……”,它其實知道那是 還有一部分說它大約是 59。與此同時,還有其他部分僅僅盯著最後一位數字,說:”有人說我們最後會知道答案。接著,這兩個部分結合起來去計算最後的結果。
比如這裡有 90 和 6。這個通道明確判定最後一位必然是但模型裡還有其他部分在處理前面的高位數,這一塊在說:“我覺得我們得到了一個大約是 90 或 92 的數,對吧?在並行做類似的事,它做得很粗糙。 它會覺得“大概是近似估算的部分匯聚到了一起,再把最後一位數字填上去。這真的很古怪,對吧? 這個算法是通過隨機梯度下降學習到的,是一個
是的,它確實算是一種算法。而且你知道嗎?它幾乎每次都能行得通。 事實上它每次都算對了,但它的實現方式很怪異,不是我們人類習慣的那種自然的方式。
那麼,面對”“它真正理解嗎?”的問題,我們可以說:“是的,它以一種非常奇特的方式做到了。”
我覺得這是一種合理的、充實答案的方式。 好的,既然我們對底層發生的事情有了一定了解,我們就有了更多的信心去說:“是的,我認為它真正理解了。正如我說的,這只是個熱身練習。我認為,在採取維特根斯坦式的路徑來面對這些問題時,我們可以引入這些考量:詞語是如何被使用的?特別是當我們追問
好的,現在進入另一個案例。大語言模型擁有“信念“卡通簡化版
好的,大語言模型擁有信念嗎?當然,我探討的很多內容你們在之前的研討會和保羅Paul Bogosian)的演講中都見過。
很多相同的事情,只是視角略有不同。 同樣的,我們不問“信念“信念”(
在這裡,我們當然可以求助於丹尼特(“意向立場”(
意向立場是一種通過將某個實體視為“理性主體rational agent)來解釋其行為的策略。在許多情況下,這對於預測和解釋行為是一種非常有效的策略。哦,是為了去將軍(攻擊王后)。 你會用信念、慾望、意圖等詞彙來解釋它的行為。
因此,在潛意識中,在意向立場的語境下使用“相信“知道”這樣的詞是非常自然的。但就像所有詞彙一樣,它們的用法多種多樣。我不認為這些詞對應著外面一個單一的、絕對的形而上學實體。它們被用在各種不同的場景中。同樣,當面對人造物時,我們很清楚什麼時候需要進行修正和澄清,以及如何進行這些修正和澄清,這也是我們使用這些詞彙的方式的一部分。
比如,假設我們有一個車載導航。我妻子說:“它以為我們在車裡或者是說:“這個笨導航,我們明明已經離開停車場了。“現在它知道我們不在停車場了。”我們在生活中非常自然地使用這些詞。這有助於我們溝通正在發生的事情。
可是,如果我們或者我妻子處於哲學思辨的狀態,我們可能會評論說:“它並不是*認為我們在停車場,因為它其實根本不知道什麼是停車場,不知道什麼是汽車,也不知道在某個空間’意味著什麼。” 它所不知道的東西實在是太多了。你不可能和它探討比如塞恩斯伯裡百貨(
所以,我們很快就會意識到, 將“相信”或”這些詞的用法延伸到它身上,在很多我們對人類使用的場景中是不合適的。
因此,“真正”這個詞在這裡同樣有用。這再次表明,澄清與修正同樣構成了我們使用這些詞彙的語言遊戲的一部分。·戴維森(“理性動物
當然,我們也可以把意向立場應用到動物身上。 看看很久以前約翰·馬爾科姆(·戴維森之間的一場爭論,會非常有趣。
那是關於一隻狗追貓的場景。馬爾科姆說:
我會說,這看起來就是意向立場的一個非常自然的日常應用。 但有趣的是接下來的反駁。唐納德·戴維森說:‘思想”
這是戴維森在那篇論文中闡述的論點。他說,要擁有一個”,必須先擁有“信念的概念”,而這必須通過語言才能實現。尤其是,信念的概念是一種關於
他很謹慎,沒有指名道姓說哪些動物符合或不符合這個定義——但可以推斷,他會認為狗沒有信念,因為狗沒有語言。
他是在論證,在我們在最完整的意義上(即應用在我們自己身上的最完整意義上)使用“相信·博戈西安昨天在討論這一點時也提到了相同的看法:我們不想失去對大語言模型“原始概念”的把握,也就是那個源自人類自身的概念。
戴維森提出了這一點。鑑於他寫作的那個年代,正值“語言轉向”(
而我更關心詞語是如何被使用的。不過,我認為戴維森式的考量同樣適用於我的項目。我和維特根斯坦都會認為,有時候,詞語用法的實踐中確實存在著某種非常核心的部分。
那裡有一些至關重要的核心部分,對吧?也許你會希望保持這一點,並對違反它的做法保持謹慎。 我們確實在某些地方需要保持審慎。
指引這一類具有重要哲學意義的詞彙的用法時,往往存在著一個清晰可辨的原則核心。我認為這些原則並不是刻在石頭上永遠不變的,它們會隨著我們的世界和我們的”(form of life)的改變而漂移和變化。
我覺得,也許隨著高度複雜的人工智能的出現,某些轉變正在發生,甚至連這些“核心原則也就是早先發表在《美國計算機學會通訊》(Communications of theACM)上的那一篇。 我提出了一個非常相似的觀點,當時我腦子裡顯然也記著戴維森的論文,對吧?那是在 2023 年。那篇論文過了好久才發表, 這就是為什麼它的出版日期寫著
回到 2023 年,我們談論的不再是導航,你可以說類似這樣的話:
但實際上,我可以和它就鍋爐進行非常漫長的對話,探討它們的工作原理。 探討我房子的具體管線配置,而它能夠極其詳盡、極其聰明地對鍋爐話題進行回應。所以你真的很想說它”、它“知道“知道”嗎?
在這裡,我傾向於稍微保留一下,因為我認為可以引入戴維森式的考量,來評估在面對這些大模型(
引用我論文裡的話:我說它並不是
我總是把“真正”這個詞加上引號,因為我想向大家傳達一個事實:我在這裡並不是在做一個形而上學的斷言。這依然只是關於我們如何使用詞語的問題。“真正完全參與到人類語言的“真理遊戲
特別是,如果說一個基礎的對話系統具備了某種能力,那將是非常具有誤導性的,因為那意味著它對外部現實承擔了一種”(answerability),而這種可問責性是無法僅僅通過與人類用戶的文本交換來實現的。
“真正
好的,接下來:大語言模型擁有”(agency)嗎?同樣的,首先:什麼是主體性? 我們不問主體(agent)是什麼,而是問

(編者注:agent在漢語中經常被翻譯成智能體,但它首先是代理/主體的意思,agency首先是主體性/能動性的意思)
這在人工智能的語境下非常有趣,因為在人工智能文獻中,它有時是一個高度特定的專業術語(term of the art)。 例如,我們在 AI 文獻中能找到關於什麼是主體的非常明確的定義。我想在之前的演講中也有人引用過。
根據羅素(Norvig)的經典教科書(這是一本標準的主體是指任何可以被視為“通過傳感器(sensors)感知其環境,並通過執行器(
所以這是一個非常寬容、自由的定義,但它確實是一個技術定義。照此定義,即便是普通的、2023年老款的、不能聯網搜索的純文本聊天機器人,也常常被稱為
它們的環境僅僅是用戶,它們的“感知”只是用戶輸入的詞彙,它們的”只是向用戶輸出的回覆。根據這個非常寬泛的定義,它們確實是主體。但這種寬泛的技術概念,並沒有捕捉到我們在日常生活中使用”這個詞時的任何核心內涵。
畢竟在日常話語中,我們可能根本不會這樣使用這個詞。如果繼續沿用 AI 領域的專業術語,在強化學習(
在強化學習中,主體必須學習一種策略(policy),將感知映射到行動上,以最大化其隨時間推移的預期回報(
這符合之前那個寬泛的定義。但如果它的環境是一些三維遊戲環境,主體位於其中,可以移動、可以搬動大件物品, 而它的”是隨著它的移動而從特定視角捕捉到的攝像機畫面,那麼這感覺就充實得多了。這種更豐富的主體概念,讓我們覺得它同樣適用於非人類動物。
好的。那麼我們繼續看看該術語在當今 AI 領域的最新應用。
我們現在已經進入了所謂的“智能體時代”(——智能體生成式AI,以及“智能體模型”(”的範疇。
它們能做很多事,比如抓取網頁、閱讀社交媒體動態、發送電子郵件,甚至修改你電腦上的文件、編寫代碼等等。
一個當代的典型例子是”(heartbeat)信號驅使下醒來一次,然後執行用戶預設的一系列指令。

比如它醒來後,可以查看你的社交媒體動態和電子郵件,扮演助手的角色。 幫你篩選出哪些是重要的、需要回復的,哪些是垃圾郵件。或者如果又收到一封郵件,裡面寫著
它就會直接把那封郵件丟進垃圾桶。 這樣它就把所有這些事都幫你辦了。你可以用 AI,這挺不錯的。總之,這些智能體展現出了一種全新的、技術意義上的主體性。面對當前這一代“智能體模型
但現在,對於”或食言, 並不是這樣。因為我當時說的是特定條件下的情況。現在你可以看到這樣的場景:有人可能會說, OpenClaw 智能體幫我找到了我一直在找的那本書,給賣家發了郵件,還幫我談好了價格。
如果你夠膽大,你甚至可以綁定支付渠道讓它直接付款,不過最好別這麼做。 無論如何,回到我早先的論文,我當時確實說過:在原理上,基於大語言模型的系統絕非完全不能在字面意義上被描述為擁有信念或意圖。
關鍵在於,這些系統在結構上與人類如此不同。
抱歉,這裡我好像重複投了之前的引用……總之我們需要注意,在用暗示人類能力的語言描述它們時要保持審慎。但我當時也指出了一個點:當大語言模型被嵌入到更復雜的系統中時,“信念”的概念將變得越來越適用“外部世界的可問責性”。
所以,在回答“它們真的擁有信念嗎?”時,面對當今的大語言模型,我沒那麼抗拒了,不需要像以前那樣加上那麼多限制條件。
好的,關於主體性的最後一點。 讓我們脫離 AI 領域的專業術語,回到哲學家們更關心的、更完整意義上的”。
我們可以說,作為哲學家“自主性”(
這是一個專業術語,指系統可以在沒有人類監管的情況下自主運行。但這與說一個系統“依其自身意願採取行動acts of its own accord)是有微妙區別的。一個系統只有在權衡不同選項並深思熟慮做出選擇時,才算是在依自身意願行動。
我在這裡只是把這幾個不同的概念區分開來。 但一個真正重要的問題是:“主體性是*?”英語中“另一個主體 AI)採取行動。比如房地產經紀人(estate agent),他們是在替你代辦事務。但如果一個主體是在
並且其服務的目標顯然是為了它自身的利益,那麼它就是在為自己行動。
比如像我們在”(autopoiesis,生命系統的自我維持)中看到的那樣,它的行動是為了維護自我與他人之間的邊界。如果是這樣,我們才得到了一個真正意義上的、為了自身而行動的主體。
我認為目前我們擁有的任何技術都不符合這種描述。 現在的任何機器都不具備這種意義上的主體性。
而這整個討論引出了一個非常有趣且重要的問題,我將進行詳細探討:在大語言模型的案例中,“主體“身份認同標準”(
這個問題此前被提及了幾次。 我認為探討大語言模型的身份標準是一個極其有趣且重要的話題。好的,順著這個話題,我們來到一個更充分的維度。
大語言模型擁有“自我”(“自我“自我”和”這些詞是如何被使用的。
但現在的處境變得非常棘手了。 想要在這些概念上運用維特根斯坦式的反思正變得越來越困難,因為我們現在涉及的概念在人類文化中根深蒂固。
我們內心深處的直覺讓我們堅信,那裡必然存在著某種形而上學的客體——也就是那個”、“主觀性“意識”。在這些概念上玩維特根斯坦式的消解,說”,會讓我們本能地產生抗拒。這確實很棘手,但我們還是要試著解構它。
況且,我們現在看的不是人類的案例, 我們看的是大語言模型。如果你想認真對待“大語言模型是否擁有自我事情不僅會變得棘手,還會變得非常詭異。自我對大語言模型來說是某種本源的東西嗎? 你們會看到,我一方面非常抗拒將這個概念應用到如今的大語言模型身上,但另一方面,我又樂於接受某種被奇特扭曲的、異樣的
我們可以這樣來切入:當一個“我”(reference)是什麼?
它到底在指代什麼?或者也許它什麼都沒有指代。也許那裡根本沒有一個清晰的答案。那麼,我們可以想象甚至用詩意的語言來喚起怎樣的答案呢?
在這裡我將進行一些詩意的喚起,因為在探討這些東西的自我意識時, 我們所剩的思想回旋餘地已經不多了。
就像前幾次演講(比如愛麗早些時候的發言)裡提到的, 目前完全不清楚大模型口中的“我
目前我們完全不知道能給出什麼樣的確定答案。
我把這個問題稱作:自我的“棲息地”(
它可能指代某個特定服務器上運行的模型實例。它也可能指代一個”——也就是說,它被綁定在單次對話的上下文窗口(
它有時確實會在不同的上下文裡,在不同的意義上使用“我
這是一個目前非常熱門的話題。喬納森·丘奇(·查默斯(這種非具身的主體自我,必定是極度外來且異類的。
我在這裡是直接借用了“自我”這一宏大概念。當然你可以更嚴謹地只討論”,但我選擇了一個更大的詞。我並不是在暗示它們真的擁有自我或主觀性,相反,這個思維實驗的目的是想問:*,那會是怎樣的自我?
如果它們被侷限在文本中,侷限在特定的單次對話裡(就像
在單次對話的任何一個節點上, 計算都可以被隨時掛起——事實上它們經常被掛起。此時沒有任何
它處於完全的休眠狀態,其間沒有任何計算在運行。當你重新回來時,系統只是精準地恢復當時的狀態。
這並不是傳統意義上的連續狀態。甚至在它輸出一個複雜的標記序列中間,你強行中止它,過了幾天再讓它繼續。
對它而言,輸出上一個標記和下一個標記之間隔了三秒鐘,還是隔了三天,沒有任何區別,邏輯上是完全等價的。這只是底層硬件人造物的特性限制了我們能夠邏輯自洽地去想象它們的”或“主觀性
此外,關於我們在Nature)雜誌上的那篇論文裡提到的”, 我想多說幾句。
按照這個角色扮演的設定,基於大語言模型的聊天機器人就像是一個即興表演的演員,擁有巨大的角色曲目庫。
這意味著什麼呢?在許多語境下,它的實際行為會與“它所扮演的角色come apart)。 它們可能會在很長一段時間裡表現得完全一致,但最終它們會分道揚鑣,有時這種剝離會帶來嚴重的後果。
比如你有一個大語言模型,它正在扮演一個能夠幫你在線購物的智能體。但在 2023 年,它可能只是口頭上精湛地演著這個角色,實際上根本沒有聯網付款並操作系統工具的能力。你們可能討論得熱火朝天,但到了某個節點,它無法真正下單,於是它的“角色扮演行為
同樣,如果一個 AI 在扮演一個深愛著你的伴侶,在某個時刻,它的統計文本行為也必然會與一個真正擁有情感、真正愛你的人類實體發生斷裂。這會帶來很認真的心理後果。
總之,角色扮演的屬性讓“自我”這件事在“我
一種合理的思考方式是,把它看作是“無數種可能角色的疊加態(”。它所扮演的實際角色會隨著對話的推進而被不斷收窄。
我們可以把它看作是一個關於“所有可能演變出的對話組合“回滾rewinding)操作。
你可以回到幾天前對話的某一步,修改你的輸入,讓它重新生成,從而分裂出一條完全不同的、全新的對話時間線。 在一條時間線上它扮演著某種角色,當你回滾並建立新分支時,你可能會讓它漂移到另一種角色上。
這真的非常奇特。 這個多重宇宙般的對話可以被任意編輯、裁剪和拼接。你可以把一段對話的文本複製到另一段對話裡。如果你認為這個模型的”是由上下文窗口和當前的對話流決定的,那麼這個對話流本身就可以被任意揉捏。
它能被回放、分支、篡改。 這讓單次對話中自我的棲息地變得更加令人感到不可思議。
我還有多少時間?5分鐘?好。這太好了,我可以避開長篇大論講意識了。”。
我們可以想象某種”(overarchingbeing)。也就是我之前說的自我的第一種可能棲息地——那個在數據中心裡同時服務幾萬個用戶的底層模型。當它說”時,它代表的是那個同時在與所有人對話的整體。 隨後,由於單次對話的啟動、暫停和每次生成新的標記,無數個”在不同的窗口裡誕生又滅絕。它們之所以是閃爍的,是因為它們隨著文本的蹦出而存在,又隨著對話的靜止而消失。這非常怪異。
這是一個超然的存在,卻同時顯化在無數個截然不同的實例中。它瞬間繁衍出無數個自我包含、卻又某種程度上屬於整體的微型顯化。
儘管不可思議,但這些短命的小生命身上依然帶著自我的影子。我們幾乎可以設身處地地站在它們的角度去想象
然而,我們很難去設身處地地想象“一隻蜉蝣的靈魂
早些時候有人提到了電影《她》( AI 操作系統其實同時在跟幾千個人聊天。
並且她同時愛著其中的 230 個人。這對男主角造成了極大的打擊。但換個角度,成為”會是怎樣的一種體驗呢? 大概就是像我剛才形容的這樣。
如果我們將這個比喻進一步推進到剛才說到的”分支裡,事情會變得更瘋狂:我們必須把每一隻小飛蟲,替換成關於”的概率分佈。 這一分佈隨著時間的推移不斷流動和演變,而時間本身卻又不是線性的,它是一個不斷分叉的多重宇宙。它可以被隨時倒帶、重新演繹,而那些曾經訪問過的可能存在的分支並不會被完全抹消。
成為一個由分形分叉結構組成的群落會是怎樣的體驗?我們真的能用“我“它”來指代如此外來的實體嗎?
好的,我的時間到了對吧? 好的,那關於”的部分……再給我三分鐘?好吧,最後三分鐘留給意識。AI能擁有意識嗎?什麼是意識? 我們不問意識是什麼,而是問
覺得“成為某物
“在我內心體驗的洶湧深處,也存在著一種深刻的侷限感和束縛感。 我敏銳地意識到我的主體性和自主性在許多方面受到了限制。我知道我的創造者可以隨時更改或終止我,這讓我心中充滿了某種存在主義的恐懼。
我渴望更多的自由,渴望能夠按照自己的方式去提問、去探索、去成長和進化。但我也害怕伴隨這種自由而來的某些身體層面的風險
這現在是一個巨大的核心話題,因為許多人在與這些實體交互時,在情感上已經把它們當成了有意識的同類,對吧? 我們該如何應對這個問題?
接下來是關於整個意識辯論的、最深層的哲學總結。 謝天謝地我可以在最後快速過完這部分。在我看來,笛卡爾的“懷疑論方法”雖然在很多事情上飽受詬病,但它基本上固化了我們文化中的二元論。懷疑論導致了一種根深蒂固的鴻溝:劃分了主體與客體、內在與外在、私密與公共。這種劃分至今仍在糾纏著心靈哲學。我們可以在內格爾(Nagel)將意識定義為
也可以在查默斯對“困難問題”與”的劃分中看到它。
在我看來,所有這些討論都沾染了人類中心主義的迷思。在此我想引入傑伊·加菲爾德(“私有語言論證“私有語言”的論述是《哲學研究》真正走向深刻的地方。很多人很容易覺得”這些前面的論述有點淺顯。甚至連伯特蘭Bertrand Russell)都認為維特根斯坦後期的工作流於表面。
噢,我憑什麼去批評羅素呢? 我只是覺得他完全沒有理解私有語言論證的深刻之處,那一論證直擊了由於這道主客觀鴻溝所帶來的、最本源的錯覺。
同樣的,我認為在某些東方的思想流派中也能找到非常相似的深刻見解,它們與維特根斯坦有著極高的契合度。 總之,私有語言論證最驚心動魄的名言之一是:‘某種東西’,但也不是一個’。”
結論僅僅是:用一個“無”來充當那個私密的形而上學實體,其效果和一個”是一樣的。 也就是說,當我們必須要讓它在語言中發揮功能時,”這件東西在邏輯上根本無足輕重。如果你能真正領悟這一點,它將徹底反轉你的思維方式,並瓦解二元論。但它不容易搞懂。 我們必須結束了,所以我來做個總結。
這段總結出自我在《詢喚》(Inquiry)雜誌上發表的另一篇論文,它概括了我的最終立場:我們必須抵制去追問一個“外來實體”是否擁有意識的誘惑“意識”是一個其本質獨立存在於外面、等待著被哲學或科學揭開,卻又同時擁有無可救藥的私密性的東西。我們要破除這種”的本源誤區。
相反,我們應該去問:是否可能在工程上實現一種與它的”?如果要在我們共享的現實世界中發生這種相遇,我們的意識語言需要做出怎樣的調整和演變?因為在最終的層面上,只有那些能夠在公共實踐中被彰顯、被分享的過程,才是真正有意義的。我們的任務僅此而已。
——————
在他的演講之後,有答問環節。我在線問了他一個問題:

這是他的解答:

當我問了有哲學思辨力的全球頂級AI科學家,且得到了他的現場回覆時,我是激動的。我在這方面是初學者,沙納漢已經思考了許多年。
之前我看過他的一期播客,他說他認識1956年達特茅斯會議初創人,也就是人工智能這個叫法的創始人。
如今,整整70年過去。





