耗時15年、掃描1400個大腦,她發現了藏在人腦中的“生物版ChatGPT”

avatar
36氪
12-08

MIT神經科學家Ev Fedorenko通過掃描約1400人的大腦,識別出一個類似「生物版ChatGPT」的語言網絡,它不負責思考或情緒,只專注於將詞語與意義映射、拼成句子,該研究揭示了語言與思維的分離,讓我們重新審視大腦中隱藏的奧秘。

如果告訴你:你的大腦中正跑著一個「生物版ChatGPT」,你會相信嗎?

這不是打比方,而我們的大腦中真有這樣一套專門用來處理語言的神經系統:

它不負責思考、也不負責情緒,只負責一件事——把詞和意義對上號、再把它們拼成句子。

這個系統被神經科學家Ev Fedorenko稱作「語言網絡」(language network)。

大腦天生的LLM系統

很多人可能會有這種感覺:語言和思考是同一過程,找詞的過程本身就是思考。

但人類的語言和思維是一回事嗎?

語言究竟是思維的核心,還是一個完全獨立的過程?

對此,Fedorenko提出了一個有點反直覺的觀點:

語言不等於思考,它更像是思考的「接口」和「外包裝」。

對許多人來說,找到合適的詞本身就是思考的重要組成部分,而不是某個獨立系統的產出。

她把這個獨立於思考之外的專門系統稱為「語言網絡」,用來映射詞語與其意義之間的對應關係。

Fedorenko將之想象成一個加強版的解析器:

「它就像一張地圖,告訴你大腦裡哪一塊地方存著哪一類意義,也好比一個加強版的解析器,幫我們把語言拼起來。」

至於真正的思考和有趣的東西,則全部發生在這個語言網絡之外。

事實上,早在ChatGPT出現之前,過去的15年裡Fedorenko一直在收集人類大腦中語言網絡的證據,並且發現它和大模型(LLM)之間有不少相似之處。

在某些意義上,我們確實隨身攜帶著一個「生物版的ChatGPT」:一個不具備心智的語言處理器。

Fedorenko的研究,也許會讓人覺得有一些安慰:一臺機器雖然可以生成一段流暢的文字,但是它還是不會思考。

在麻省理工學院的實驗室裡,Fedorenko已經花了15年時間積累關於語言網絡的生物學證據。

不同於大模型,人類的語言網絡不會把詞隨便串成聽起來像那麼回事的句子。

它更像是連接外部輸入(聽到的、看到的、甚至手語)和大腦其他區域意義表徵(如情景記憶、社會認知,而LLM並沒有這些能力)之間的翻譯器。

而且人類的語言網絡並不大,如果把相關組織都聚在一起,只有一顆草莓大小。

雖然很小,一旦它受損影響卻十分巨大。

比如,受損的語言網絡會導致各種失語症,這種情況下人的複雜思維依然存在,卻被困在無法表達的腦中;有時甚至連別人說的詞都難以區分。

Fedorenko在MIT與博士後研究員Andrea de Varda (左) and Halie Olson (右)

掃描1400人大腦,她發現了人腦中的「語言網絡」

Fedorenko上世紀80年代在蘇聯長大,自幼便對語言萌發了興趣。

她在母親的要求下,學會了俄語、英語、法語、德語、西班牙語和波蘭語六種語言。

成績優異的她最終獲得了哈佛大學全額獎學金。

她在哈佛大學主修語言學,但在學習過程中,她發現了語言學的侷限性。

「這些語言學課很有趣,但更像是在解謎,而不是在解釋現實世界到底是怎麼運作的。」

於是她又學習了心理學。

2002年,她從哈佛大學畢業,獲得心理學與語言學學士學位。

隨後,Fedorenko進入麻省理工學院(MIT)攻讀認知科學與神經科學的研究生課程,並於2007年獲得博士學位。

在此期間,她開始與Nancy Kanwisher合作,後者首次發現了梭狀回臉區,這個區域專門負責識別人臉。

Fedorenko想找到語言在大腦中的對應區域,但當時這方面的研究基礎相當薄弱。

在對大約1400名受試者的大腦掃描中,Fedorenko識別出一個普遍存在的語言網絡,她將之定義為「始終負責語言計算的組織」。

在不斷累積的研究成果之後,2024年Fedorenko在《Nature Reviews Neuroscience》上發表了一篇綜述。

她將人類語言網絡定義為一種「自然類別」——一個天然、獨立成型、專門處理語言的功能單元,存在於「每一個典型的成年人腦中」。

Fedorenko辦公室裡的三個大腦模型突出了語言網絡。從上到下:紫色的是Laura Bundesen的刺繡作品;紅色的是Hannah Small的十字繡;紅色的是3D打印模型。

什麼是語言網絡?

在成年人大腦中,有一組核心區域作為一個互相連結的系統,負責計算語言結構。

它們存儲詞語與意義之間的映射關係,以及如何把詞組合成句子的規則。

我們在學習一門語言時,學的就是這些東西。

只要掌握了它們,我們就能很靈活地使用這種「代碼」:只要你會一門語言,就能把一個念頭轉換成詞序。

Fedorenko表示,語言網絡和人類身體的其他器官一樣,是一個自然類別,擁有一個能指出具體位置的物理結構。

比如,梭狀回臉區就是一個可以明確界定的功能單元。

而在語言網絡裡,大多數人的額葉皮層都有三個區域,都位於左額葉的側面。

另外,還有幾個區域沿著中顳回的側面分佈,那是一大片厚厚的組織沿著整個顳葉延伸。

這些構成了語言網絡的核心部分。

我們可以從多個角度看到它們的整體性。

例如,把人放進fMRI掃描儀裡觀察語言處理與對照條件的差異,這些區域總是一起變化。

Fedorenko稱到目前為止掃描了大約1400人,已經能建立一張概率地圖,顯示這些區域最可能出現的位置。

雖然個體之間略有差異,但整體模式非常一致。

在這些額葉和顳葉的大區域裡,每個人都會有一些組織在可靠執行語言計算。

語言網絡,與其它已知與語言相關的腦解剖區域,如布羅卡區(Broca’s area)不同。

Fedorenko認為布羅卡區更多是一個發音動作的規劃區域。

它主要是根據語音的聲音表徵,計算出說出這些聲音所需的動作,指揮嘴部肌肉的活動,屬於語言網絡下游,接收語言網絡傳過去的結構化語言信息。

語言網絡既不負責發聲,也不負責思考,它在本質上是低層級的感知與運動系統,是與高層級的抽象意義和推理系統之間的接口。

Fedorenko提到人類主要用語言做兩件事。

第一是表達:腦子裡蹦出一個模糊的念頭,你再從詞彙庫裡(不僅是詞,還有更大的結構和組合方式)挑出一套詞序,把這個念頭表達出來。

然後語言網絡把這個詞序交給運動系統,讓你說出來、寫出來或打手語。

第二是理解:聲音進耳朵或光線進眼睛後,感知系統先把輸入處理成詞序。

然後語言網絡解析它,在詞序裡找熟悉的塊,再把它們指向存儲在別處的意義表徵。

對於表達和理解,這個系統都是一個不斷更新的「形式到意義的映射倉庫」。

掌握了這套代碼後,我們既能把想法說出來,也能理解別人說的話。

語言網絡的功能是為了交流,那麼語言網絡的專門化究竟細到什麼程度,是否存在專門對某些話語反應的細胞?

Fedorenko認為語言依賴上下文,因此推測語言網絡系統內的編碼方式會有些分佈式,可能存在對語言某些特定方面反應特別強的神經元。

比如,語言網絡區域的一些細胞對書面語和聽覺語言也會有類似反應。

談到語言網絡的模式或者特徵,Fedorenko認為大腦的一般物體識別機制和語言網絡的抽象程度非常接近。

這和下顳皮層裡儲存物體形狀片段、梭狀回臉區儲存「一張臉的模板」是類似的。

我們利用這些表徵來識別現實世界中的物體,但它們本身與我們的世界知識並無直接聯繫。

以一句無意義句子「無色的綠色想法憤怒地沉睡」為例,我們可以大致能聽懂它的結構,卻完全無法把它對應到任何現實知識上。

Fedorenko和其他團隊的研究證實,語言網絡對這種無意義句子的反應強度,和對那些有意義的句子幾乎一樣。

這並不意味著語言網絡「笨」,而是說明它確實是個比較淺層的系統。

Fedorenko認同「每個人腦子裡都有個LLM」這樣的說法。

她認為語言網絡在很多方面都很像早期的大模型:學習語言的規律,以及詞和詞之間的關係。

在現實中,你可能會遇到一個說話特別流暢的人,但聽了一會兒會發現他們根本沒講什麼內容,而他們的大腦也沒任何損傷。

這說明他們只調動了大腦中語言網絡部分的功能,而思考部分完全沒有用上。

雖然,人類語言來自一個類似ChatGPT那樣「無意識」的系統,這聽起來有點不符合直覺。

而且,Fedorenko在研究早期也認為語言是高級思維的核心,但後來她的研究並不支持這一假設。

早在2011年,她已經很清楚,語言網絡的所有部分都高度專門化用於語言。

「對於科學家來說,只能更新認知,繼續向前探索。」

參考資料:

https://www.quantamagazine.org/the-polyglot-neuroscientist-resolving-how-the-brain-parses-language-20251205/ 

本文來自微信公眾號“新智元”,作者:新智元,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論