Nhà khoa học thần kinh Ev Fedorenko của Viện Công nghệ Massachusetts (MIT) đã xác định được một mạng lưới ngôn ngữ tương tự như "phiên bản sinh học của ChatGPT" bằng cách quét não của khoảng 1.400 người. Mạng lưới này không chịu trách nhiệm về tư duy hay tâm lý; nó chỉ tập trung vào việc ánh xạ từ ngữ thành nghĩa và lắp ghép chúng thành câu. Nghiên cứu này hé lộ sự tách biệt giữa ngôn ngữ và tư duy, thúc đẩy chúng ta xem xét lại những bí ẩn tiềm ẩn của não bộ.
Nếu tôi nói với bạn rằng có một "phiên bản sinh học của ChatGPT" đang chạy trong não bạn, bạn có tin không?
Đây không phải là phép so sánh; não của chúng ta thực sự có hệ thống thần kinh được thiết kế đặc biệt để xử lý ngôn ngữ.
Nó không chịu trách nhiệm về suy nghĩ hay tâm lý; nó chỉ chịu trách nhiệm cho một việc duy nhất - ghép các từ với nghĩa của chúng và sau đó ghép chúng lại thành câu.
Hệ thống này được nhà khoa học thần kinh Ev Fedorenko gọi là "mạng lưới ngôn ngữ".
Hệ thống LLM tự nhiên của não
Nhiều người có thể cảm thấy rằng ngôn ngữ và suy nghĩ là cùng một quá trình, và quá trình tìm kiếm từ ngữ cũng là một hình thức suy nghĩ.
Nhưng ngôn ngữ và tư duy của con người có giống nhau không?
Ngôn ngữ có phải là cốt lõi của tư duy hay là một quá trình hoàn toàn độc lập?
Để đáp lại, Fedorenko đưa ra một quan điểm có phần trái ngược với trực giác:
Ngôn ngữ không giống với tư duy; nó giống như "giao diện" và "bao bì bên ngoài" của tư duy hơn.
Đối với nhiều người, việc tìm ra từ ngữ phù hợp là một phần không thể thiếu của quá trình suy nghĩ, chứ không phải là sản phẩm của một hệ thống riêng biệt.
Bà gọi hệ thống chuyên biệt này, không phụ thuộc vào suy nghĩ, là "mạng lưới ngôn ngữ", được sử dụng để lập bản đồ sự tương ứng giữa các từ và ý nghĩa của chúng.
Fedorenko hình dung nó như một trình phân tích cú pháp nâng cao:
"Nó giống như một bản đồ, cho bạn biết phần nào trong não bạn lưu trữ loại ý nghĩa nào và giống như một trình phân tích cú pháp nâng cao, giúp chúng ta ghép nối ngôn ngữ lại với nhau."
Suy nghĩ thực sự và những điều thú vị đều diễn ra bên ngoài mạng lưới ngôn ngữ này.
Trên thực tế, từ rất lâu trước khi ChatGPT ra đời, Fedorenko đã thu thập bằng chứng về mạng lưới ngôn ngữ trong não người trong 15 năm qua và phát hiện ra rằng chúng có nhiều điểm tương đồng với các mô hình lớn (LLM).
Theo một nghĩa nào đó, chúng ta thực sự mang trong mình một "phiên bản sinh học của ChatGPT": một bộ xử lý ngôn ngữ không có tâm trí.
Nghiên cứu của Fedorenko có thể mang lại sự an ủi: máy móc có thể tạo ra văn bản trôi chảy, nhưng vẫn không thể suy nghĩ.
Trong phòng thí nghiệm của mình tại MIT, Fedorenko đã dành 15 năm để thu thập bằng chứng sinh học về mạng lưới ngôn ngữ.
Không giống như các mô hình lớn, mạng lưới ngôn ngữ của con người không ngẫu nhiên xâu chuỗi các từ lại với nhau để tạo thành câu nghe có vẻ hợp lý.
Nó giống như một trình dịch kết nối các thông tin đầu vào bên ngoài (những gì bạn nghe, nhìn thấy hoặc thậm chí là ngôn ngữ ký hiệu) với ý nghĩa biểu diễn ở các vùng khác của não (chẳng hạn như trí nhớ theo giai đoạn và nhận thức xã hội, mà LLM không có).
Hơn nữa, mạng lưới ngôn ngữ của con người không lớn lắm; nếu tất cả các tổ chức có liên quan được tập hợp lại với nhau, nó cũng chỉ có kích thước bằng một quả dâu tây.
Mặc dù nhỏ nhưng tác động của thiệt hại đối với nó có thể rất lớn.
Ví dụ, mạng lưới ngôn ngữ bị tổn thương có thể dẫn đến nhiều dạng mất ngôn ngữ khác nhau. Trong những trường hợp như vậy, tư duy phức tạp của một người vẫn tồn tại, nhưng họ bị mắc kẹt trong một bộ não không thể diễn đạt; đôi khi họ thậm chí không thể phân biệt được những từ mà người khác nói.
Fedorenko cùng các nhà nghiên cứu sau tiến sĩ Andrea de Varda (trái) và Halie Olson (phải) tại MIT.
Bằng cách quét não của 1.400 người, bà đã phát hiện ra "mạng lưới ngôn ngữ" trong não người.
Fedorenko lớn lên ở Liên Xô vào những năm 1980 và phát triển niềm yêu thích ngôn ngữ từ khi còn nhỏ.
Theo yêu cầu của mẹ, cô đã học sáu ngôn ngữ: tiếng Nga, tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha và tiếng Ba Lan.
Với thành tích học tập xuất sắc, cuối cùng cô đã nhận được học bổng toàn phần vào Đại học Harvard.
Cô theo học chuyên ngành ngôn ngữ học tại Đại học Harvard, nhưng trong quá trình học, cô đã phát hiện ra những hạn chế của ngôn ngữ học.
"Những lớp học ngôn ngữ học này rất thú vị, nhưng chúng giống việc giải câu đố hơn là giải thích cách thế giới thực vận hành."
Vì vậy, cô ấy đã học ngành tâm lý học.
Năm 2002, cô tốt nghiệp Đại học Harvard với bằng cử nhân tâm lý học và ngôn ngữ học.
Sau đó, Fedorenko theo học sau đại học về khoa học nhận thức và khoa học thần kinh tại MIT, nơi bà nhận bằng Tiến sĩ vào năm 2007.
Trong thời gian này, bà bắt đầu làm việc với Nancy Kanwisher, người đầu tiên phát hiện ra vùng mặt hình thoi, một vùng chịu trách nhiệm nhận dạng khuôn mặt.
Fedorenko muốn tìm ra vùng não tương ứng dành cho ngôn ngữ, nhưng vào thời điểm đó, nền tảng nghiên cứu trong lĩnh vực này còn khá yếu.
Trong quá trình quét não của khoảng 1.400 đối tượng, Fedorenko đã xác định được một mạng lưới ngôn ngữ phổ biến, được bà định nghĩa là "một tổ chức luôn chịu trách nhiệm tính toán ngôn ngữ".
Sau một loạt các phát hiện nghiên cứu tích lũy, Fedorenko đã xuất bản một bài báo đánh giá trên Nature Reviews Neuroscience vào năm 2024.
Bà định nghĩa mạng lưới ngôn ngữ của con người là một "phạm trù tự nhiên" - một đơn vị chức năng tự nhiên, được hình thành độc lập, chuyên xử lý ngôn ngữ, tồn tại "trong não của mọi người trưởng thành điển hình".
Ba mô hình não bộ trong văn phòng của Fedorenko làm nổi bật các mạng lưới ngôn ngữ. Từ trên xuống dưới: màu tím là tác phẩm thêu của Laura Bundesen; màu đỏ là tác phẩm thêu chữ thập của Hannah Small; và màu đỏ là mô hình in 3D.
Mạng ngôn ngữ là gì?
Trong não người trưởng thành, có một tập hợp cốt lõi các hệ thống được kết nối với nhau có trách nhiệm tính toán cấu trúc ngôn ngữ.
Chúng lưu trữ sự ánh xạ giữa các từ và ý nghĩa của chúng, cũng như các quy tắc để kết hợp các từ thành câu.
Đây là những điều chúng ta học được khi học một ngôn ngữ.
Một khi đã thành thạo, chúng ta có thể sử dụng "mã" này rất linh hoạt: miễn là bạn biết một ngôn ngữ, bạn có thể biến một ý tưởng thành trật tự từ.
Fedorenko tuyên bố rằng mạng lưới ngôn ngữ, giống như các cơ quan khác của cơ thể con người, là một phạm trù tự nhiên có cấu trúc vật lý chỉ ra một vị trí cụ thể.
Ví dụ, hồi hình thoi là một đơn vị chức năng được xác định rõ ràng.
Trong mạng lưới ngôn ngữ, hầu hết mọi người đều có ba vùng ở vỏ não trán, tất cả đều nằm ở phía bên của thùy trán trái.
Ngoài ra, còn có một số vùng phân bố dọc theo hai bên của hồi thái dương giữa, đây là một mô lớn, dày kéo dài dọc theo toàn bộ thùy thái dương.
Chúng tạo nên cốt lõi của mạng lưới ngôn ngữ.
Chúng ta có thể thấy bản chất tổng thể của chúng từ nhiều góc độ khác nhau.
Ví dụ, khi mọi người được đưa vào máy quét fMRI để quan sát sự khác biệt trong quá trình xử lý ngôn ngữ so với điều kiện kiểm soát, các khu vực này luôn thay đổi cùng nhau.
Fedorenko cho biết họ đã quét khoảng 1.400 người cho đến nay và có thể tạo ra một bản đồ xác suất hiển thị những vị trí có khả năng xảy ra nhất ở những khu vực này.
Mặc dù có một số khác biệt nhỏ giữa các cá nhân, nhưng mô hình chung thì rất nhất quán.
Bên trong những vùng rộng lớn của thùy trán và thùy thái dương, mỗi người đều có một số tổ chức thực hiện tính toán ngôn ngữ một cách đáng tin cậy.
Mạng lưới ngôn ngữ khác với các vùng giải phẫu não liên quan đến ngôn ngữ đã biết khác, chẳng hạn như vùng Broca.
Fedorenko cho rằng vùng Broca là vùng lập kế hoạch cho việc phát âm.
Nó chủ yếu tính toán các hành động cần thiết để phát âm những âm thanh này dựa trên cách biểu diễn âm thanh của lời nói, chỉ đạo hoạt động của các cơ miệng, thuộc về hạ nguồn của mạng ngôn ngữ và nhận thông tin ngôn ngữ có cấu trúc được truyền từ mạng ngôn ngữ.
Mạng lưới ngôn ngữ không chịu trách nhiệm về phát âm hay suy nghĩ; về cơ bản, nó là hệ thống nhận thức và vận động cấp thấp, đóng vai trò là giao diện giữa chính nó và hệ thống ý nghĩa và lý luận trừu tượng cấp cao.
Fedorenko đề cập rằng con người chủ yếu sử dụng ngôn ngữ để làm hai việc.
Đầu tiên là cách diễn đạt: một ý tưởng mơ hồ hiện lên trong đầu bạn, sau đó bạn chọn ra một tập hợp các từ trong vốn từ vựng của mình (không chỉ là các từ mà còn cả các cấu trúc và tổ hợp lớn hơn) để diễn đạt ý tưởng này.
Sau đó, mạng lưới ngôn ngữ sẽ cung cấp thứ tự từ cho hệ thống vận động, cho phép bạn nói, viết hoặc ký hiệu.
Thứ hai là sự hiểu biết: sau khi âm thanh đi vào tai hoặc ánh sáng đi vào mắt, hệ thống nhận thức trước tiên sẽ xử lý thông tin đầu vào thành thứ tự từ.
Sau đó, mạng ngôn ngữ sẽ phân tích cú pháp, tìm các đoạn quen thuộc trong trật tự từ và chỉ ra các biểu diễn ý nghĩa được lưu trữ ở nơi khác.
Đối với cả việc diễn đạt và hiểu biết, hệ thống này là "kho lưu trữ ánh xạ từ hình thức sang ý nghĩa" được cập nhật liên tục.
Khi chúng ta nắm vững được quy tắc này, chúng ta không chỉ có thể diễn đạt suy nghĩ của mình mà còn có thể hiểu được những gì người khác đang nói.
Chức năng của mạng lưới ngôn ngữ là giao tiếp. Vậy mạng lưới ngôn ngữ chuyên biệt đến mức nào? Có tế bào nào phản ứng đặc hiệu với một số diễn ngôn nhất định không?
Fedorenko cho rằng ngôn ngữ phụ thuộc vào ngữ cảnh, và do đó suy đoán rằng các phương pháp mã hóa trong hệ thống mạng ngôn ngữ có phần phân tán và có thể có những tế bào thần kinh đặc biệt phản ứng với một số khía cạnh nhất định của ngôn ngữ.
Ví dụ, một số tế bào trong vùng mạng ngôn ngữ cũng có thể có phản ứng tương tự với ngôn ngữ viết và ngôn ngữ nghe.
Khi thảo luận về các mô hình hoặc đặc điểm của mạng ngôn ngữ, Fedorenko cho rằng cơ chế nhận dạng đối tượng chung của não rất giống về mức độ trừu tượng với mạng ngôn ngữ.
Điều này tương tự như cách vỏ não thái dương dưới lưu trữ các mảnh hình dạng vật thể và hồi trục lưu trữ "khuôn mẫu khuôn mặt".
Chúng ta sử dụng những biểu diễn này để xác định các đối tượng trong thế giới thực, nhưng bản thân chúng không liên quan trực tiếp đến kiến thức của chúng ta về thế giới.
Hãy lấy câu vô nghĩa "Những suy nghĩ xanh không màu ngủ say sưa" làm ví dụ. Chúng ta có thể hiểu sơ qua cấu trúc của nó, nhưng không thể áp dụng nó vào bất kỳ kiến thức thực tế nào.
Nghiên cứu của Fedorenko và đội ngũ khác đã xác nhận rằng các mạng lưới ngôn ngữ phản ứng với những câu vô nghĩa như vậy với cường độ gần như tương tự như phản ứng với những câu có nghĩa.
Điều này không có nghĩa là mạng lưới ngôn ngữ "ngu ngốc", mà đúng hơn là nó thực sự là một hệ thống tương đối nông.
Fedorenko đồng ý với ý kiến rằng "mọi người đều có bằng LLM trong đầu".
Bà cho rằng các mạng lưới ngôn ngữ có nhiều điểm tương đồng với các mô hình lớn ban đầu: học các quy tắc ngôn ngữ và mối quan hệ giữa các từ.
Trên thực tế, bạn có thể gặp một người nói rất trôi chảy, nhưng sau khi lắng nghe một lúc, bạn nhận ra họ không nói điều gì đáng kể và não của họ không bị tổn thương.
Điều này chỉ ra rằng họ chỉ kích hoạt mạng lưới ngôn ngữ trong não, trong khi phần suy nghĩ hoàn toàn không được sử dụng.
Mặc dù nghe có vẻ trái ngược với trực giác khi cho rằng ngôn ngữ của con người bắt nguồn từ một hệ thống "vô thức" như ChatGPT.
Hơn nữa, ban đầu Fedorenko cho rằng ngôn ngữ đóng vai trò trung tâm trong tư duy cấp cao, nhưng nghiên cứu sau này của bà không ủng hộ giả thuyết này.
Ngay từ năm 2011, bà đã nhận thức rõ rằng mọi bộ phận của mạng lưới ngôn ngữ đều có tính chuyên môn hóa cao về ngôn ngữ.
"Đối với các nhà khoa học, lựa chọn duy nhất là cập nhật kiến thức và tiếp tục khám phá."
Tham khảo:
https://www.quantamagazine.org/the-polyglot-neuroscientist-resolving-how-the-brain-parses-language-20251205/
Bài viết này được trích từ tài khoản WeChat chính thức "New Zhiyuan" , tác giả: New Zhiyuan và được xuất bản với sự cho phép của 36Kr.





