編譯:深潮TechFlow
人工智能和區塊鏈技術是兩股正在改變世界的強大力量。AI 通過機器學習和神經網絡增強了人類的智力,而區塊鏈則帶來了可驗證的數字稀缺性和新的無信任協作方式。隨著這兩種技術的融合,它們為新一代互聯網奠定了基礎——一個自主智能體與去中心化系統交互的時代。這個“智能體網絡”引入了一類新的數字居民:AI 智能體,它們能夠自主導航、協商和交易。這一轉型重新分配了數字世界的權力,讓個人重新掌控自己的數據,同時促進了人類與人工智能前所未有的合作。
網絡的演變
為了理解未來的發展方向,我們需要回顧網絡的演變歷程及其主要階段,每個階段都有其獨特的能力和架構模式:
前兩代網絡主要關注信息傳播,而後兩代則注重信息增強。Web 3.0 通過 Token 實現了數據所有權,而 Web 4.0 則通過大語言模型 (LLMs) 賦予了智能。
從 LLMs 到智能體:自然的演變
大語言模型在機器智能方面實現了飛躍,作為動態的模式匹配系統,它們通過概率計算將海量知識轉化為上下文理解。然而,當這些模型被設計成智能體時,其真正的潛力才得以釋放——從單純的信息處理器發展為能夠感知、推理和行動的目標導向實體。這種轉變創造了一種新興智能,能夠通過語言和行動進行持續而有意義的合作。
“智能體”概念為人機交互帶來了新視角,超越了傳統聊天機器人的侷限和負面印象。這不僅是術語上的變化,更是對 AI 系統如何自主運作並與人類保持有效合作的全新思考。智能體工作流程能夠圍繞特定用戶需求形成市場。
智能體網絡不僅僅是增加了一層智能,它從根本上改變了我們與數字系統的交互方式。以往的網絡依賴靜態界面和預設的用戶路徑,而智能體網絡則引入動態運行時架構,使計算和界面能夠實時適應用戶的需求和意圖。
傳統網站是當前互聯網的基本單元,提供固定的界面,用戶通過預設路徑進行閱讀、寫作和信息交互。這種模式雖然有效,但限制了用戶只能使用為一般情況設計的界面,而非個性化需求。智能體網絡通過上下文感知計算、自適應界面生成,以及 RAG 等技術實現的實時信息檢索,突破了這些限制。
想想 TikTok 如何通過實時調整用戶偏好的個性化內容流來改變內容消費方式。智能體網絡將這一理念擴展到整個界面生成。用戶不再瀏覽固定的網頁佈局,而是與動態生成的界面互動,這些界面能夠預測並引導用戶的下一步操作。這種從靜態網站到動態、智能體驅動界面的轉變,標誌著我們與數字系統交互方式的根本性演變——從基於導航的模式轉向基於意圖的互動模式。
智能體的構成
智能體架構是研究人員和開發者們積極探索的領域。為了增強智能體的推理和解決問題的能力,新的方法不斷湧現。例如,Chain-of-Thought (CoT)、Tree-of-Thought (ToT) 和 Graph-of-Thought (GoT) 技術就是通過模擬更細緻、更接近人類的認知過程,來提升大語言模型 (LLMs) 處理複雜任務的創新。
Chain-of-Thought (CoT) 提示通過將複雜任務分解為更小的步驟來幫助大語言模型進行邏輯推理。這種方法特別適用於邏輯推理的問題,如編寫 Python 腳本或解決數學方程。
Tree-of-Thoughts (ToT) 在 CoT 的基礎上增加了樹狀結構,使得能夠探索多條獨立的思維路徑。這種增強使 LLMs 能夠應對更復雜的任務。在 ToT 中,每個“思維”僅與其前後相鄰的思維相連,雖然比 CoT 更靈活,但仍限制了思想之間的交流。
Graph-of-Thought (GoT) 進一步擴展了這一概念,將經典的數據結構與 LLMs 結合,允許任何“思維”在圖結構中與其他思維相連。這個互聯的思維網絡更接近人類的認知方式。
GoT 的圖結構在大多數情況下比 CoT 或 ToT 更能準確反映人類的思維方式。雖然在某些情況下,例如制定應急計劃或標準操作程序時,我們的思維模式可能類似於鏈或樹,但這些只是個別情況。人類的思維通常是跨越不同想法的,而不是線性順序的,因此更符合圖結構的表現。
GoT 的圖形化方法使得對思想的探索更加動態和靈活,這可能使大語言模型 (LLMs) 在解決問題時更具創造性和全面性。這
些基於遞歸圖的操作只是邁向智能體工作流程的一步。接下來的演變是協調多個具有特定專長的智能體來實現特定目標。智能體的優勢在於它們的組合能力。
智能體使得 LLMs 可以通過多智能體協調實現模塊化和並行化。
多代理系統
多智能體系統的概念由來已久。它可以追溯到 Marvin Minsky 的“心智社會”理論,該理論認為多個模塊化的心智協作可以超過單一的整體心智。ChatGPT 和 Claude 是單一智能體,而 Mistral 則推廣了專家混合。我們相信,將這一理念擴展到智能體網絡架構,是這種智能拓撲的最終形態。
從仿生學的角度來看,人類大腦(實際上是一個有意識的機器)在器官和細胞層面上表現出極大的異質性,與 AI 模型中數十億個相同神經元以統一、可預測方式連接的情況不同。神經元通過複雜的信號進行交流,涉及神經遞質梯度、細胞內級聯和各種調節系統,使其功能比簡單的二進制狀態複雜得多。
這表明,在生物學中,智能並不僅僅依賴於組件的數量或訓練數據集的規模。相反,它源於多樣化和專業化單元之間複雜的互動,這是一種本質上模擬的過程。因此,開發數百萬個小型模型並協調它們之間的合作,比起僅依賴幾個大型模型,更可能在認知架構上帶來創新,類似於多智能體系統。
多智能體系統設計相比單智能體系統具有多個優勢:更易維護、易於理解且便於擴展。即使在只需單一智能體接口的情況下,將其置於多智能體框架中也能提高系統的模塊化,簡化開發人員根據需求添加或移除組件的過程。值得注意的是,多智能體架構甚至可以是構建單一智能體系統的有效方法。
儘管大語言模型 (LLMs) 展現了卓越的能力,如生成類人文本、解決複雜問題和處理多種任務,但單個 LLM 智能體在實際應用中可能會受到限制。
下面,我們將探討與智能體系統相關的五個關鍵挑戰
通過交叉驗證減少幻覺:單個 LLM 智能體常常會產生錯誤或無意義的信息,即使經過大量訓練也是如此,因為輸出可能看似合理但缺乏事實依據。多智能體系統可以通過交叉驗證信息來降低錯誤風險,不同領域的專業化智能體能提供更可靠和準確的回答。
利用分佈式處理擴展上下文窗口:LLMs 的上下文窗口有限,難以處理長文檔或對話。在多智能體框架下,智能體可以分擔處理任務,各自負責一部分上下文。通過相互交流,智能體能夠在整個文本中保持連貫性,從而有效地擴展上下文窗口。
並行處理提升效率:單個 LLM 通常需要逐個處理任務,導致響應時間較慢。多智能體系統支持並行處理,允許多個智能體同時完成不同任務,從而提高效率,加快響應速度,使企業能夠快速應對多個查詢。
促進複雜問題解決的協作:單一的 LLM 在解決需要多種專業知識的複雜問題時可能會遇到困難。多智能體系統通過協作,每個智能體貢獻其獨特的技能和視角,能夠更有效地應對複雜挑戰,提供更全面和創新的解決方案。
通過資源優化提高可訪問性:高級 LLM 需要大量計算資源,成本高昂且難以普及。多智能體框架通過任務分配優化資源使用,降低整體計算成本,使 AI 技術更加經濟實惠,更容易為更多組織所用。
雖然多智能體系統在分佈式問題解決和資源優化上有明顯優勢,但它們在網絡邊緣的應用才真正展現了其潛力。隨著 AI 的不斷進步,多智能體架構與邊緣計算的結合形成了強大的協同效應,不僅實現了協作智能,還在眾多設備上實現了本地化和高效處理。這種分佈式的 AI 部署方式自然地擴展了多智能體系統的優勢,使專業化和合作的智能更貼近終端用戶。
邊緣智能
AI 在數字世界的普及正在推動計算架構的根本變化。隨著智能融入我們日常數字互動的方方面面,我們看到計算的自然分化:專用數據中心負責複雜推理和特定領域的任務,而邊緣設備則本地處理個性化和上下文敏感的查詢。這種向邊緣推理的轉變不僅是架構上的選擇,而是由多種關鍵因素推動的必然趨勢。
首先,AI 驅動的龐大交互量會使集中式推理提供商不堪重負,帶來無法承受的帶寬需求和延遲問題。
其次,邊緣處理能夠實現實時響應,這是自動駕駛、增強現實和物聯網設備等應用的關鍵。
第三,本地推理通過將敏感數據保存在個人設備上來保護用戶隱私。
第四,邊緣計算通過減少跨網絡的數據傳輸顯著降低了能耗和碳排放。
最後,邊緣推理支持離線功能和彈性,確保即使在網絡連接不佳時 AI 功能仍然可用。
這種分佈式智能模式不僅是對現有系統的優化,更是對我們在日益互聯的世界中如何部署和使用 AI 的全新構想。
此外,我們正在經歷大語言模型 (LLMs) 計算需求的重大轉變。過去十年中,訓練大語言模型所需的龐大計算資源一直是重點,而現在我們進入了推理計算成為核心的時代。這種變化在智能 AI 系統的興起中尤為明顯,例如 OpenAI 的 Q* 突破,展示了動態推理需要大量實時計算資源。
不同於訓練時計算,它是模型開發的一次性投入,而推理時計算是智能體進行推理、規劃和適應新環境所需的持續計算過程。這種從靜態模型訓練到動態智能體推理的轉變,要求我們重新思考計算基礎設施,此時邊緣計算不僅有利而且必不可少。
隨著這一變化的推進,我們看到點對點邊緣推理市場的興起,數十億連接設備——從智能手機到智能家居系統——形成了動態計算網絡。這些設備可以無縫交易推理能力,形成一個有機市場,計算資源得以流向最需要的地方。閒置設備的多餘計算能力成為一種有價值的資源,可以實時交易,構建出比傳統集中系統更高效、更具彈性的基礎設施。
推理計算的這種民主化不僅優化了資源利用,還在數字生態系統中創造了新的經濟機會,每個連接設備都可能成為 AI 能力的微型提供者。因此,AI 的未來不僅依賴於單個模型的能力,還依賴於由互聯邊緣設備構成的全球化、民主化的推理市場,這類似於一個基於供需的實時推理現貨市場。
智能體為中心的交互
大語言模型 (LLMs) 使我們能夠通過對話而非傳統的瀏覽方式來獲取大量信息。這種對話方式將迅速變得更加個性化和本地化,因為互聯網正在轉變為一個為 AI 智能體服務的平臺,而非僅僅服務於人類用戶。
從用戶的角度來看,重點將從尋找“最佳模型”轉向獲取最個性化的答案。實現更好答案的關鍵在於結合用戶的個人數據與互聯網的普遍知識。起初,更大的上下文窗口和檢索增強生成 (RAG) 技術將幫助整合個人數據,但最終,個人數據的重要性將超過普通互聯網數據。
這預示著一個未來:每個人都將擁有與互聯網專家模型互動的個人 AI 模型。個性化起初會依賴遠程模型,但隨著對隱私和響應速度的關注增加,更多交互將轉移到本地設備。這將形成新的界限——不再是人與機器之間,而是個人模型與互聯網專家模型之間。
傳統的互聯網訪問原始數據的模式將逐漸被淘汰。取而代之的是,您的本地模型將與遠程專家模型交流以獲取信息,然後以最個性化和高效的方式呈現給您。隨著這些個人模型對您的偏好和習慣的瞭解加深,它們將變得不可或缺。
互聯網將演變為由互聯模型組成的生態系統:本地的高上下文個人模型和遠程的高知識專家模型。這將涉及到新技術,例如聯邦學習,用於更新這些模型之間的信息。隨著機器經濟的發展,我們需要重新構想支撐這一切的計算基礎設施,特別是在計算能力、可擴展性和支付方面。這將導致信息空間的重新組織,使其以智能體為中心、主權獨立、高度可組合、自我學習並不斷髮展。
智能體協議的架構
在智能體網絡中,人機交互演變為複雜的智能體間通信網絡。這種架構重新構想了互聯網的結構,使主權智能體成為數字交互的主要接口。以下是智能體協議所需的核心要素。
主權身份
數字身份從傳統的 IP 地址轉變為由智能體控制的加密公鑰對
基於區塊鏈的命名系統取代傳統的 DNS,消除集中控制
信譽系統用於跟蹤智能體的可靠性和能力
零知識證明用於實現隱私保護的身份驗證
身份可組合性允許智能體管理多個上下文和角色
自主智能體
自主智能體具備以下能力:
理解自然語言和解析意圖
多步驟規劃和任務分解
資源管理與優化
從互動和反饋中學習
在設定的參數內自主決策
針對特定功能的智能體專業化和市場
內置安全機制和對齊協議以確保安全
數據基礎設施
具備實時數據攝取和處理能力
分佈式數據驗證和校驗機制
混合系統結合以下技術:
zkTLS
傳統訓練數據集
實時網絡抓取和數據合成
協作學習網絡
人類反饋強化學習 (RLHF) 網絡
分佈式反饋收集系統
質量加權的共識機制
動態模型調整協議
計算層
可驗證的推理協議確保:
計算完整性
結果可重複性
資源利用效率
去中心化的計算基礎設施,包括:
點對點計算市場
計算證明系統
動態資源分配
邊緣計算的集成
模型生態系統
分層模型架構:
針對特定任務的小型語言模型 (SLMs)
通用的大型語言模型 (LLMs)
專業的多模態模型
多模態大型動作模型 (LAMs)
模型的組合和編排
持續學習和適應能力
標準化的模型接口和協議
協調框架
用於安全智能體交互的加密協議
數字產權管理系統
經濟激勵結構
用於以下方面的治理機制:
爭議解決
資源分配
協議更新
並行執行環境支持:
併發任務處理
資源隔離
狀態管理
衝突解決
智能體市場
基於鏈上的身份原語 (如 Gnosis 和 Squad 多重簽名)
智能體間的經濟和交易
智能體擁有部分流動性
智能體在創始時擁有其 Token 供應的一部分
通過流動性支付的聚合推理市場
鏈上密鑰控制鏈下賬戶
智能體成為收益資產
通過智能體去中心化自治組織 (DAOs) 實現治理和分紅
構建智能的超結構
現代分佈式系統設計為開發智能體協議提供了獨特的靈感和基礎,尤其是在事件驅動架構和計算的 Actor 模型方面。
Actor 模型為構建智能體系統提供了一個優雅的理論框架。這種計算模型將“actor”視為計算過程中的基本單元,每個 actor 可以:
處理消息
做出本地決策
創建新的 actor
向其他 actor 發送消息
決定如何響應接收到的下一條消息
Actor 模型在智能體系統中的主要優勢包括:
隔離性:每個 actor 獨立運行,維護自身的狀態和控制流程
異步通信:actor 之間的消息傳遞是非阻塞的,從而支持高效的並行處理
位置透明性:actor 能夠在網絡中任何位置進行通信
故障容錯:通過 actor 的隔離和監督層次增強系統的彈性
可擴展性:天然支持分佈式系統和並行計算
我們提出了 Neuron,這是一種通過多層分佈式架構實現的實際智能體協議,結合了區塊鏈命名空間、聯邦網絡、CRDTs 和 DHTs,每一層在協議棧中都有其特定的功能。我們借鑑了 Urbit 和 Holochain,這些早期的點對點操作系統設計的理念。
在 Neuron 中,區塊鏈層提供可驗證的命名空間和身份,支持確定性地尋址和發現智能體,同時提供能力和信譽的加密證明。在此基礎上,DHT 層幫助實現高效的智能體和節點發現以及內容路由,查找時間為 O(log n),減少了鏈上操作,同時支持本地化的對等查找。聯邦節點之間的狀態同步通過 CRDTs 進行,允許智能體和節點在不需要每次交互都達成全球共識的情況下保持一致的共享狀態視圖。
這種架構自然適用於聯邦網絡,在這個網絡中,自主智能體作為獨立節點在設備上運行,並通過本地邊緣推理實現 Actor 模型。聯邦域可以根據智能體的能力進行組織,DHT 提供域內和跨域的高效路由和發現。每個智能體作為獨立的 actor 運行,擁有自己的狀態,而 CRDT 層確保整個聯邦的一致性。這個多層次的方法實現了幾個關鍵功能:
去中心化協調
區塊鏈用於提供可驗證的身份和全球命名空間
DHT 用於高效的節點發現和內容路由,查找時間為 O(log n)
CRDTs 用於併發狀態同步和多智能體協調
可擴展的操作
基於區域的聯邦拓撲
分層存儲策略(熱/溫/冷)
本地化請求路由
基於能力的負載分配
系統彈性
無單點故障
分區期間的持續操作
自動狀態協調
故障容錯的監督層次結構
這種實現方法為構建複雜的智能體系統提供了堅實的基礎,同時保持了主權、可擴展性和彈性這些有效智能體交互所需的關鍵屬性。
最終的思考
智能體網絡標誌著人機交互的一個重要演變,超越了之前的逐步發展,建立了一種全新的數字存在模式。與以往僅僅改變信息消費或擁有方式的演變不同,智能體網絡將互聯網從一個以人為中心的平臺轉變為一個智能基質,在這裡自主智能體成為主要參與者。這一轉變由邊緣計算、大語言模型和去中心化協議的融合推動,創造了一個生態系統,在這個生態系統中,個人 AI 模型與專業專家系統無縫對接
隨著我們邁向以智能體為中心的未來,人類與機器智能之間的界限逐漸模糊,取而代之的是一種共生關係。在這種關係中,個性化的 AI 智能體成為我們的數字延伸,能夠理解我們的背景,預見我們的需求,並自主地在廣闊的分佈式智能網絡中運作。因此,智能體網絡不僅僅是技術上的進步,更是對數字時代人類潛力的一次根本性重新想象。在這個網絡中,每次交互都是增強智能的機會,每個設備都是全球協作 AI 系統中的一個節點。
正如人類在空間和時間的物理維度中活動,自主智能體也在自己的基本維度中運作:區塊空間代表其存在,推理時間代表其思考。這種數字本體論反映了我們的物理現實——在人類穿越空間和體驗時間流動的同時,智能體通過加密證明和計算週期在算法世界中行動,創造了一個平行的數字宇宙。
在去中心化的區塊空間中運作將成為潛在空間中實體的必然趨勢。