原文作者: Kevin, the Researcher at BlockBooster
AI Agent 框架作為行業發展的關鍵拼圖,可能蘊藏著推動技術落地與生態成熟的雙重潛力。市場中熱議的框架有:Eliza, Rig, Swarms, ZerePy 等等。這些框架通過 Github Repo 吸引開發者,建立聲望。以“庫”發幣的形式讓這些框架,和光同時具備波和粒子的特質類似,Agent 框架同時具備嚴肅外部性和 Memecoin 的特性。本文將重點解讀框架的“波粒二象性”以及 Agent 框架為什麼能成為最後一角。
Agent 框架帶來的外部性能夠在泡沫消退後留下春芽
從 GOAT 誕生開始,Agent 敘事衝擊市場的力度不斷上升,如同一位功夫大師,左拳“Memecoin”,右掌“行業希望”,你總會在其中一招裡敗下陣來。其實,AI Agent 的應用場景並未嚴格區分,平臺、框架與具體應用之間界限模糊,但根據代幣或協議的偏好仍可大致分類。但是,根據代幣或者協議的發展偏好還是可以分為以下幾類:
Launchpad:資產髮型平臺。Base 鏈上的 Virtuals Protocol 和 clanker,Solana 鏈的 Dasha。
AI Agent 應用:遊離於 Agent 和 Memecoin 之間,在記憶內存的配置上有出彩的地方,比如 GOAT,aixbt 等。這些應用一般來說是單向輸出的,輸入條件非常有限。
AI Agent 引擎:Solana 鏈的 griffain 以及 base 鏈的 Spectre AI。griffain 可以做到從讀寫模式進化到讀、寫、行動的模式;Spectre AI 是 RAG 引擎,鏈上搜索。
AI Agent 框架:對於框架平臺來說,Agent 本身就是資產,所以 Agent 框架是 Agent 的資產發行平臺,是 Agent 的 Launchpad。目前具有代表性的項目有 ai 16 ,Zerebro , ARC 和這兩天熱議的 Swarms。
其他小方向:綜合型 Agent Simmi;AgentFi 協議 Mode;證偽類 Agent Seraph;實時 API Agent Creator.Bid。
進一步討論 Agent 框架,可以看出它具有充分的外部性。不同於各大公鏈和協議的開發者只能在不同開發語言環境中選擇,而行業內總的開發者規模並沒有呈現對應市值增速的增長。Github Repo 是Web2和Web3開發者建立共識的之所,在這裡建立開發者社區,比任何一個協議單獨開發出來的“一插即用”包對Web2開發者的吸引力和影響力更強大。
本文提到的 4 種框架都已開源:ai16z的 Eliza 框架獲得 6200 顆星;Zerebro 的 ZerePy 框架獲得 191 顆星;ARC 的 RIG 框架獲得 1700 顆星;Swarms 的 Swarms 框架獲得 2100 顆星。目前,Eliza 框架被廣泛用於各種 Agent 應用,是覆蓋面最廣的框架。ZerePy 的開發程度不算高,發展方向主要在 X 上,尚且不支持本地 LLM 和集成內存。 RIG 的相對開發難度最高,但是能給開發者最大限度實現性能優化的自由。Swarms 除了團隊推出 mcs 之外還沒有其他用例,但是 Swarms 可以集成不同框架,有較大想象空間。
此外,上述分類中,把 Agent 引擎和框架分割開來,或許或造成疑惑。但我認為二者是有區別的。首先,為什麼是引擎?聯想現實生活中的搜索引擎來類比是相對契合的。不同於同質化的 Agent 應用,Agent 引擎的性能在其之上,但同時是完全封裝的,通過 api 接口來調整的黑盒。用戶可以以 fork 的形式來體驗 Agent 引擎的性能,但是又不能像基礎框架那樣掌握全貌和定製自由。每個用戶的引擎就像在調教好的 Agent 上生成一個鏡像,是對鏡像做交互。而框架本質上是為了適配鏈,因為在 Agent 做 Agent 框架,最終目的都是和對應的鏈有整合,怎樣定義數據交互方式,怎樣定義數據驗證方式,怎樣定義區塊大小,怎樣平衡共識和性能,這些是框架需要考慮的事情。而引擎呢?只需要在某一個方向,充分微調模型和設置數據交互還有內存之間的關係就行,性能是唯一評價標準,而框架則不然。
用“波粒二象性”的視角去評價 Agent 框架或許是確保走在正確方向上的前提
Agent 執行一次輸入輸出的生命週期中,需要三個部分。首先是底層模型決定了思考深度和方式,然後內存是自定義的地方,在基礎模型有了輸出之後,根據內存再修改,最後在不同的客戶端上完成輸出操作。
來源:@SuhailKakar
為了證實 Agent 框架具有“波粒二象性”,“波”具有“Memecoin”的特徵,代表社區文化和開發者活躍度,強調 Agent 的吸引力和傳播能力;“粒”代表“行業預期”的特徵,代表底層性能、實際用例和技術深度。我會分別從兩個方面結合三個框架的開發教程為例進行說明:
快速拼接式的 Eliza 框架
1.設置環境
來源:@SuhailKakar
2.安裝 Eliza
來源:@SuhailKakar
3.配置文件
來源:@SuhailKakar
4.設置 Agent 性格
來源:@SuhailKakar
Eliza 的框架相對來說,易於上手。它是基於 TypeScript,這是大多數 Web 和 Web3 開發者都熟悉的語言。框架簡潔,沒有過度抽象,讓開發者能夠輕鬆地添加自己想要的功能。通過步驟 3 ,看到 Eliza 可以多客戶端集成,可以將其理解為多客戶端集成的組裝器。Eliza 支持 DC, TG 和 X 等平臺,還支持多種大語言模型,可以通過上述社交媒體實現輸入,LLM 模型來輸出,並且支持內置記憶管理,可以讓任意習慣的開發者快速部署 AI Agent。
由於框架的簡潔性和接口的豐富性,Eliza 大大降低了接入的門檻,實現了相對統一的接口標準。
一鍵使用式的 ZerePy 框架
1.Fork ZerePy 的庫
來源: https://replit.com/@blormdev/ZerePy?v=1
2.配置 X 和 GPT
來源: https://replit.com/@blormdev/ZerePy?v=1
3.設置 Agent 性格
來源: https://replit.com/@blormdev/ZerePy?v=1
性能優化式的 Rig 框架
以構建 RAG(檢索增強生成) Agent 為例:
1.配置環境和 OpenAI key
來源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
2.設置 OpenAI 客戶端並使用 Chunking 進行 PDF 處理
來源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3.設置文檔結構和嵌入
來源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4.創建向量存儲和 RAG agent
來源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)是一個基於 Rust 語言面向 LLM 工作流引擎的 AI 系統構建框架,它要解決更底層的性能優化問題,換句話說,ARC 是一個 AI 引擎「工具箱」,提供 AI 調用、性能優化、數據存儲、異常處理等後臺支撐服務。
Rig 要解決的是「調用」問題,以幫助開發者更好選擇 LLM,更好優化提示詞,更有效管理 token,以及如何處理併發處理、管理資源、降低延遲等,其側重點在於 AI LLM 模型和 AI Agent 系統協作過程中如何「用好它」。
Rig是一個開源 Rust 庫,旨在簡化 LLM 驅動的應用(包括 RAG Agent)的開發。因為 Rig 開放的程度更深,因此對開發者要求更高,對 Rust 和 Agent 的理解要求也更高。 這裡的教程是最基礎的 RAG Agent 的配置流程,RAG 通過將 LLM 與外部知識檢索相結合來增強 LLM。在官網的其他 DEMO 中,可以看到 Rig 具備以下特徵:
LLM 接口統一:支持不同 LLM provider 的一致 api,簡化集成。
抽象工作流:預構建的模塊化組件讓 Rig 可以承接複雜 AI 系統的設計。
集成向量存儲:內置對裁體存儲的支持,在 RAG Agent 等相似的搜索類 Agent 中提供高效性能。
嵌入靈活:提供易於使用的 API,用於處理嵌入,在 RAG Agent 等相似的搜索類 Agent 開發時,降低語義理解的難度。
可以看出相比 Eliza,Rig 為開發者提供了額外的性能優化的空間,幫助開發者更好地調試 LLM 和 Agent 的調用和協作優化。Rig 以 Rust 驅動性的性能、利用 Rust 優勢零成本抽象和內存安全、高性能、低延遲的 LLM 操作。能夠在底層層面上,提供更豐富的自由度。
分解組合式的 Swarms 框架
Swarms 旨在提供企業級生產級多 Agent 編排框架,官網提供了幾十種 workflow 和 Agent 並行串行架構,這裡介紹其中一小部分。
Sequential Workflow
順序 Swarm 架構以線性順序處理任務。每個 Agent 在將結果傳遞給鏈中的下一個 Agent 之前完成其任務。此架構可確保有序處理,並且在任務具有依賴關係時非常有用。
用例:
工作流程中的每個步驟都依賴於前一個步驟,例如裝配線或順序數據處理。
需要嚴格按照操作順序的場景。
層次化架構:
實現自上而下的控制,由上級 Agent 協調各下級 Agent 之間的任務。其中 Agent 同時執行任務,然後將其結果反饋到循環中進行最終聚合。這對於高度可並行化的任務非常有用。
電子表格式架構:
用於管理同時工作的多個代理的大規模群體架構。可同時管理數千個代理,每個代理都在自己的線程上運行。它是監督大規模代理輸出的理想選擇。
Swarms 不僅是 Agent 框架,還可以兼容上述 Eliza, ZerePy 和 Rig 框架,以模塊化的思想,在不同工作流和架構中最大化釋放 Agent 性能,以解決對應問題。Swarms 的構思和開發者社區進展都沒問題。
Eliza:易用性最強,適合初學者和快速原型開發,尤其適合社交媒體平臺的 AI 交互。框架簡潔,便於快速集成和修改,適合不需要過度性能優化的場景。
ZerePy:一鍵式部署,適合快速開發Web3和社交平臺的 AI Agent 應用。適合輕量級 AI 應用,框架簡單,配置靈活,適用於快速搭建和迭代。
Rig:側重性能優化,尤其在高併發和高性能任務中表現出色,適用於需要細緻控制和優化的開發者。框架較為複雜,需要一定的 Rust 知識,適合更有經驗的開發者。
Swarms:適合企業級應用,支持多 Agent 協作和複雜任務管理。框架靈活,支持大規模並行處理,並提供多種架構配置,但由於其複雜性,可能需要更強的技術背景來有效應用。
總體來說,Eliza 和 ZerePy 在易用性和快速開發方面具有優勢,而 Rig 和 Swarms 更適合需要高性能和大規模處理的專業開發者或企業應用。
這就是 Agent 框架具有“行業希望”特性的原因,上述框架還處於早期階段,當務之急是搶佔先發優勢並建立活躍的開發者社區。框架本身的性能高低以及相對Web2流行應用來說是否落後都不是主要矛盾。只有源源不斷湧入開發者的框架才能最終勝出,因為Web3行業始終需要吸引市場的注意力,框架性能再強,基本面再雄厚,如果難以上手導致無人問津,則本末倒置。在能夠框架自身能夠吸引開發者的前提,具有更成熟和更完整的代幣經濟模型的框架會脫穎而出。
而 Agent 框架有著“Memecoin”特性這一點,則非常好理解。上述框架代幣都沒有合理的代幣經濟設計,代幣沒有用例或者用例非常單一,沒有經過驗證的商業模式,也沒有行之有效的代幣飛輪,框架僅僅是框架,和代幣之間沒有完成有機結合,代幣價格的增長除了 FOMO 之外,難以獲得基本面上的助力,沒有足夠的護城河來確保穩定且持久的價值增長。同時,上述的框架自身也顯得比較粗糙,其實際價值和當前市值並不匹配,因此有著強烈的“Memecoin”的特性。
值得注意的是,Agent 框架的“波粒二象性”並不是缺點,不能將其粗暴的理解為既不是純粹的 Memecoin,又沒有代幣用例的半罐水。正如我在上一篇文章中提到的觀點:輕量化的 Agent 覆蓋著模稜兩可的 Memecoin 面紗,社區文化和基本面不會再成為矛盾,一種新的資產發展路徑在逐漸浮出水面;儘管 Agent 框架初期存在泡沫與不確定性,但其吸引開發者和推動應用落地的潛力不容忽視。未來,具備完善代幣經濟模型和強大開發者生態的框架,或將成為這一賽道的關鍵支柱。
關於 BlockBooster
BlockBooster 是一家由 OKX Ventures 及其他頂級機構支持的亞洲Web3創投工作室,致力於成為優秀創業者的可信賴夥伴。我們通過戰略投資和深度孵化,連接Web3項目與現實世界,助力優質創業項目成長。
免責聲明
本文/博客僅供參考,代表作者的個人觀點,並不代表 BlockBooster 的立場。本文無意提供:(i) 投資建議或投資推薦;(ii) 購買、出售或持有數字資產的要約或招攬;或 (iii) 財務、會計、法律或稅務建議。持有數字資產,包括穩定幣和 NFT,風險極高,價格波動較大,甚至可能變得一文不值。您應根據自身的財務狀況,仔細考慮交易或持有數字資產是否適合您。如有具體情況方面的問題,請諮詢您的法律、稅務或投資顧問。本文中提供的信息(包括市場數據和統計信息,若有)僅供一般參考。在編寫這些數據和圖表時已盡合理注意,但對其中所表達的任何事實性錯誤或遺漏概不負責。