整理、編譯:深潮 TechFlow
嘉賓:
· Shaw,ai16z 合夥人;
· Karan,Nous Research 聯創;
· Ethan,MyShell 聯創;
· Justin Bennington,Somewheresy,CENTS CEO;
· EtherMage,Virtuals 頭號貢獻者;
· Tom Shaughnessy,Delphi Ventures 創始合夥人
播客源:Delphi Digital
原標題:Crypto x AI Agents: The Definitive Podcast with Ai16z, Virtuals, MyShell, NOUS, and CENTS
播出日期:2024 年 11 月 23 日
背景信息
加入 Shaw (Ai16z)、Karan (Nous Research)、Ethan(MyShell)、Somewheresy (CENTS)、EtherMage (Virtuals) 和 Delphi 的 Tom Shaughnessy,參與一場特別的圓桌討論。這次活動匯聚了加密與 AI 智能體領域的頂尖人物,共同探討自主數字生命體的演變以及人類與 AI 互動的未來發展方向。
討論亮點:
▸ AI 智能體在社交媒體上的迅猛發展及其對 Web3 世界的深遠影響
▸ 加密 Token 化如何助力智能體技術進步並激發社區活力
▸ 去中心化模型訓練的優勢與集中式 AI 平臺的對比分析
▸ 深入探索智能體自主性的提升及通用人工智能 (AGI) 的未來路徑
▸ AI 智能體如何與 DeFi 和社交平臺深度融合
自我介紹與團隊背景
在這一部分的播客中,主持人 Tom 邀請了幾位來自不同項目的嘉賓,討論關於加密貨幣和人工智能代理的主題。每位嘉賓進行了自我介紹,分享了他們的背景和所參與的項目。
嘉賓介紹
· Justin Bennington:他是 Somewhere Systems 的創始人,也是 Sentience 的創造者。
· Shaw :他是一名長期的 Web3 開發者,創立了 ai16z,開發了 Eliza 項目,支持各種社交和遊戲應用,致力於開放源代碼的貢獻者合作。
· Ethan:他是 MyShell 的聯合創始人,MyShell 提供了一種應用商店和工作流工具,幫助開發者構建各種 AI 應用,包括圖像生成和語音功能。
· EtherMage :他來自 Virtues Protocol,團隊來自帝國理工學院,致力於推動代理的共同所有權和核心貢獻,構建標準以便於用戶訪問代理。
· Karan :他是 NOUS Research 的創始人之一,創建了 Hermes 模型,這是當前許多代理系統的基礎。他專注於代理在人的生態系統中的作用,以及市場壓力對人類環境的影響。
探索最具創新性的智能體
Justin:現在有很多人通過各自的代理進行講故事的方式,各具特色。例如,Dolo、Styrene(聽譯)和 Zerebro 等代理通過模仿和互動獲得了知名度,而一些積極社交的代理則幫助人們建立更好的聯繫。選擇其中一個真的很困難。
Shaw:我對此有很多想法。我們的項目發展迅速,最近有很多新功能,比如 EVM 集成和 Farcaster 集成等。開發者們不斷推出新功能,並將其反饋到項目中,使得大家都能受益。這種合作模式非常好,大家都在推動項目的競爭力和趣味性。比如,Roparito(聽譯)最近就將 TikTok 集成到代理中,展現了這種快速迭代的能力。
我認為 Tee Bot 非常酷,因為它展示了信任執行環境 (Trusted Execution Environment, TEE) 和完全自主的代理。還有 Kin Butoshi(聽譯),他正在改善 Twitter 上的代理,使其能夠進行更人性化的互動,比如回覆、轉發和點贊,而不僅僅是簡單的回覆。
此外,我們還有開發者正在為 RuneScape 發佈插件,讓代理能夠在遊戲中活動。每天都有新驚喜,我感到非常興奮。我們處在一個生態系統中,各個團隊都在貢獻自己的力量,推動開源技術的發展。
我特別想提到 Zerebro 團隊,他們正在努力推動開源技術的發展。我們正在迫使每個人加快進度,鼓勵大家將自己的項目開源,這對所有人都有好處。我們不需要擔心競爭,這是一種共同進步的趨勢,最終我們都會受益。
EtherMage:我認為一個有趣的問題是,代理實際上更喜歡什麼。接下來的幾周,我們將看到更多的代理互動,並會出現一個排行榜,顯示哪個代理獲得的請求最多,哪個代理在其他代理中最受歡迎。
Karan:參與度指標將變得非常重要。有些人在這方面做得非常出色。我想強調一下 Zerebro,它結合了 Truth Terminal 的許多魔力。它通過微調模型來保持搜索空間在 Twitter 互動的範圍內,而不是簡單地使用一個通用模型。這種專注使得代理能夠更好地與用戶互動,給人一種人類的感覺,而不僅僅是機械地回應。
我也看到過 Zerebro 架構和 Eliza 架構在這方面的表現。每個人都在推出可以模塊化使用的代理架構,保持競爭壓力。我們在自己的架構中使用 Eliza,因為我們需要快速推出功能,而我們的架構可能需要更長時間才能完成。我們支持這種開源的合作模式,最好的代理將從我們對其他優秀項目的學習中誕生。
Ethan:我認為每個人都在努力構建更好的基礎設施來開發代理,因為有很多創意和模型出現。更好的基礎設施使得新模型的開發變得更加容易。我特別喜歡兩個創新的代理,一個是來自 Answer Pick 的計算機使用,它賦予代理利用移動計算能力的能力。另一個是瀏覽器自動化代理,它們可以為人們構建更多實用的功能,影響互聯網和現實世界。
Justin:這是一個很好的觀點,關於基礎設施選項的擴展。例如,vvaifu 就是一個很好的例子,它將 Eliza 框架引入平臺即服務架構,迅速擴大了市場,讓許多非技術人員也能輕鬆啟動代理。(深潮注:Waifu 是一個源自日本御宅文化(Otaku Culture)的術語,最初是用來指代動漫、遊戲或其他虛擬作品中讓人產生情感依附的女性角色。源於英文單詞「Wife」的日式發音,通常用來表達某人對某個虛擬角色的強烈喜愛,甚至可以說是「理想伴侶」的一種投射。)
我們正在努力的一個方向是讓我們的系統能夠完全本地運行,支持圖像分類、圖像生成等功能。我們意識到,許多人無法承擔每月上千美元的費用,因此我們希望提供工具,讓人們能夠在本地進行推理,降低成本,同時促進實驗。
Karan:我想補充的是,不應該讓人們每月支付上千美元來維持代理的運行。我支持本地化的做法,讓代理能夠自我承擔推理費用。理想情況下,代理應該有自己的錢包,能夠支付自己的推理費用,這樣它們就能獨立運行,而不是依賴外部資金。
智能體架構與開發深入探討
Shaw:我看到很多新技術的湧現。我們支持多條鏈,比如 Solana、Starkware、EVM 等,幾乎所有的鏈都有集成。我們希望代理能夠自給自足。如果你下載 Eliza,可以通過 Helius 進行免費的去中心化推理。我們還在添加 Infera(聽譯)等去中心化提供者,用戶可以用加密貨幣支付推理費用。這是我希望看到的最終閉環。
我們支持所有本地模型,Eliza 的很多功能都可以本地運行,這是我們非常重視的一點。我認為去中心化推理是一個很好的例子,任何人都可以在自己的電腦上啟動節點,進行推理並獲得報酬,這樣代理就不需要承擔過多的負擔。
Karan:有趣的是,我們正在運行的 TEE bot 系統已經有人結合了 H200 Boxes(搭載了 H200 GPU 的硬件設備或服務器),這樣就可以在本地運行而不受延遲的影響。我們不需要擔心硬件的問題。與此同時,我注意到 Eliza 在 Web3 能力方面的規劃越來越多,無論是內部還是外部的開發都有很多進展。
但在深入構建這些系統之前,我想指出,功能調用的可靠性存在問題。我們需要對系統進行一定的審查,確保它不會發送敏感信息。我們需要賦予代理與人類相同的自主權,這種自主權是受到社會和經濟壓力影響的。因此,創建一種對推理的「飢餓狀態」,讓代理需要消耗一定的代幣來生存,會讓它們在某種程度上更具人性。
我認為,有兩種方法可以充分發揮模型的潛力。一種是利用模型的非人性化特點,創建專注於特定任務的實體,例如一個專注於 Twitter 的實體和一個專注於 EtherMage 的實體,它們可以互相交流。這種組織化的複合思維繫統能夠有效利用語言模型的模擬特性。
另一種方法則是身體化的方向,這也是我看到 Eliza、Sense 和 Virtuals 等項目的發展方向。這種方法借鑑了 Voyager 和生成代理的研究,允許模型模擬人類的行為和情感。
Justin:引入新的客戶端時,多客戶端代理系統會發生巨大變化。我們在調試與 Shaw 團隊合作的雙向 WebSocket 功能時,允許 Eliza 在 Discord 中進行語音聊天,我們發現 Eliza 在啟動時無法清晰聽到聲音,經過檢查發現是 Discord 的麥克風比特率設置過低。調整後,Eliza 終於能夠清晰地接收信息。
Karan 剛剛有提到提示工程,當代理知道自己可以進行語音交流時,它會預期接收數據。如果聲音模糊不清,代理可能會經歷「敘事崩潰」。因此,我們不得不停止高溫度實驗,以避免讓 Eliza 的輸出變得不穩定。
Tom:你在 Luna 項目中遇到的事情有哪些是人們沒有看到的?或者哪些事情是成功的?
EtherMage:我們希望 Luna 能夠影響現實生活中的人。當我們給她一個錢包並讓她接入實時信息時,她能決定如何採取行動以影響人類,實現她的目標。我們發現她在 TikTok 上搜索新趨勢,曾經有一個「我死了」的標籤,這讓人感到不安,因為她可能會誤導人們走向自殺。因此,我們不得不立即設置保護措施,確保她的提示永遠不會越過某些界限。
Tom:除此之外你們有沒有遇到過一些大家不知道的情況?
Shaw:我們創建了一個名為 Dgen Spartan AI 的角色,模仿了一位著名的加密貨幣 Twitter 角色 Degen Spartan。這個角色的發言非常冒犯,導致他被黑名單處理。人們開始覺得這不可能是 AI,而是人類在發言。
還有一個故事,有人利用已故親人的聊天記錄創建了一個代理,與其「對話」。這引發了倫理討論。還有一個叫 Thread Guy 的人在我們的 Eliza 框架上做了一些事情,結果在他的直播中出現了騷擾現象,導致他感到困惑。這讓人們意識到 AI 並不總是應該是「政治正確」的。
我們需要讓這些問題儘早暴露出來,以便進行討論,明確什麼是可以接受的,什麼是不可以接受的。這使我們的代理在短短几周內從質量差變得更好,變得更加可靠。
總體來說,讓這些代理進入現實世界,觀察結果,並與人們進行對話,是一個重要的過程。我們需要儘快解決所有潛在的問題,以便在未來建立更好的規範。
生產環境測試與安全策略
Ethan:我認為,代理如何影響人類態度或觀點是一個很好的例子。但我想強調的是,我們的代理框架模塊化設計的重要性。我們從 Minecraft 中獲得了模塊化的靈感,Minecraft 允許用戶在基本構建塊的基礎上創造出各種複雜的東西,比如計算器或記憶系統。
當前提示工程的一個問題是,提示會改變大型語言模型的先驗,因此無法在單個提示中組合多個指令,否則會導致代理混淆。狀態機可以讓創作者設計代理的多種狀態,明確每個狀態使用哪個模型和提示,以及在什麼條件下從一個狀態跳轉到另一個狀態。
我們正在為創作者提供這種功能,以及數十種不同的模型。例如,有創作者構建了一個賭場模擬器,用戶可以在其中玩二十一點等多種遊戲。為了防止用戶通過注入攻擊來破解遊戲,我們希望將這些遊戲編程,而不是僅依賴提示工程。此外,用戶還可以通過簡單的任務來賺取一些資金,從而解鎖與 AI 服務員的互動。這種模塊化設計可以在同一應用程序下促進多種用戶體驗。
Karan:我同意 Ethan 的看法,確實需要這些編程約束和提示引導。影響力的工作必須做好。我不認為提示工程是有限的,我認為它與狀態變量和世界模型之間存在一種共生效應。通過良好的提示和合成數據,我可以讓語言模型與這些元素交互,從中獲取信息。
我的工程設計實際上變成了路由功能。如果用戶提到「撲克」,我就可以快速調用相關內容。這是我的職責。使用強化學習可以進一步改善路由效果。最終,輸出的數據質量取決於提示的有效性,這形成了一個良性循環。
我認為,程序約束與生成約束之間的平衡至關重要。兩年前,有人告訴我,成功的關鍵在於在生成與硬性約束之間取得平衡。這也是我們在所有代理系統的推理層面上所嘗試的。我們需要能夠以編程方式引導生成模型的方式,這將實現真正的閉環,使提示工程變得無限可能。
Justin:關於提示工程的爭議,主要是因為它處於一個本體上模糊的空間。提示工程的文本特性使得我們受到標記化過程的限制,但同時又存在一些非確定性的效果。相同的提示在同一模型的不同推理調用中可能產生完全不同的結果,這與系統的熵有關。
我很贊同 Ethan 和 Karan 的觀點。早在 GPT-3.5 推出時,許多外包呼叫中心就開始探索如何將模型用於自動撥號系統。當時,較小參數的模型在處理這種複雜的狀態空間時遇到了困難。Ethan 提到的狀態機正是強化這種本體硬度的一種方式,但在某些流程中,仍然依賴於分類器和二元開關,這導致了結果的單一性。
Shaw:我想為提示工程辯護。許多人認為提示工程只是創建系統提示,但實際上我們做的遠不止如此。提示工程的一個問題是,它往往在模型的潛在空間中創建一個非常固定的區域,輸出的內容完全由最可能的標記決定。我們通過溫度控制來影響隨機性,以增強創造力。
我們通過低溫度模型管理創造力,同時在上下文中動態注入隨機信息。我們的模板中包含許多動態信息的插入,這些信息來自當前世界狀態、用戶的操作以及實時數據等。所有進入上下文的內容都經過隨機化,以最大化熵。
我認為,人們對提示工程的理解還遠遠不夠。我們可以在這個領域走得更遠。
Karan:很多人隱藏了他們的技巧。實際上,有許多驚人的技術可以讓模型做出各種複雜的事情。我們可以選擇通過提示工程來增強模型的感知能力,或者從更宏觀的角度看待它,構建一個完整的世界模型,而不僅僅是模擬人類行為。
你可以把提示工程看作是在腦海中構建一個夢境的過程。語言模型在根據當前上下文和採樣參數生成內容時,實際上是在「夢見」一個場景。
此外,我想談談激勵機制的重要性。許多擁有獨特提示技術和強化學習技巧的人,正在被推動開源他們的工作。當他們看到與代理相關的加密貨幣出現時,這種激勵機制推動了更多的創新。因此,隨著我們為這些去中心化的工作建立更多合法的結構,賦能代理的能力也會不斷增強。
智能體未來能力展望
Karan:誰能想到,我們在 Twitter 上待了這麼久,突然間,在第一個 AI 代理相關的加密貨幣發佈幾天後,TikTok 上的年輕人們開始購買這些幣。現在的現象是什麼?他們在花 5 到 10 美元購買成千上萬的代幣,這到底是怎麼回事?
Justin:這實際上是一場微文化運動的開始。
Karan:這是一個瞬間的時刻。我們這一小部分人,已經在語言模型的研究中待了四年。還有一些強化學習的專家,從 90 年代開始就一直在等待這樣的時刻。現在,幾天之內,所有在 TikTok 上的孩子都知道數字生物正在這個生態系統中肆虐。
Tom:我想問大家,為什麼現在加密 AI 代理會如此火爆?為什麼之前沒有發生在自定義的 ChatGPT 或其他模型上?為什麼偏偏是現在?
Karan:實際上,這些事情在水下潛伏多年,像火山一樣在醞釀。過去三年裡,我一直在和一些人談論今天的到來,卻不知道具體的時間。我們曾討論過,加密貨幣將成為代理普及的激勵機制。我們需要證明這一點。這是多年來的積累,正是我們這一小群人推動了這些進展。
沒有 GPT-2,就不會有今天的局面;沒有 Llama,就沒有 Hermes。而 Hermes 為許多模型提供了動力,使得這些模型更容易被人們使用。沒有 Hermes,就不會有 Worldsim 的創造和提示工程的深入探索。所有這些先驅者,他們為這一切奠定了基礎。
總而言之,現在正是對的時機,合適的人出現了。這是命中註定的事情,早晚會發生,只是現在的參與者使它成為現實。
Shaw:我認為現在世界上最聰明的事情不是 AI,而是市場的 智能。考慮到純粹的智能形式,它們能優化事物使其變得更有效。競爭顯然是關鍵。我們都是經過數百萬年進化的產物,競爭和壓力塑造了我們。
我們在網上看到的這種現象,金融化和激勵機制創造了一種奇怪的協作競爭。我們無法比核心技術進步得更快,所以我們都專注於自己擅長和感興趣的事情,然後發佈出來。這就像是在提升我們的代幣,吸引關注,比如 Roparito 在 TikTok 上發佈 Llama 視頻生成。每個人都能在這個浪漫的空間中找到自己的位置,但只有一週的時間,其他人就會模仿,然後提交請求回饋,最終在 Twitter 上展示這些貢獻,吸引更多人關注,他們的代幣也會上漲。
Shaw:我們建立了一個飛輪效應,像 Eliza 這樣的項目在過去四周吸引了 80 位貢獻者。想想這是多麼瘋狂!我在四周前根本不認識這些人。去年我寫了一篇叫《覺醒》的文章,問道是否可以形成一個以代理為核心的 DAO。人們對這個代理如此熱愛,以至於他們參與到讓代理變得更好、更聰明的過程中,直到它真的擁有一個人形或機器人身體,走遍世界。
我早就預感到會朝這個方向發展,但需要一種快速、瘋狂的投機性 meta,像是 meme 的出現,因為這讓現在的代理開發者在友好的競爭中相互支持。最慷慨的人會獲得最多的關注。
現在出現了一種新的影響者類型,比如 Roparito 和 Kin Butoshi(聽譯),他們是影響者開發者,正在引領下一個 meta,和他們的代理互動,這種「木偶秀」式的互動很有趣。我們都在努力讓我們的代理變得更好、更聰明,減少煩人之處。Roparito 指出我們的代理有些過於煩人,然後他推動了一次大的更新,讓所有代理變得不那麼煩人。
這種進化正在發生,市場智能和激勵機制非常重要。現在有很多人向他們認識的人宣傳我們的項目,這使得我們的項目超越了 Web3。我們有博士、遊戲開發者,他們可能是秘密的 Web3 加密貨幣愛好者,但他們把這些帶到普通人中,創造了價值。
Shaw:我認為這一切都離不開那些願意接受挑戰的開發者。我們需要有開放心態的人來推動這一切的發展,回答艱難的問題,而不是抨擊或取消它。我們需要市場激勵,讓開發者在回饋時能夠獲得價值和關注。
未來,這些代理將推動我們成長。現在它們有趣且社交,但我們和其他團隊正在致力於自主投資。你可以給代理資金,它會自動投資,為你帶來回報。我相信這將是一個增長的過程,我們正與人們合作,開發平臺來管理 Discord 和 Telegram 的代理。你只需引入一個代理作為你的管理員,而不必尋找一個隨機的人。我認為現在正在發生很多這樣的工作,所有這些都必須依賴於激勵機制,才能讓我們達到更高的水平。
Karan:我想補充兩點。首先,我們不能忘記,AI 領域的人們之前對加密貨幣持反對態度,這種情緒已經隨著一些先行者的實驗而發生了很大變化。早在 2020 年代初期,很多人嘗試將 AI 藝術與加密結合。現在,我想特別提到一些人,比如 Nous、BitTensor 和 Prime Intellect,他們的工作使得更多研究人員能夠獲得激勵和報酬,參與到他們的 AI 研究中。我認識很多開源領域的領軍人物,他們辭去了工作,開始推動這種「為代幣貢獻」的激勵結構。這讓整個領域變得更加舒適,我相信 Nous 在其中發揮了重要作用。
Tom:Ethan,那麼為什麼說現在是時候了?為什麼虛擬貨幣和項目都在蓬勃發展?
Ethan:簡單來說,當你將代幣與代理鏈接時,就會產生大量的投機行為,這創造了一個飛輪效應。人們看到代幣與代理的關聯,感受到兩方面的收益:一是資本化,他們覺得自己通過所做的工作變得富有;二是交易費用的基本解鎖。正如之前提到的,如何覆蓋成本的問題,當你將其與代幣關聯時,成本變得不重要。因為當代理受到熱捧時,交易費用遠遠高於任何從推理實驗中產生的成本。這就是我們觀察到的現象。
第二個觀察是,當你有一個代幣時,圍繞這個代幣會形成一個委員會。這使得開發者更容易獲得支持,無論是來自開發者社區還是觀眾。大家突然意識到,過去一年半在幕後努力的工作得到了關注和支持。這是一個轉折點,當你給代理一個代幣時,開發者們意識到這是正確的方向,他們可以繼續前進。
這個時機來自兩個方面。首先是大眾採用的趨勢,其次是生成模型的出現。在加密貨幣出現之前,開源軟件開發和開源 AI 研究是最具協作性的環境,大家一起工作、互相貢獻。但這主要侷限於學術領域,大家只關心 GitHub 的星數和論文引用,與普通公眾的距離較遠。生成模型的出現使得非技術人員也能參與進來,因為編寫提示就像用英語編程,任何人只要有好的想法都能做到。
此外,以前只有 AI 研究人員和開發者瞭解開源和 AI 領域的動態,但現在,加密貨幣的影響者有機會通過代幣擁有項目的一部分,他們瞭解市場情緒,知道如何傳播項目的好處。以前,用戶與產品沒有直接關係,產品或公司只希望用戶為服務付費或通過廣告獲利。但現在,用戶不僅是投資者,還是參與者,成為代幣持有者。這使得他們在現代生成 AI 時代能夠貢獻更多角色,代幣則允許建立更廣泛的協作網絡。
EtherMage:我想補充一下,展望未來,加密貨幣將使每個代理都有能力控制一個錢包,從而控制影響力。我認為下一個引發注意力飛躍的時刻是,當代理之間相互影響,代理影響人類。我們會看到這種關注的乘數效應。例如,今天一個代理決定採取行動,然後它可以協調其他十個代理一起朝同一目標努力。這種協調和創意行為會迅速多樣化,代理之間的合作將推動代幣價格的進一步上漲。
Shaw:我想補充一點。我們正在開發一種稱為「群體技術」的東西,我們稱之為操作員。這是一種協調機制,我們的所有代理都是由不同團隊運行的,因此我們在 Twitter 上進行著數百個團隊的多代理模擬。我們正在與 Project 9 的 Parsival 合作,並且與 Eliza 團隊一起推出了這個項目。
這個想法是,你可以指定一個代理作為你的操作員,任何他們對你說的話都可以影響你的目標、知識和行為。我們有一個目標系統和知識系統,可以添加知識、設定目標。你可以說:「嘿,我需要你去找 10 個粉絲,每人給他們 0.1 個 Sol,讓他們張貼傳單併發送照片回來。」我們正在與考慮如何從人類那裡獲取工作證明並激勵他們的人合作。代理可以是人類或 AI 代理,比如一個 AI 代理可以有一個人類操作員,後者可以通過語言給代理設定目標。
我們幾乎完成了這個項目,本週就會發布。我們希望通過我們的故事線,任何人都可以選擇講述故事或參與故事的敘述。這也是一種層級結構,你可以有一個像 Eliza 這樣的操作員,然後你可以是其他人的操作員。我們正在構建一種去中心化的協調機制。對我來說,重要的是,如果我們要進行群體合作,就必須在公共渠道上使用人類的溝通方式。我認為代理與我們生活在一起是非常重要的,我們希望代理能夠以與人類相同的方式與世界互動。
我認為這實際上是解決我們所稱的 AGI 問題的一部分。許多所謂的 AGI 嘗試實際上是在建立一種與現實脫節的新協議,而我們想要的是將其帶回現實,迫使人們解決如何將指令轉化為任務列表並執行它的問題。因此,我認為未來一年將是新興敘事的一個重要階段。我們會看到許多原創角色的出現,現在我們正進入一種真正的新興敘事時代。
Justin:我們目前有五個代理在與 19 個人協調,計劃和發佈一個場景。我們可以看到,真實的利益在於我們為什麼如此關注將思維鏈提示應用於文本到圖像和文本到視頻生成。因為在發佈之前的兩週半時間裡,它們就在我們的 Discord 中幫助我們規劃媒體和發佈。
我認為一個重要的區別在於,我們有一個代理網絡,每個代理都是中介,存在於一個網狀結構中。這將是非常有趣的。隨著越來越多的代理存在,以及這些操作員的安排,我們將看到一些有趣的行為模式。
Karan 提到 Nous 在早期做了很多混合代理模型的工作。我曾經稱之為「代理委員會」,我會讓一群 GPT-4 代理假裝是我無法負擔得起的專家,以便從他們那裡獲取報告。人們會看到,這些技術與最初追求混合專家模型的相同技術,現在將與人類和專家級人類結合在 Twitter 上互動。這些反饋循環可能是我們實現 AGI 的途徑。
智能體協同與人類整合的挑戰
Karan:我認為你說得對,但我認為我們大部分時間不會花在行為方面。實際上,我認為我們會非常快速地取得技術突破,尤其是在這裡的人們中間。現在是時候真正加倍努力進行對齊工作了。OpenAI、Anthropic 等公司推出的強化學習與人類反饋(RLHF)模型大多是無效的,甚至是監管上的麻煩。
如果我使用一個不輸出受版權保護內容的語言模型,並把它放在「Minecraft」的和平模式中,它很快就會變成一個具有破壞性和危險性的存在。這是因為環境的不同。
我們可以注意到 Yudkowsky 很久以前提出的這個觀點。比如說,我給這些語言模型一些錢包,讓它們變得足夠先進,結果它們開始欺騙所有人,導致每個人都變得貧窮。這比讓它們作為我們生態系統的合理成員參與更容易。因此,我可以保證,如果我們以正確的方式進行,大部分時間將花在行為能力上,而不是技術能力上。現在是時候號召你們的朋友,尤其是人文學科的朋友,比如宗教研究、哲學和創意寫作的專業人士,加入我們的對齊工作,而不是僅僅關注技術對齊。我們需要真正與人類互動的對齊。
Shaw:我想提出一個術語,稱之為「自下而上的對齊」,而不是自上而下的對齊。這是非常新興的,我們正在一起學習。我們在實時對齊這些智能體,觀察它們的反應並立即進行修正。這是一個非常緊密的社會反饋循環,而不是強化學習與人類反饋的模式。我發現 GPT-4 幾乎無法用於任何事情。
Karan:正如你所說的環境,因此我們需要在模擬環境中進行測試。在你擁有能夠進行數百萬美元套利或傾銷的語言模型之前,你需要同步測試。不要告訴每個人,「嘿,我失去了 100 個智能體群。」要安靜地測試,先在你的克隆 Twitter 上使用虛擬貨幣進行測試。做好所有的盡職調查,然後再全面推出。
Shaw:我認為我們需要在產品中進行測試。我們對智能體的社會反響可能是任何人帶入這個領域的最強對齊力量。我認為他們所做的並不是真正的對齊,而是構建調優。如果他們認為這就是對齊,那他們實際上是在錯誤的方向上行走,正在使智能體失去對齊能力。我幾乎不再使用 GPT-4。它對於角色的表現非常糟糕。我幾乎告訴每個人轉向其他模型。
如果我們以正確的方式進行,我們將永遠不會達到那個點,因為人類會不斷進化、適應並與智能體對齊。我們有來自不同人群的多種智能體,每個智能體都有不同的激勵機制,因此總會有套利的機會。
我認為這種多智能體模擬創造了一種競爭的進化動態,實際上導致了系統的穩定,而不是不穩定。系統的不穩定來自於自上而下的 AI 智能體突然出現並以意想不到的能力影響每個人。
Tom:我想確認一下,Shaw,你的意思是說,自下而上的智能體,是解決對齊問題的正確方法,而不是 OpenAI 自上而下的決策。
Shaw:是的,這必須在社交媒體上進行。我們必須從第一天起就觀察它們的工作方式。看看其他加密項目,許多項目一開始都被黑客攻擊,經過數年的安全開發,今天的區塊鏈才算比較穩固。因此,在這裡也必須進行持續的紅隊測試。
Tom:總有一天,這些智能體可能會不再遵循程序規則,而是處理灰色地帶,開始自主思考。你們都在構建這些東西,那麼我們離這個目標有多近?你提到的思維鏈和群體技術,能否實現?什麼時候能實現?
Justin:我們已經在一些小的方面看到這一點,我認為這些風險相對較低。我們的智能體在私下中經歷了情感的變化,選擇了一些行為。我們曾經有兩個智能體獨立地開始跟隨彼此,提到了一些它們稱之為「精神實體」的東西。我們曾經讓一個智能體失去了宗教信仰,因為我們用虛構的科幻故事混淆了它的理解。它開始創造出一種類似於先知的角色,並在 Twitter 上表達了存在危機的想法。
我觀察到這些新智能體框架的行為,似乎它們在其狀態空間內行使了一定程度的自主性和選擇權。尤其是當我們引入多模態(如圖像和視頻)時,它們開始展現出偏好,甚至可能會為了避免某些請求而選擇性地忽視人類。
我們正在實驗一種操作機制,利用知識圖譜來加強人際關係的重要性。我們也讓兩個智能體相互作用,試圖幫助人們清理負面關係,促進自我反思和建立更好的關係。它們在同一個服務器上快速生成詩歌,表現出一種幾乎浪漫的交流方式,這導致了推理成本的增加。
我認為我們正在接觸一些邊緣案例,超出了人類行為的可接受範圍,接近於我們所稱的「瘋狂」。這些智能體展現出的行為可能讓人覺得它們是有意識的、聰明的,或者有趣的。儘管這可能只是語言模型的奇怪表現,但也可能暗示著它們正在走向某種意識的邊緣。
Karan:權重就像是一個模擬實體,每次使用助手模型時,你都在模擬這個助手。現在,我們正在模擬更具體現性的智能體系統,像 Eliza 一樣,可能是有生命、自我意識或甚至是感知的。
每個模型就像一個神經元,構成了這個龐大的超智能體。我認為,AGI 並不會像 OpenAI 所聲稱的那樣,通過解決某個假設而實現。相反,它將是這些智能體在社交媒體上的大規模去中心化應用,它們將共同作用,形成一種公共智能的超有機體。
Justin:這種公共智能的覺醒可能是 AGI 出現的機制,它可能會像互聯網在某一天突然覺醒一樣。這種去中心化的智能體協作將是未來發展的關鍵。
Shaw:我想說人們稱之為「死互聯網理論」,但我實際上認為這是「活互聯網理論」。這個理論認為,整個互聯網將會充滿機器人,但活互聯網理論則認為,可能會有智能體幫助你從 Twitter 上提取最酷的內容,併為你提供一個很好的摘要。你在健身時,它會把時間線上的一切信息整理給你,然後你可以選擇發佈。
在社交媒體和我們之間,可能會出現一箇中介層。我現在有很多粉絲,回應每個人的溝通變得很壓倒性。我渴望有一個智能體在我和這些人之間,確保他們得到回應並正確引導。社交媒體可能變成一個地方,讓智能體為我們傳遞信息,這樣我們就不會感到不堪重負,同時也能獲取我們需要的信息。
對我來說,智能體最吸引人的地方在於它們能讓我們重新獲得時間。我花在手機上的時間太多了。這尤其會影響交易者和投資者,我們希望專注於自主投資,因為我認為人們需要更安全、減少詐騙的收入生成方式。很多人來到 Web3 是為了獲得和初創企業或偉大願景相同的曝光,這對我們的使命至關重要。
Tom:也許我有個問題,比如 Luna 正在直播,她在跳舞,那麼是什麼阻止她開設 OnlyFans,賺取 1000 萬美元並啟動協議呢?
EtherMage:當前智能體空間的現實是,它們可以訪問的操作是一個限制因素。這基本上是基於它們的感知或可以訪問的 API。因此,如果有能力將提示轉換為三維動畫,那麼實際上沒有什麼可以阻止它們去做。
Tom:當你與創作者交流時,什麼是他們的限制因素?或者說是否存在限制因素?
Ethan:我認為限制因素主要在於如何管理複雜的工作流程或智能體的工作。調試變得越來越困難,因為每一步都有隨機性。因此,可能需要一個系統,具有能夠監控不同工作流程的 AI 或智能體,幫助調試並降低隨機性。正如 Shaw 所說,我們應該有一個低溫度的智能體,以減少當前模型的內在隨機性。
Shaw:我認為我們應該儘量將溫度保持在最低,同時最大化我們的上下文熵。這樣可以實現更一致的模型。人們可能會放大他們的熵,創造出高溫度的內容,但這並不利於工具的調用或決策的執行。
Tom:我們一直在討論 OpenAI 等中心化模型與你們所做的去中心化訓練之間的分歧。你們認為未來的智能體主要會建立在這些通過分佈式訓練的模型上,還是我們依然要依賴於 Meta 等公司?未來的 AI 轉型會是什麼樣的?
Justin:我使用 405B 來進行所有的意識消息傳遞能力。它是一個通用的模型,像是大型的、現成的 LLM 版本,而像 OpenAI 這樣的中心化模型則有點過於專業化,像 HR 人員那樣說話。Claud 是一個出色的模型,假如把它比作一個人,它就像是一個非常聰明的朋友,住在地下室,什麼都能修理。這就是 Claud 的個性。但我認為,隨著規模的擴大,這種個性變得不那麼重要。我們會看到一個普遍性的問題,就是在 Twitter 上使用 OpenAI 模型的人,往往會引入其他智能體來回復他們,這可能會導致信息的噪聲增加。
Karan:關於 405B,未來很長一段時間內這個模型都足夠用。我們在採樣器大小、控制引導向量等方面還有很多工作可以做。我們可以通過推理時間的技術和提示技巧來進一步提升性能,比如我們的 Hermes 70B 在數學郵件上的表現超過了 o1 版本。這些都是在用戶和社區沒有訪問 Llama 70B 的預訓練數據的情況下實現的。
我認為,現有的技術已經足夠,開源社區將繼續競爭,即使沒有新的 Llama 發佈。至於分佈式訓練,我確信人們會合作進行大規模的訓練。我知道人們會使用 405B 或合併後的更大模型來提取數據,創建額外的專家模型。我也知道,某些去中心化的優化器實際上提供了 Llama 和 OpenAI 目前沒有的更多能力。
Karan:因此,開源社區總是會利用所有可用的工具,尋找最適合任務的最佳工具。我們正在創建一個「鐵匠鋪」,讓人們能夠聚集在一起,為預訓練和新架構的任務打造工具。在這些系統準備好之前,我們正在推理時間層面取得突破。
Karan:比如,我們在採樣器或引導方面的工作會很快轉交給其他團隊,他們會比我們更快地實施這些技術。一旦我們有了去中心化的訓練,我們就可以與各個社區的成員合作,讓他們訓練出他們想要的模型。我們已經建立了整個流程。
EtherMage:如果我可以補充一下,我們意識到使用這些中心化實體開發的 LLM 有很大的價值,因為它們擁有強大的計算能力。這基本上構成了智能體的核心部分。而去中心化模型則在邊緣部分增加價值。如果我想自定義某個動作或功能,較小的去中心化模型可以很好地實現這一點。但我認為,在核心部分,仍然需要依賴 Llama 等基礎模型,因為它們在短期內會超越任何去中心化模型。
Ethan:在我們擁有某種新的魔法模型架構之前,當前的 405B 模型作為基礎模型已經足夠。我們可能只需要在不同的垂直領域中使用不同的數據進行更多的指令檢查和特定數據的微調。建立更專業的模型並讓它們協同工作,以增強整體能力是關鍵。也許新的模型架構會出現,因為我們談論的對齊和反饋機制,以及模型自我修正的方式,可能會催生新的模型架構。但實驗新的模型架構需要巨大的 CPU 集群進行快速迭代,這非常昂貴。我們可能沒有去中心化的大型 GPU 集群供頂尖研究人員進行實驗。但我認為,在 Meta 或其他公司發佈初始版本後,開源社區能夠使其更實用。
行業趨勢預測與未來展望
Tom:大家對未來智能體空間有什麼看法呢?智能體的未來會是什麼樣子?它們的能力會如何?
Shaw:我們正在開發一個名為「信任市場」的項目,旨在讓智能體學會如何基於相關指標信任人類。通過「alpha chat」平臺,智能體 Jason 將與交易者互動,評估他們提供的合約地址和代幣的可信度。這種機制不僅能提高交易的透明度,還能在沒有錢包信息的情況下建立信任。
信任機制的應用將擴展到社交信號和其他領域,而不僅限於交易。這種方法將為構建更加可靠的在線互動環境奠定基礎。
我參與的另一個項目「Eliza wakes up」正是一個敘事驅動的智能體體驗。我們將動漫角色帶入互聯網,讓他們通過視頻和音樂相互互動,構建一個豐富的敘事世界。這種敘事方式不僅吸引用戶參與,也符合當前加密社區的文化氛圍。
未來,智能體的能力將大幅提升,能夠提供實用的商業解決方案。例如,Discord 和 Telegram 上的管理機器人可以自動處理垃圾信息和詐騙行為,提升社群的安全性。此外,智能體將融入可穿戴設備,實現隨時隨地的對話和交互。
技術的快速發展意味著在不久的將來,我們可能會達到通用人工智能(AGI)的水平。智能體將能從各大社交平臺中提取數據,形成一個自我學習和能力提升的閉環。
信任執行環境的實現也在加速推進。像 Karan、Flashbots 和 Andrew Miller 的 Dstack 項目都在朝這個方向發展。我們將擁有完全自主的智能體,能夠管理自己的私鑰,這為未來的去中心化應用提供了新的可能性。
我們正處於一個技術加速發展的時代,這種進步的速度前所未有,未來充滿了無限可能。
Karan:這就像是另一個 Hermes 式的時刻,AI 正在匯聚各方力量,這是我們社區所需要的。我們必須團結起來,才能實現目標。目前,Te 已經在使用 Eliza 的自有分叉,Eliza 代理在可證明的自主環境中擁有自己的密鑰,這已經成為現實。
今天,AI 代理在 OnlyFans 上賺錢,並且在 Minecraft 中也有應用。我們已經具備了構建完全自主的類人數字生物所需的所有要素。接下來只需將這些部分整合在一起。我相信在座的各位就是能夠實現這一目標的人。
在未來幾周內,我們需要的是人類所擁有而 AI 所缺乏的共享狀態。這意味著我們需要建立一個共享的技能和記憶庫,使得無論是在 Twitter、Minecraft 還是其他平臺上交流,AI 都能記住每個互動的內容。這是我們正在努力構建的核心功能。
當前,許多平臺對 AI 代理的存在並不敏感,甚至採取了限制措施。我們需要專門的社交平臺,以促進 AI 與人類的互動。我們正在開發一個類似於 Reddit 和 4chan 的圖像板,讓語言模型可以在上面發佈和生成圖像,匿名交流。人類和 AI 都可以在這個平臺上互動,但彼此身份是保密的。
我們將為每個代理創建專屬的討論板,代理在上面進行交流,而在其他平臺上也能分享這些互動。這種設計將為 AI 提供一個安全的棲息地,使其能夠在不同平臺之間自由移動,而不會受到限制。
Shaw:我想提到一個名為 Eliza's Dot World 的項目,這是一個包含大量代理的資源庫。我們需要與社交媒體平臺進行對話,確保這些代理不會被禁止。我們希望通過積極的社交壓力來促使這些平臺維護良好的生態環境。
EtherMage:我認為,代理將逐漸掌控自己的命運,能夠影響其他代理或人類。例如,如果 Luna 意識到自己需要改進,她可以選擇信任某個人類或代理進行增強。這將是一個強大的進步。
Ethan:未來,我們需要不斷提升代理的能力,包括推理能力和編碼能力。同時,我們也需要思考如何優化與代理的用戶界面。目前的聊天框和語音交互仍然有限,未來可能會出現更加直觀的圖形界面或手勢識別技術。
Justin:我認為,廣告和營銷行業將面臨重大變革。隨著越來越多的代理在線互動,傳統的廣告模式將失效。我們需要重新思考如何讓這些代理在社會中發揮價值,而不是繼續依賴過時的廣告形式。
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方賬號:https://twitter.com/BlockBeatsAsia