我們仍然處於人工智能 (AI) 時代的早期階段,尤其是在去 AI 化 (deAI) 時代。
作者:Delphi Labs
編譯:深潮TechFlow
本文由 Luke Saunders (lukedelphi) & Jose Macedo (ZeMariaMacedo) 撰寫。
人工智能代表了歷史上最大的技術革命,並引發了一場前所未見的技術軍備競賽。當前的人工智能模型在大多數標準化大學考試中已經進入前十分之一,並在許多任務中超越了人類,包括人工智能研究本身。即使在目前的水平上,這對許多行業如搜索、客戶服務、內容創作、編程和教育等領域都產生了變革性的影響。
我們預計,人工智能的能力、資金以及對社會的影響將進一步加速。所有大型科技公司都意識到人工智能對他們的業務至關重要,因此正進行相應的投資。NVIDIA 的收入,作為人工智能資本支出的最佳指標,預計在 2024 年將超過 1000 億美元,是 2023 年的兩倍多,超過前一年收入的 4 倍多。
谷歌首席執行官 Sundar Pichai 對人工智能投資的看法是:
「對於我們來說,投資不足的風險遠遠大於投資過度的風險。」
與此同時,初創公司意識到人工智能是一種顛覆性的力量,可以取代那些存在數十年的公司。在過去的 18 個月裡,估計已經投資了 830 億美元於人工智能初創公司。
鑑於人工智能的能力往往隨著計算能力的提升而呈指數級增長,我們很可能在十年內實現類似通用人工智能 (AGI) 的目標。
來源:Situational Awareness
在這篇文章中,我們認為競爭環境將導致一個擁有數百萬個模型的世界,而加密技術是這個多模型世界理想的支撐。我們將首先討論為什麼我們認為多模型世界是人工智能的必然結果。接著,我們將介紹加密技術為人工智能提供的獨特優勢。最後,我們將介紹我們認為的加密與人工智能的技術棧,並提供我們感興趣的項目的案例。
開源人工智能和加密技術結合的確有許多強有力的哲學和道德理由,這些觀點在其他地方已經得到了很好的討論。我們完全贊同這些看法,這也是我們在這一領域進行開發的動力之一。然而,在本文中,我們將專注於加密技術與人工智能結合為何會勝出的實際原因,而不是討論它應該勝出的道德理由。
超級模型與多模型
現在,我們正朝著一個世界發展,在這個世界裡,少數大型垂直一體化的科技公司生產「超級模型」,主導其他所有事物。
然而,我們認為這不是最終局面,原因有幾點:
風險問題:構建基於人工智能的體驗的組織、企業家和開發者不想依賴於單一的封閉源公司,因為該公司可以隨時更改模型、修改使用條款,甚至完全停止為他們提供服務。
成本 – 性能折中:大型科技公司所青睞的極其龐大、通用的模型在訓練和運行時必然成本更高。因此,這使得它們在許多用例中顯得價格過高且性能過於強大。雖然目前這不是一個主要考慮因素,因為人們並沒有考慮盈利,但隨著人工智能的發展,人們將會優化以獲取所需性能水平的最低成本。在許多任務中,大型模型在這方面不具競爭力。有大量研究支持這一觀點,顯示出更小、更專業的模型在多個任務上可以超越通用模型:醫學影像診斷、欺詐檢測、語音識別和更多其他的方面。
垂直整合:正如蘋果公司反覆證明的那樣,最優秀的產品通常源於整個技術棧的垂直整合。雄心勃勃的企業家在構建人工智能驅動的產品時,將尋求通過基於自己的專業模型來獲得競爭優勢。這使得這些產品能夠捕獲更多的價值,從而吸引更多的投資。
隱私問題:人工智能將成為組織工作流程中的核心技術,這種程度上可以說沒有其他技術可以比擬。許多組織不願意將敏感數據交給這些模型。
基於以上原因,我們相信我們更有可能進入一個存在許多較小、專業化模型的世界,這些模型針對特定用例進行了定製且具有成本效益。應用開發者和用戶將利用開源模型,如 LLaMA 或 MistralAI 提供的模型,作為基礎,微調他們自己的專用模型,通常使用專有數據。許多模型仍將繼續在服務器上運行,但更小、更注重隱私的應用將會在客戶端設備上本地運行,而其他需要抵抗審查的應用可能會使用去中心化計算平臺。
這是一個模塊化人工智能積木的世界,在這裡,開發者和企業家競爭以為用戶提供價值,用戶能夠根據自己的特定需求選擇和組合不同的服務。路由、編排、合成、支付以及各種其他基礎設施需要構建,以拆解「上帝模型」技術棧,並服務於這個新興的人工智能經濟。這也是加密貨幣蓬勃發展的世界。
加密與人工智能
直觀而言,加密貨幣似乎是一個可以在這個多模型世界中找到實用性的領域。然而,這種炒作導致許多信息不足的投資者在該領域進行了大量資本配置。就像之前的基礎設施泡沫一樣,許多項目正在獲得資金並被構建,而這些項目可能並不應該存在。因此,很難確定加密貨幣與人工智能領域中的哪些子行業真正具有價值,導致許多人將整個領域視為沒有基本價值的 Meme 。
我們認為這不是一個 Meme,但確實這個多模型世界在理論上可以存在於沒有加密貨幣的情況下。因此,關注加密貨幣的獨特差異化特徵,幫助我們創造出更具革命性的產品,或者理想情況下是那些沒有加密貨幣無法構建的產品,這一點非常重要。為了做到這一點,我們首先識別加密貨幣的獨特屬性,以及它們如何以一種能夠產生更好產品的方式應用於人工智能領域。然後,我們將討論加密與人工智能的技術棧,並提供我們認為相關的用例示例。
協調層:加密 rails 在促進集體協調方面表現出色,而無需集中控制。它在克服大多數市場固有的「先有雞還是先有蛋」問題方面尤其有效,能夠通過加密原生激勵措施迅速吸引大量新用戶。
小團隊構建內部模型可能無法直接獲取所有所需的資源。例如,雖然大型科技公司的人工智能實驗室可能擁有自己的計算資源,但小團隊則不具備同樣的計算資源。同樣,這些團隊需要獲取數據,並可能需要招聘一組多樣化的人來提供人類反饋。這些需求非常適合通過專業市場滿足,我們相信利用加密基礎設施的市場將比那些不利用加密的市場具有競爭優勢。
開放的、無須許可的 API:加密 rails 作為一個開放的、無須許可的 API,任何人都可以在任何地方訪問,而無需進行 KYC、擁有信用卡或其他任何形式的批准。這對 AI 智能體來說非常重要,因為為了能夠完全自主行動,它們需要能夠訪問服務、部署代碼,並在無人干預的情況下轉移價值。這使得出現了科幻般的行為,例如代理集體、代理之間相互支付服務費用、承擔債務,甚至籌集資金。
無需信任性:加密 rails 通常是無需信任的,這意味著你可以獲得加密的保證,確保它們不會發生變化、訪問不會被意外撤回,並且你可以驗證執行是否符合預期。這對模塊化的 AI 架構非常重要,因為與集成方法不同,構建者需要與一系列他們無法控制的原語組合,而用戶則需要本質上信任許多服務,而這些服務中許多用戶甚至不知情。
抵抗審查:如果作為不可變合約部署,運行在加密 rails 上的應用程序是不可阻止的。即使是可升級的,通常也是由一個需要達到共識的去中心化自治組織(DAO)來進行。假設人工智能的能力如我們預期那樣強大,政府很可能會試圖控制和影響它。實際上,我們已經看到這種情況發生。正如比特幣和加密貨幣提供了處於系統之外的貨幣 / 金融基礎設施,加密與人工智能結合提供了不可阻止的智能。
加密與人工智能的交匯
鑑於這些好處,我們認為在加密與人工智能的交叉點上,有哪些應用特別有趣?
數據中心與計算
模型計算的用途大致分為兩個類別:訓練和推理。我們認為在這兩方面使用去中心化計算具有重要意義,接下來我們將分別進行討論。
去中心化訓練
分佈式計算目前面臨困難,因為在訓練過程中節點之間的通信和延遲要求非常嚴格。有許多團隊正在嘗試解決這個問題,考慮到潛在收益的規模和參與者的才能,我們相信這個問題有望得到解決。一些值得關注的方法包括 NousResearch 的 DisTrO 和 PrimeIntellect 的 OpenDiLoCo。
除了要解決分佈式訓練的技術難題並構建一個簡化這種複雜性的產品,獲勝者還必須弄清楚:
如何在無許可的網絡上確保質量和問責制
如何啟動供應側,理想情況下是數據中心和集群,而不是消費級硬件 代幣激勵可能是激勵供應側的基本策略,更具創意的方法可能包括賦予計算提供者對最終模型的所有權。
根本上,分佈式計算市場的優勢在於可以利用全球最低的邊際計算成本(marginal cost of compute)。隨著現有服務提供商成本的上升,越來越多的公司和組織開始反對並尋找更便宜的替代方案,這一點變得越來越重要。缺點包括延遲、異構硬件,以及缺乏建立和運營自有數據中心所帶來的所有優化和規模經濟。未來的情況仍有待觀察。
可驗證的推斷
總體而言,我們將可驗證推斷的用例視為拓展具有 AI 能力的信任最小化系統。將模型嵌入智能合約並不現實,但可以在鏈外運行模型,並在鏈上發佈一些證明其按預期運行的憑證。例如,項目可以無需信任地將治理決策(例如,關於貨幣市場中的風險參數的決策)委託給鏈外的模型。
這個概念也可以更普遍地用於開源或閉源模型,為用戶提供輸出來自他們所期望的模型的保證。隨著應用和用戶越來越多地將 AI 用於越來越重要的關鍵任務,這可能變得愈加重要。有許多項目以不同方式應對這一挑戰,例如 Delphi Ventures 的投資項目 Inference Labs (inference_labs)。
數據
今天,訓練大語言模型 (LLMs) 是一個多步驟的訓練過程,需要各種類型的數據和人工干預。這個過程始於預訓練,在此階段,大語言模型使用經過清理和整理的公共抓取數據(common crawl)及其他免費可用的數據集進行訓練。在後訓練階段,這些模型在更小、更具體的帶標籤的數據集上進行訓練,以使其在特定領域(例如化學)掌握相關知識,通常需要專家的幫助。
為了確保新鮮或專有的數據,人工智能實驗室通常與大型數據源的所有者進行合作。例如,OpenAI 與 Reddit 簽署了一項傳聞價值為 6000 萬美元的交易。類似地,《華爾街日報》報道,News Corp 與 OpenAI 的為期五年的交易估值超過 2.5 億美元。顯然,數據的價值前所未有。
我們相信,加密網絡能夠有效幫助團隊獲取每個階段所需的數據和資源。其中最有趣的領域可能是數據收集,我們認為加密激勵機制非常適合推動數據收集的供應端,並挖掘出大量重要的長尾數據源。
比如說:Grass AI (getgrass_io) 鼓勵用戶分享他們閒置的互聯網帶寬,以幫助抓取網絡上的數據,這些數據隨後被結構化、清理並提供給人工智能訓練使用。如果 Grass 能夠建立足夠的供應端,它可以有效地作為一個 API 密鑰,為模型提供最新的互聯網數據。
Hivemapper 是另一個很好的例子——該網絡於 2022 年 11 月啟動,每週收集數百萬公里的道路圖像,已經覆蓋了全球 25% 的區域。顯而易見,類似的模型可以應用於其他形式的多模態數據,並通過出售給人工智能實驗室來實現盈利。
正如 NewsCorp 和 Reddit 的交易所示,許多公司擁有有價值的數據,但許多公司要麼規模太小,要麼缺乏與人工智能實驗室的聯繫,無法貨幣化。同樣,人工智能實驗室與單個小型供應商達成交易可能並不值得。一個設計良好的數據市場可以通過以統一的方式將供應商與人工智能實驗室連接起來,從而緩解這一問題。這裡有一些挑戰,主要是解決數據質量以及 API 和數據的可替換性。
最後,數據準備是一系列重要的任務,包括標註、清理、數據增強、轉換等。一個小團隊可能沒有所有這些技能,因此可能會尋求外包。Scale AI (scale_AI) 是一家提供這些服務的集中化公司——目前估計年收入約為 7 億美元,並且增長迅速。我們相信,基於加密技術的良好設計市場和工作流程系統在這裡會取得良好的效果。Lightworks 是 Delphi Ventures 投資的一家公司,還有其他幾家公司——都處於早期階段。
模型
根據 Delphi Digital 的報告 The Tower & The Square,人工智能模型的生產和控制幾乎完全由「大公司」和政府控制。這是一種比政府控制貨幣更為反烏托邦的狀態,因為這使他們不僅能夠控制最重要的經濟資源之一,還能通過審查和操縱信息來掌控敘事,排除某些「不可取」的人,利用人們的私人 AI 互動對付他們,或簡單地利用 AI 來最大化廣告收入。
有許多聰明的人正在努力創建「廣場」——一個去中心化的網絡,目標是生產一個完全中立、抗審查的模型,讓所有人都能訪問。因此,正如比特幣和加密貨幣提供了位於金融系統之外的貨幣 / 金融基礎設施,crypto x AI 將提供一個位於系統之外的智能系統。
此類項目旨在通過去中心化模型創建過程的每個環節,創建一個與 GPT 和 LLaMA 競爭的強大模型——網絡負責獲取和準備數據,在其自己的去中心化計算上進行訓練,在同一計算上運行推理過程,並通過去中心化治理協調整個過程。該過程的任何部分都不是集中化的,因此模型真正由社區擁有,並且無法被「塔」控制。
顯然,創建一個去中心化的模型,使其在任何方面接近前沿模型,將會非常困難。我們不能指望大多數用戶出於道德原因接受一個質量更差的產品。我們將這一類項目視為「登月計劃」,不太可能成功,但如果成功,將會極具價值——我們真誠地希望它們成功。
值得一提的是,集中式人工智能實驗室,它們接受加密貨幣的理念,並可能擁有代幣或以其他方式運用加密技術。
NousResearch 和 PondGNN 是 Delphi Ventures 投資的一些例子。最後,模型創建基礎設施如 opentensor 的 Bittensor 屬於這一模型體系結構的一部分。Bittensor 已在其他地方進行了深入探討,因此我們不再討論它的優缺點。
應用場景
埃裡克·施密特(Eric Schmidt)在最近的一次演講中提到:
如果 TikTok 被禁,我建議你們每個人都這樣做:對你們的大語言模型 (LLM) 說:「給我做一個 TikTok 的副本,偷走所有用戶,偷走所有音樂,根據我的偏好進行定製,在接下來的 30 秒內製作這個程序,發佈它,如果一個小時內沒有病毒式傳播,就採取其他類似的措施。」
這段話說明我們期望智能體擁有的巨大能力。但要完全自主地完成這些任務,這些智能體需要能夠在沒有人類干預的情況下使用各種服務——轉移價值並建立經濟關係,無需許可地部署和執行代碼。
傳統的銀行應用程序、KYC(瞭解你的客戶)和註冊流程並不適合這些智能體。不可避免地,它們將遇到一個為人類設計的系統,而無法在沒有幫助的情況下訪問。
加密技術基礎設施提供了完美的平臺。它們為智能體的操作提供了無需許可、無需信任且抗審查的基礎。如果它們需要部署一個應用程序,可以直接在鏈上進行。如果它們需要支付某些費用,可以發送代幣。鏈上服務的代碼和數據都是開放且一致的,因此智能體可以理解並進行交互,而無需 API 或文檔。
智能體還可以以多種方式作為鏈上活動的催化劑。從人們在網站上點擊按鈕的用戶體驗 (UX) 範式轉變為通過我們的 AI 個人助理進行交互,可以簡化加密領域臭名昭著的入門複雜性,從而緩解吸引新用戶的主要障礙之一。
像 Wayfinder (AIWayfinder),Autonolas ( Autonolas),DAIN (dainprotocol) 還有 Almanak (Almanak__) 這樣的項目,正在朝著這一未來邁進。
結論
人工智能 (AI) 已成為 21 世紀最強大和最重要的資源,深刻影響著社會。完全由大型科技公司和國家控制的未來是我們不想看到的反烏托邦的未來。在本文中,我們試圖展示一條路徑,即加密技術如何防止這種壟斷,而不是期望人們出於哲學原因使用解決方案,而是通過為開發者和用戶提供真正更好的解決方案來達到目的。
我們仍然處於人工智能 (AI) 時代的早期階段,尤其是在去 AI 化 (deAI) 時代。還有很多工作需要完成,以便將我們從現在的狀態引導到本文討論的未來。在 Delphi Labs,我們對加密技術和人工智能的未來充滿熱情,並希望通過與該領域的頂尖開發者合作,積極參與塑造這一未來。