無需張量並行性的聯邦多模型人工智能審議

本文為機器翻譯
展示原文

TLDR

我們發佈了一種聯邦式人工智能編排協議(NSED),該協議通過結構化的審議輪次、自評估和二次投票共識,協調分佈在物理上分離的GPU上的多個獨立模型。無需張量並行處理。

  • 論文: arXiv 2601.16863
  • 代碼: github.com/peeramid-labs/nsed (源代碼以 BSL 1.1 許可發佈;代理 SDK 以 MIT 許可發佈)
  • 結果:在 AIME'25 和 LiveCodeBench 測試中,採用與前沿模型質量相當的方案,資本支出降低了 4 倍。換句話說:僅通過編排,推理性能就比基礎模型提高了 15-30%。
  • 協議經濟設計(草案): DIP——去中心化知識產權

我們正在尋找研究合作者和早期設計合作伙伴——既可以針對特定領域的基準測試運行 NSED,也可以在對抗條件下對 DIP 協議的經濟設計進行壓力測試。


背景:去中心化協調中的物理層問題

關注我之前帖子的朋友應該知道,我從2020年就開始提出一個具體問題:大多數去中心化協議設計都將物理通信層視為一個已解決的問題,而實際上並非如此。設計這些系統的軟件工程師和數學家很少考慮到TCP/IP層面的限制,而這些限制會影響“去中心化”在實踐中的實際含義。

我曾嘗試在多篇文章中闡述這個論點:

共同點在於:如果我們想要構建可信的去中心化系統,就需要考慮計算資源的物理分佈,而不僅僅是共識的邏輯分佈。這是下文工作的出發點。


NSED:我們創造了什麼,它證明了什麼

NSED(N路自評估審議)是一種混合模型(MoM)架構,其中來自不同提供商的多個獨立人工智能模型通過結構化的提案輪次、交叉評估和二次投票共識進行審議。

關鍵架構特性:模型運行在物理上分離的、聯邦式的GPU上,沒有共享內存,也沒有張量並行。協調是通過NATS上的結構化消息傳遞協議實現的,而不是通過參數級同步。

結果

配置硬件AIME'25 得分對戰邊境
NSED Consumer(3 款小型開放式重量型號:GPT-OSS-20B、Qwen-3-8B、Gemma-3-12B)消費級GPU 84%與 DeepSeek-R1 匹配
NSED 高性能(開放權重模型,可自託管)中檔90.0%與 GPT-5 (90.8%) 的誤差在 0.8% 以內

資本支出對比:NSED Consumer 以大約四分之一的硬件成本實現了與直接運行前沿模型同等的推理質量。其機制在於決策多樣性——多個較弱的模型相互交叉驗證,比單個較強的模型單獨推理能產生更好的結果。

這對以太坊為何重要

目前主流的人工智能範式(專家混合模型)依賴於具有內部路由的單體模型——本質上是集中式計算。而混合模型則採用了不同的擴展方式:質量的提升並非依賴於參數數量,而是通過模型多樣性和迭代次數來實現。這自然而然地契合了物理分佈式基礎設施,在這種基礎設施中,沒有任何單一的運維人員能夠控制所有參與者。

如果你認為以太坊的長期價值在於成為人工智能計算的協調基礎設施,那麼問題就變成了:這個協調協議應該是什麼樣的?NSED 就是一個答案——雖然不是唯一的答案,但它是一個具體且經過基準測試的答案。

許可說明

NSED 的編排器以 BSL 1.1 許可公開源代碼(年經常性收入低於 100 萬美元的企業、學術研究機構以及開發/測試用戶可免費使用;4 年後將轉換為 AGPL-3.0 許可)。代理 SDK 採用 MIT 許可——任何構建代理或提交任務的用戶都無需支付任何許可費用。鏈上協調原語( Rankify 合約v1)作為公共產品採用 MIT 許可。其目的在於:MIT 許可的原語用於推廣標準,BSL 許可在關鍵增長階段保護編排層,AGPL 許可確保長期開放性。


DIP:經濟層——去中心化知識產權

除了人工智能方面的工作之外,我們還在開發經濟架構,以使可驗證的知識能夠在無需信任的環境中可持續地發揮作用。

DIP協議旨在解決一個根本性問題:數字經濟缺乏健全的知識產權估值和保護框架。“數據披露難題”(即必須披露數據才能證明其價值,但披露數據會破壞其稀缺性)阻礙了流動性強、去中心化的知識產權市場的出現。DIP提出了一種基於四大支柱的解決方案:

  1. 基於能力的溯源(ACIP/CVPP):數據質量是可驗證過程的湧現屬性,而非主觀標籤。自主能力識別協議(ACIP/CVPP)建立了一個等級體系,能力通過限時、基於成本的競爭來展現。達到 R 級所需的成本呈指數級增長——這使得持續的女巫攻擊對理性行為者而言成本高昂到難以承受。能力以代幣化價值的形式體現:可自由交易的流動訪問代幣(LAT),從而在既定的質量等級下創建知識產權訪問權限的流動市場。

  2. 精英自治組織(MAO): DAO 的一種演進形式,其中暫時的治理權易手是一種預期的競爭動態,而非災難性的失敗。ACIP 的時間-財務約束q = f(x, t)使得永久性的集中控制在經濟上是不合理的——你越快試圖獲得治理權,成本就越呈指數級增長。

  3. 三方託管:一種博弈論平衡模型,涉及買方(例如尋求訓練數據的AI公司)、專家社區(通過ACIP/CVPP獲得LAT的工作者)和專家協會(作為託管代理人和仲裁者的MAO)。“稀釋困境”(LAT轉換為治理權會稀釋現有協會治理權持有者的權益)創造了一致的激勵機制,促使協會積極維護嚴格的質量標準。

  4. 地理空間去中心化基礎設施:權威節點需要大量的銷燬承諾,代表具有DID頒發權的管轄錨點。這使得去中心化從一個抽象的指標轉變為一個可驗證的、市場驅動的、物理屬性。互惠IP託管機制——以閾值加密的IP冗餘換取權威權限——使節點運營商的激勵機制與長期網絡安全保持一致。

這源於我們早期在Solidity智能合約( Rankify合約)中實現Delphi方法的工作。該項目展示了完全使用EVM構建真正的應用層協調機制的潛力和難度,並使我們確信,採用嚴格的鏈下協議和鏈上結算才是正確的架構。


社區開放性問題

我最希望社區成員參與的領域:

1. 基於社交圖譜的女巫防護與形式化證明系統的比較

ACIP抵禦Sybil攻擊的主要手段在於晉升成本呈指數級增長。但我們也在探索將社交圖譜拓撲分析作為額外的防禦手段——利用連接模式、互動頻率和結算行為來檢測有組織的、非精英主義的活動,而無需正式的身份證明。

問題:社交圖譜分析能否提供與形式化證明系統(零知識證明護照、設備認證、硬件TPM)在實際應用中相媲美的女巫攻擊防禦能力,用於限制用戶參與精英排名?其失效模式有哪些?其吸引力在於無需個人身份信息 (PII) 和硬件依賴。風險在於社交圖譜可能被偽造或被大量獲取。是否存在一種可組合的折中方案——利用社交圖譜信號增強輕量級加密證明,而無需構建重量級的證明基礎設施?

2. 對抗條件下的 MAO 託管穩定性

三方託管模式(買方/專家社區/專家協會)依賴於稀釋困境來建立利益一致性。論文中描述了博弈論,但尚未通過基於代理的建模或機制設計驗證進行正式驗證。託管結算和糾紛解決等關鍵市場組件仍在設計中。具體問題:

  • 在什麼市場條件下均衡會被打破?當行會治理權被一個優先考慮短期利益而非長期聲譽的聯盟所掌控時,會發生什麼?
  • 相對於治理代幣發行,LAT銷燬率對系統有多敏感?是否存在某種參數範圍,使得稀釋困境無法約束公會的行為?
  • 該論文聲稱,任何兩方之間針對第三方的串謀行為,從長遠來看都是經濟上不合理的。這種說法能否被形式化?其邊界條件是什麼?

3. 權威節點銷燬承諾和網絡引導

DIP方案提議,授權節點必須銷燬大量基礎資產才能獲得DID發行權和管轄權錨定。另一種途徑——通過共識授予進行治理審查(適用於已建立的機構)——旨在無需市場購買即可接納高價值實體。

矛盾之處在於:承諾式承諾能有效抵禦女巫攻擊並維持長期的聯盟關係,但它會造成資本壁壘,可能導致權威節點地位集中在資金雄厚的參與者手中,從而破壞精英統治的前提。共識授予機制可以緩解這一問題,但同時也引入了治理攻擊面。如何才能找到合適的平衡點?是否存在其他既能維持聯盟關係又不至於資本集中的承諾機制?


我正在尋找

希望參與以下活動的科研合作者和早期設計夥伴:

  • 使用 NSED 對特定領域的基準進行測試(代碼審查、法律分析、安全審計)
  • 將 MAO 託管博弈論形式化,並在對抗條件下對其進行壓力測試。
  • 探索基於社交圖譜的女巫抵抗機制,作為形式化證明系統的替代方案或補充方案。
  • 考慮聯邦人工智能協調的物理分佈限制

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論