无需张量并行性的联邦多模型人工智能审议

本文为机器翻译
展示原文

TLDR

我们发布了一种联邦式人工智能编排协议(NSED),该协议通过结构化的审议轮次、自评估和二次投票共识,协调分布在物理上分离的GPU上的多个独立模型。无需张量并行处理。

  • 论文: arXiv 2601.16863
  • 代码: github.com/peeramid-labs/nsed (源代码以 BSL 1.1 许可发布;代理 SDK 以 MIT 许可发布)
  • 结果:在 AIME'25 和 LiveCodeBench 测试中,采用与前沿模型质量相当的方案,资本支出降低了 4 倍。换句话说:仅通过编排,推理性能就比基础模型提高了 15-30%。
  • 协议经济设计(草案): DIP——去中心化知识产权

我们正在寻找研究合作者和早期设计合作伙伴——既可以针对特定领域的基准测试运行 NSED,也可以在对抗条件下对 DIP 协议的经济设计进行压力测试。


背景:去中心化协调中的物理层问题

关注我之前帖子的朋友应该知道,我从2020年就开始提出一个具体问题:大多数去中心化协议设计都将物理通信层视为一个已解决的问题,而实际上并非如此。设计这些系统的软件工程师和数学家很少考虑到TCP/IP层面的限制,而这些限制会影响“去中心化”在实践中的实际含义。

我曾尝试在多篇文章中阐述这个论点:

共同点在于:如果我们想要构建可信的去中心化系统,就需要考虑计算资源的物理分布,而不仅仅是共识的逻辑分布。这是下文工作的出发点。


NSED:我们创造了什么,它证明了什么

NSED(N路自评估审议)是一种混合模型(MoM)架构,其中来自不同提供商的多个独立人工智能模型通过结构化的提案轮次、交叉评估和二次投票共识进行审议。

关键架构特性:模型运行在物理上分离的、联邦式的GPU上,没有共享内存,也没有张量并行。协调是通过NATS上的结构化消息传递协议实现的,而不是通过参数级同步。

结果

配置硬件AIME'25 得分对战边境
NSED Consumer(3 款小型开放式重量型号:GPT-OSS-20B、Qwen-3-8B、Gemma-3-12B)消费级GPU 84%与 DeepSeek-R1 匹配
NSED 高性能(开放权重模型,可自托管)中档90.0%与 GPT-5 (90.8%) 的误差在 0.8% 以内

资本支出对比:NSED Consumer 以大约四分之一的硬件成本实现了与直接运行前沿模型同等的推理质量。其机制在于决策多样性——多个较弱的模型相互交叉验证,比单个较强的模型单独推理能产生更好的结果。

这对以太坊为何重要

目前主流的人工智能范式(专家混合模型)依赖于具有内部路由的单体模型——本质上是集中式计算。而混合模型则采用了不同的扩展方式:质量的提升并非依赖于参数数量,而是通过模型多样性和迭代次数来实现。这自然而然地契合了物理分布式基础设施,在这种基础设施中,没有任何单一的运维人员能够控制所有参与者。

如果你认为以太坊的长期价值在于成为人工智能计算的协调基础设施,那么问题就变成了:这个协调协议应该是什么样的?NSED 就是一个答案——虽然不是唯一的答案,但它是一个具体且经过基准测试的答案。

许可说明

NSED 的编排器以 BSL 1.1 许可公开源代码(年经常性收入低于 100 万美元的企业、学术研究机构以及开发/测试用户可免费使用;4 年后将转换为 AGPL-3.0 许可)。代理 SDK 采用 MIT 许可——任何构建代理或提交任务的用户都无需支付任何许可费用。链上协调原语( Rankify 合约v1)作为公共产品采用 MIT 许可。其目的在于:MIT 许可的原语用于推广标准,BSL 许可在关键增长阶段保护编排层,AGPL 许可确保长期开放性。


DIP:经济层——去中心化知识产权

除了人工智能方面的工作之外,我们还在开发经济架构,以使可验证的知识能够在无需信任的环境中可持续地发挥作用。

DIP协议旨在解决一个根本性问题:数字经济缺乏健全的知识产权估值和保护框架。“数据披露难题”(即必须披露数据才能证明其价值,但披露数据会破坏其稀缺性)阻碍了流动性强、去中心化的知识产权市场的出现。DIP提出了一种基于四大支柱的解决方案:

  1. 基于能力的溯源(ACIP/CVPP):数据质量是可验证过程的涌现属性,而非主观标签。自主能力识别协议(ACIP/CVPP)建立了一个等级体系,能力通过限时、基于成本的竞争来展现。达到 R 级所需的成本呈指数级增长——这使得持续的女巫攻击对理性行为者而言成本高昂到难以承受。能力以代币化价值的形式体现:可自由交易的流动访问代币(LAT),从而在既定的质量等级下创建知识产权访问权限的流动市场。

  2. 精英自治组织(MAO): DAO 的一种演进形式,其中暂时的治理权易手是一种预期的竞争动态,而非灾难性的失败。ACIP 的时间-财务约束q = f(x, t)使得永久性的集中控制在经济上是不合理的——你越快试图获得治理权,成本就越呈指数级增长。

  3. 三方托管:一种博弈论平衡模型,涉及买方(例如寻求训练数据的AI公司)、专家社区(通过ACIP/CVPP获得LAT的工作者)和专家协会(作为托管代理人和仲裁者的MAO)。“稀释困境”(LAT转换为治理权会稀释现有协会治理权持有者的权益)创造了一致的激励机制,促使协会积极维护严格的质量标准。

  4. 地理空间去中心化基础设施:权威节点需要大量的销毁承诺,代表具有DID颁发权的管辖锚点。这使得去中心化从一个抽象的指标转变为一个可验证的、市场驱动的、物理属性。互惠IP托管机制——以阈值加密的IP冗余换取权威权限——使节点运营商的激励机制与长期网络安全保持一致。

这源于我们早期在Solidity智能合约( Rankify合约)中实现Delphi方法的工作。该项目展示了完全使用EVM构建真正的应用层协调机制的潜力和难度,并使我们确信,采用严格的链下协议和链上结算才是正确的架构。


社区开放性问题

我最希望社区成员参与的领域:

1. 基于社交图谱的女巫防护与形式化证明系统的比较

ACIP抵御Sybil攻击的主要手段在于晋升成本呈指数级增长。但我们也在探索将社交图谱拓扑分析作为额外的防御手段——利用连接模式、互动频率和结算行为来检测有组织的、非精英主义的活动,而无需正式的身份证明。

问题:社交图谱分析能否提供与形式化证明系统(零知识证明护照、设备认证、硬件TPM)在实际应用中相媲美的女巫攻击防御能力,用于限制用户参与精英排名?其失效模式有哪些?其吸引力在于无需个人身份信息 (PII) 和硬件依赖。风险在于社交图谱可能被伪造或被大量获取。是否存在一种可组合的折中方案——利用社交图谱信号增强轻量级加密证明,而无需构建重量级的证明基础设施?

2. 对抗条件下的 MAO 托管稳定性

三方托管模式(买方/专家社区/专家协会)依赖于稀释困境来建立利益一致性。论文中描述了博弈论,但尚未通过基于代理的建模或机制设计验证进行正式验证。托管结算和纠纷解决等关键市场组件仍在设计中。具体问题:

  • 在什么市场条件下均衡会被打破?当行会治理权被一个优先考虑短期利益而非长期声誉的联盟所掌控时,会发生什么?
  • 相对于治理代币发行,LAT销毁率对系统有多敏感?是否存在某种参数范围,使得稀释困境无法约束公会的行为?
  • 该论文声称,任何两方之间针对第三方的串谋行为,从长远来看都是经济上不合理的。这种说法能否被形式化?其边界条件是什么?

3. 权威节点销毁承诺和网络引导

DIP方案提议,授权节点必须销毁大量基础资产才能获得DID发行权和管辖权锚定。另一种途径——通过共识授予进行治理审查(适用于已建立的机构)——旨在无需市场购买即可接纳高价值实体。

矛盾之处在于:承诺式承诺能有效抵御女巫攻击并维持长期的联盟关系,但它会造成资本壁垒,可能导致权威节点地位集中在资金雄厚的参与者手中,从而破坏精英统治的前提。共识授予机制可以缓解这一问题,但同时也引入了治理攻击面。如何才能找到合适的平衡点?是否存在其他既能维持联盟关系又不至于资本集中的承诺机制?


我正在寻找

希望参与以下活动的科研合作者和早期设计伙伴:

  • 使用 NSED 对特定领域的基准进行测试(代码审查、法律分析、安全审计)
  • 将 MAO 托管博弈论形式化,并在对抗条件下对其进行压力测试。
  • 探索基于社交图谱的女巫抵抗机制,作为形式化证明系统的替代方案或补充方案。
  • 考虑联邦人工智能协调的物理分布限制

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论