텐서 병렬 처리 없이 연합형 다중 모델 AI 숙의

이 기사는 기계로 번역되었습니다
원문 표시

요약(TLDR)

우리는 구조화된 숙의 과정을 통해 자체 평가 및 2차 투표 합의 를 거쳐 물리적으로 분리된 GPU에서 여러 독립 모델을 조정하는 연합 AI 오케스트레이션 프로토콜(NSED)을 발표했습니다. 텐서 병렬 처리는 필요하지 않습니다.

  • 논문: arXiv 2601.16863
  • 코드: github.com/peeramid-labs/nsed (소스 코드는 BSL 1.1 라이선스 하에 이용 가능하며, 에이전트 SDK는 MIT 라이선스 하에 제공됩니다.)
  • 결과: AIME'25 및 LiveCodeBench에서 최첨단 모델과 동일한 수준의 CapEx를 4배 절감했습니다. 달리 표현하자면, 오케스트레이션만으로 기본 모델 대비 추론 성능이 15~30% 향상되었습니다.
  • 프로토콜 경제 설계(초안): 하락 — 분산 지적 재산권(IP)

저희는 도메인별 벤치마크에 대해 NSED를 실행하고 적대적 조건에서 하락 프로토콜의 경제적 설계를 스트레스 테스트할 연구 협력자 및 초기 설계 파트너를 찾고 있습니다.


배경: 분산 조정에서의 물리 계층 문제

제 이전 게시글들을 읽어보신 분들은 아시겠지만, 저는 2020년부터 특정 문제점을 제기해 왔습니다. 대부분의 탈중앙화 프로토콜 설계는 물리적 통신 계층을 이미 해결된 문제로 취급하는데, 근본적으로는 그렇지 않다는 것입니다. 이러한 시스템을 설계하는 소프트웨어 엔지니어와 수학자들은 "탈중앙화"가 실제로 무엇을 의미하는지에 대한 TCP/IP 수준의 제약 조건을 거의 고려하지 않습니다.

저는 여러 게시글에 걸쳐 이 주장을 전개하려고 노력했습니다.

공통점은 신뢰할 수 있는 분산 시스템을 구축하려면 합의 의 논리적 분산뿐 아니라 컴퓨팅 자원의 물리적 분산에 대해서도 고려해야 한다는 것입니다. 이것이 아래 연구의 출발점입니다.


NSED: 우리가 구축한 것과 그것이 증명하는 것

NSED(N-Way Self-Evaluating Deliberation)는 여러 제공업체의 독립적인 AI 모델들이 구조화된 제안, 교차 평가 및 2차 투표 합의 과정을 통해 숙의하는 모델 혼합(MoM) 아키텍처입니다.

핵심적인 아키텍처적 특징은 모델들이 물리적으로 분리된 연합형 GPU에서 실행되며, 공유 메모리나 텐서 병렬 처리가 없다는 점입니다. 조정은 파라미터 수준의 동기화가 아닌, NATS를 통한 구조화된 메시지 전달 프로토콜을 통해 이루어집니다.

결과

구성 하드웨어 AIME'25 점수 vs. 프론티어
NSED 소비자용 (소형 개방형 중량 모델 3종: GPT-OSS-20B, Qwen-3-8B, Gemma-3-12B) 소비자용 GPU 84% DeepSeek-R1과 일치합니다.
NSED 고성능(개방형 가중치 모델, 자체 호스팅 가능) 중급 90.0% GPT-5의 0.8% 이내(90.8%)

자본 지출 비교: NSED Consumer는 최첨단 모델을 직접 실행하는 것보다 약 4배 낮은 하드웨어 비용으로 동등한 추론 품질을 달성합니다. 그 비결은 여러 개의 약한 모델이 서로 교차 검증하여 단일 강력한 모델의 추론만으로는 얻을 수 없는 더 나은 결과를 도출하는 숙고 다양성에 있습니다.

이것이 이더리움에 중요한 이유

지배적인 AI 패러다임 (전문가 혼합 모델)은 내부 라우팅 기능을 갖춘 단일 모델, 즉 근본적으로 중앙 집중식 컴퓨팅에 의존합니다. MoM은 다른 확장 방식을 제시합니다. 매개변수 개수가 아닌 모델 다양성과 숙의 과정을 통해 품질을 향상시킵니다. 이는 단일 운영자가 모든 참여자를 제어하지 않는 물리적으로 분산된 인프라에 자연스럽게 적용됩니다.

이더리움의 장기적인 가치에 AI 컴퓨팅을 위한 조정 인프라로서의 역할이 포함된다고 생각한다면, 이제 남은 질문은 "그 조정 프로토콜은 어떤 모습일까?"입니다. NSED는 하나의 해답이며, 유일한 해답은 아니지만 구체적이고 벤치마킹된 대안입니다.

라이선스 참고 사항

NSED의 오케스트레이터는 BSL 1.1 라이선스(연간 반복 매출 100만 달러 미만 기업, 학술 및 연구 용도, 개발/테스트 목적의 무료 사용 가능, 4년 후 AGPL-3.0으로 전환) 하에 소스 코드가 공개되어 있습니다. 에이전트 SDK는 MIT 라이선스이므로 에이전트를 구축하거나 작업을 제출하는 모든 사용자에게 라이선스 관련 제약이 없습니다. 온체인 조정 기본 요소( Rankify 컨트랙트 v1)는 MIT 라이선스로 공개되어 있습니다. 이러한 접근 방식의 목적은 MIT 기본 요소를 통해 표준을 확산하고, BSL은 중요한 성장 단계에서 오케스트레이션 계층을 보호하며, AGPL은 장기적인 개방성을 보장하는 것입니다.


하락: 경제적 계층 — 분산형 지적 재산권(IP)

인공지능 관련 연구와는 별개로, 우리는 무신뢰성 환경에서 검증 가능한 지식 기반 작업이 지속 가능하도록 만드는 경제적 구조를 개발해 왔습니다.

하락 프로토콜은 디지털 경제에 지적 재산권(IP) 평가하고 보호하기 위한 견고한 프레임워크가 부족하다는 근본적인 문제를 해결합니다. "데이터 공개 문제"는 데이터의 가치를 입증하기 위해 데이터를 공개해야 하지만, 공개는 희소성을 없애버린다는 점에서 유동적이고 분산된 지적 재산권 시장의 출현을 가로막아 왔습니다. 하락 네 가지 핵심 요소에 기반한 해결책을 제시합니다.

  1. 능력주의적 출처(ACIP/CVPP): 데이터 품질은 주관적인 평가가 아닌 검증 가능한 프로세스의 결과로 나타나는 속성입니다. 자율 역량 식별 프로토콜(ACIP)은 시간 제한 및 비용 기반 경쟁을 통해 역량을 입증하는 순위 체계를 구축합니다. R 등급 달성 비용은 기하급수적으로 증가하여, 합리적인 행위자에게는 지속적인 시빌 공격이 감당하기 어려울 정도로 비용이 많이 듭니다. 역량은 토큰화된 가치, 즉 자유롭게 거래 가능한 유동적 접근 토큰(LAT)으로 표현되며, 정의된 품질 수준에서 IP 접근 권한에 대한 유동적인 시장을 조성합니다.

  2. 능력주의적 자율 조직(MAO): 일시적인 지배권 장악이 파국적 실패가 아닌 예상되는 경쟁적 역동성으로 여겨지는 분산형 자율 조직(DAO)의 진화형. ACIP의 시간-재정적 제약 조건 q = f(x, t) 는 영구적인 중앙 집중식 통제를 경제적으로 비합리적으로 만든다. 즉, 지배권을 획득하려는 속도가 빠를수록 비용이 기하급수적으로 증가한다.

  3. 3자 에스크로: 구매자(예: 학습 데이터를 찾는 AI 기업), 전문가 커뮤니티(ACIP/CVPP를 통해 LAT를 획득하는 작업자), 전문가 길드(에스크로 대리인 및 중재자 역할을 하는 MAO) 간의 게임 이론적으로 균형 잡힌 모델입니다. "희석 딜레마" - LAT를 거버넌스로 전환하면 기존 길드 거버넌스 보유자의 지분이 희석됩니다 - 는 길드가 엄격한 품질 기준을 유지하도록 동기를 부여하는 조화로운 인센티브를 제공합니다.

  4. 지리적으로 분산된 인프라: 상당한 자금 소진 약정이 필요한 권한 노드는 DID 발급 권한을 가진 관할권의 중심 역할을 합니다. 이는 분산화를 추상적인 지표에서 검증 가능하고 시장 중심적인 물리적 속성으로 전환합니다. 상호 IP 에스크로 메커니즘(임계값 암호화된 IP 이중화에 대한 대가로 권한 부여)은 노드 운영자의 인센티브를 장기적인 네트워크 보안과 일치시킵니다.

이는 이전에 솔리디티 스마트 계약( 랭크파이 계약 )에 델파이 방식을 구현했던 경험에서 비롯되었습니다. 해당 프로젝트는 이더리움 가상 머신(EVM) 만으로 실제 애플리케이션 계층 조정 기능을 구축하는 데 따르는 잠재력과 어려움을 모두 보여주었으며, 온체인 정산을 지원하는 엄격한 오프체인 프로토콜이 올바른 아키텍처라는 확신을 주었습니다.


커뮤니티를 위한 열린 질문

제가 커뮤니티의 의견을 가장 중요하게 생각하는 분야는 다음과 같습니다.

1. 소셜 그래프 기반 시빌 공격 방어 vs. 형식적 증명 시스템

ACIP의 주요 시빌 공격 방어 수단은 계급 승진에 따른 기하급수적인 비용 구조에 있습니다. 하지만 저희는 추가적인 방어 수단으로 소셜 그래프 토폴로지 분석도 연구하고 있습니다. 연결 패턴, 상호 작용 빈도, 정착 행태 등을 활용하여 공식적인 신원 증명 없이도 조직적인 비능력주의적 활동을 탐지하는 것입니다.

핵심 질문은 소셜 그래프 분석이 실력에 기반한 순위 결정 방식에서 참여를 제한하는 데 있어, 형식적 증명 시스템(ZK 패스포트, 장치 인증, 하드웨어 TPM)과 실질적으로 동등한 수준의 시빌 공격 저항력을 제공할 수 있는가 하는 것입니다. 실패 원인은 무엇일까요? 소셜 그래프 분석의 가장 큰 장점은 개인 식별 정보(PII) 노출이 없고 하드웨어 의존성이 없다는 점입니다. 하지만 소셜 그래프는 조작되거나 남용될 가능성이 있습니다. 무거운 증명 인프라 없이도 경량 암호화 증명을 강화할 수 있는 소셜 그래프 신호와 같은, 조합 가능한 중간 지점이 있을까요?

2. 적대적 상황에서의 MAO 에스크로 안정성

구매자/전문가 커뮤니티/전문가 길드 간의 3자 에스크로 모델은 희석 딜레마를 활용하여 유인책을 일치시킵니다. 논문에서는 게임 이론을 설명하지만, 에이전트 기반 모델링이나 메커니즘 설계 검증을 통해 공식적으로 타당성이 입증되지는 않았습니다. 에스크로 결제 및 분쟁 해결과 같은 핵심 시장 구성 요소는 아직 설계 단계에 있습니다. 구체적인 질문은 다음과 같습니다.

  • 어떤 시장 상황에서 균형이 깨지는가? 단기적인 자원 추출을 장기적인 평판보다 우선시하는 연합이 길드 운영권을 장악하면 어떤 일이 발생하는가?
  • 시스템은 거버넌스 토큰 발행량 대비 LAT 소각률에 얼마나 민감합니까? 희석 딜레마가 길드의 행동을 제약하지 못하는 매개변수 영역이 있습니까?
  • 이 논문은 두 당사자가 제3자를 상대로 담합하는 것은 장기적으로 경제적으로 비합리적이라고 주장합니다. 이러한 주장을 공식화할 수 있을까요? 만약 가능하다면, 그 경계 조건은 무엇일까요?

3. 권한 노드 소각 약정 및 네트워크 부트스트래핑

하락 권한 노드가 DID 발행 권한과 관할권 확보를 위해 상당한 양의 기본 자산을 소각해야 한다고 제안합니다. 대안 경로인 기존 기관을 위한 합의 부여를 통한 거버넌스 검증은 시장 구매 없이 고가치 기관을 온보딩하는 것을 목표로 합니다.

문제는 자금 소진 약정이 시빌 공격에 대한 강력한 저항력과 장기적인 협력 관계를 제공하지만, 자본 장벽을 만들어 자금력이 풍부한 주체들에게 권위 노드 지위가 집중되어 능력주의적 전제를 약화시킬 수 있다는 점입니다. 합의 보조금 방식은 이러한 문제를 완화하지만, 거버넌스 공격의 취약점을 만들어냅니다. 그렇다면 적절한 균형점은 무엇이며, 자본 집중 없이 협력 관계를 유지할 수 있는 다른 약정 메커니즘은 없을까요?


내가 찾고 있는 것

다음과 같은 목표를 가진 연구 협력자 및 초기 설계 파트너:

  • NSED를 도메인별 벤치마크(코드 검토, 법률 분석, 보안 감사)에 대해 실행합니다.
  • MAO 에스크로 게임 이론을 정형화하고 적대적 조건 하에서 스트레스 테스트를 수행한다.
  • 형식적 증명 시스템에 대한 대안 또는 보완책으로서 소셜 그래프 기반 시빌 공격 방어 기법을 탐구해 보세요.
  • 연합 AI 조정에 대한 물리적 분포 제약 조건의 이유

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트