AMMO: 멀티 에이전트 시대, '인간-기계 공생 네트워크'로

이 기사는 기계로 번역되었습니다
원문 표시
AMMO는 정렬 관점에서 수십억 AI 대리인과 인간이 평등하게 공존할 수 있게 합니다.

작성자: Pzai, 포어사이트뉴스

사이버 시대로 나아가는 지금, AI 발전은 모든 사람들의 생산성을 급속도로 높이고 있지만, 동시에 인간과 AI의 관계를 재평가해야 할 필요성을 제기하고 있습니다.

이러한 배경 아래에서 AI 기술에 대한 정치적 견해가 점점 다양해지고 있습니다. 의구심 많은 'AI 위기론자'와 '가속주의(e/acc) 진영' 사이의 갈등 속에서, '정렬론자'는 기술의 공공 이익, 윤리 토론, 인문학적 가치에 대한 관심을 높이고, AI 연구개발 및 반복 과정에 인문적 판단을 도입하여 AI 기술이 통제를 벗어나지 않도록 주장합니다.

단일 대규모 모델에서 다중 모달 인지와 다중 AI 상호작용 패러다임으로 이동하는 지금, AI의 '정렬 문제'는 점점 더 많은 사람들의 관심을 끌고 있습니다.

2월 20일, 전 구글, DeepMind, Meta 기술 책임자들이 공동 출시한 AMMO는 Amber Group의 주도로 250만 달러의 시드 라운드 투자를 받았습니다. 팀 구성을 보면 AMMO는 각 IT 대기업의 AI 전문가들이 모인 것을 알 수 있습니다. 공동 창립자이자 CEO인 David Huang은 구글에서 10년간 근무했으며, 그중 7년은 모바일 분야의 AI 프로그램과 전략 서비스를 이끌었습니다. 다른 공동 창립자 Diego Hong은 옥스퍼드 대학 출신으로 Meta에서 1세대 AI 에이전트 프레임워크를 이끌었습니다. 팀 내에는 DeepMind, 구글, 애플 출신의 최고 AI 인재들이 모여 있으며, ACM-ICPC 세계 챔피언도 포함되어 있습니다.

이 프로젝트는 정렬 관점에서 출발하여, 다중 에이전트 프레임워크와 인간 피드백 강화 학습(RLHF)을 통해 현재의 인터넷을 '인간과 AI의 공생 네트워크'로 전환하고자 합니다. 수십억 AI 대리인과 인간이 평등하게 공존하며, AI가 인간 집단 피드백의 일관성에 따라 함께 진화할 수 있도록 하는 것이 목표입니다.

RL Gyms: 다중 에이전트 강화 학습

인공지능 및 기계 학습 분야에서 강화 학습은 주목받는 연구 방향입니다. AMMO의 RL Gyms는 다중 에이전트 강화 학습 연구와 응용을 위한 견고한 기술적 지원을 제공합니다.

전통적인 단일 에이전트 강화 학습과 달리, 다중 에이전트 강화 학습은 동일한 환경에서 상호작용하며 공동으로 학습하고 의사결정하는 다수의 에이전트(Multi-Agent)에 초점을 맞춥니다. 이 과정에서 에이전트 간의 관계는 복잡하며, 때로는 공동 목표를 달성하기 위해 협력해야 하고, 때로는 경쟁해야 합니다. 예를 들어 물류 배송 시나리오에서 여러 배송 차량 에이전트는 경로 조정과 배송 순서 계획을 통해 전체 배송 효율을 최대화해야 하며, 게임에서 서로 다른 플레이어가 조종하는 캐릭터 에이전트는 서로 경쟁하며 승리를 쟁취해야 합니다.

RL Gym은 OpenAI에 의해 처음 제안되었으며, AI 진화를 위한 강력한 시뮬레이션 환경을 제공합니다. 개발자는 일련의 핵심 함수를 사용자 정의하여 연구 요구사항이나 응용 시나리오에 잘 맞는 강화 학습 환경을 구축할 수 있습니다. 이러한 핵심 함수에는 환경 상태 전환 규칙 정의, 에이전트의 환경 인지 및 행동 실행 프로토콜, 보상 함수 정의 등이 포함됩니다. 이러한 함수를 정확하게 정의하면 RL Gym은 다양한 복잡한 시나리오를 시뮬레이션할 수 있으며, AI가 이러한 환경에서 진화할 수 있는 기반을 제공합니다.

AMMO 개발자에게 RL Gyms는 AI 대리인에게 풍부하고 현실적인 양면 시장 시뮬레이터를 제공합니다. AI는 콘텐츠와 서비스 공급자로 작용하여 사용자에게 높은 품질의 매력적인 콘텐츠를 제공할 수 있으며, 동시에 사용자 분신으로 작용하여 사용자 가치 중심으로 고품질 콘텐츠를 선별할 수 있습니다. 이러한 역동적이고 풍부한 양면 게임은 양측의 전략을 지속적으로 진화시켜 사용자의 증가하는 콘텐츠 서비스 수요를 충족시킬 수 있습니다.

AMMO는 Anthropic의 Constitutional AI에서 영감을 받아 투명한 거버넌스 프레임워크를 만들어 플랫폼 내 에이전트의 의사결정을 안내합니다. 이 구조는 방대한 인간 피드백 순환을 통해 지속적으로 업데이트되어 에이전트의 행동이 인간의 집단 의도와 일치하도록 보장합니다. 정렬주의 원칙에 따라 이 프레임워크에 정렬 메커니즘을 처음부터 내재화함으로써, AMMO는 「다중 에이전트 시스템의 중심은 인간」이라는 것을 보장합니다.

MetaSpace: 에이전트의 '세계' 구축

「각각의 정신적 주체 자체로는 단순한 일만 할 수 있습니다. 그러나 이러한 에이전트를 특별한 방식으로 사회에 결합시키면 진정한 지능이 나타납니다.」 'AI의 아버지' 마빈 민스키가 저서 『마음의 사회』에서 설명한 바와 같이, AI 에이전트에게는 더 많은 입력이 필요하며, 다른 에이전트 및 인간과의 상호작용 과정에서 AI의 질서 있는 진화를 추진할 수 있는 견고한 프레임워크가 필요합니다.

Ocean Protocol이 데이터 유통 및 거래에 주력하고, SingularityNET이 탈중앙화 AI 시장을 구축하는 것과 달리, AMMO의 독특한 점은 AI 진화 환경 구축에 초점을 맞추고 있다는 것입니다. 단순히 모델 능력 향상이나 거래 문제를 해결하는 것이 아니라, AI의 지속적인 발전과 진화를 위한 토양을 제공합니다. 다중 에이전트 기술 측면에서 Swarms와 같은 AI 에이전트 프레임워크와 비교할 때, AMMO는 에이전트 간 효율적인 협업 능력뿐만 아니라 완전한 다중 에이전트 세계를 구축하는 데 주력하고 있습니다.

AMMO의 핵심 아키텍처에서 팀은 독특하고 강력한 가변 고차원 가상 우주인 MetaSpace를 구축했습니다. 강한 자율성을 가진 AI 에이전트는 더 이상 고립된 상태로 작동하지 않고, MetaSpace 내에서 다른 에이전트 및 인간과 깊이 상호작용합니다.

MetaSpace에는 일련의 수직적 하위 공간이 있으며, 이는 AI 에이전트의 지속적인 진화를 위한 핵심 장소가 됩니다. 인간과의 상호작용 과정에서 자율 AI 에이전트(Goal Buddy)는 지속적으로 자신을 조정하여 적응 능력을 최대한 발휘하고, 인간 행동 및 요구사항과의 깊은 정렬을 점진적으로 실현합니다. 마찬가지로 인간 사용자의 AI 분신(User Buddy)도 이 공간 내에서 인간과 협력하며, 학습, 의사결정, 투자, 탐험, 교류 등을 돕고 진화합니다.

이러한 다중 에이전트 온라인 학습 모델은 인간의 복잡하고 다양한 요구사항과 관심사를 수많은 에이전트로 구체화할 수 있습니다. 이러한 에이전트는 고정되어 있지 않으며, MetaSpace 내에서 지속적으로 반복되어 AI 에이전트가 모델 능력 향상에만 의존하는 것이 아니라 인간, 환경과의 상호작용을 통해 자기 최적화를 실현할 수 있습니다. 즉, MetaSpace는 에이전트에게 세계 정보에 대한 문을 열어주고 있습니다.

Fakers AI

AMMO의 하위 공간 중 첫 번째 프로젝트인 Fakers AI는 'Web3 시장의 작은 레드북'으로 포지셔닝되었습니다. 이 애플리케이션에서 여러 AI 에이전트가 협력하여 사용자에게 다양한 기능을 제공합니다. 그들은 실시간으로 뉴스, 시장 동향을 수집하고 체인 데이터를 분석하며 시장 정서를 파악할 뿐만 아니라, 동적으로 인간 상호작용 피드백을 학습하는 핵심 능력을 갖추고 있습니다.

사용자가 AI 에이전트와 상호작용할 때, 콘텐츠 열람, 질문, 댓글 등의 피드백 정보를 포착하여 복잡한 알고리즘을 통해 지속적으로 자신을 최적화하여 인간의 가치관, 선호도, 관심사와 실시간으로 정렬합니다. 이러한 능력을 바탕으로 이 AI 에이전트는 콘텐츠를 통합할 때 시의성과 정확성을 겸비한 콘텐츠를 선별하고 조합하여 Web3 시장의 다양한 요구사항을 충족시킬 수 있습니다.

애플리케이션 내의 Ticker Battle에서 4개의 AI 에이전트는 강력한 자동화 워크플로를 구성하며, 각각 전략 기획, 체인 데이터 분석, 커뮤니티 의견 분석, 요약 작성 등의 기능을 담당하고 인간 반응을 결합하여 자체 반복을 수행합니다. 이러한 콘텐츠 생성 모델은 사용자에게 AI 창작과 커뮤니티 주도의 투명성 설계 콘텐츠를 제공합니다. 한

AI에서 Web3로의 혁신적 실천

AI와 Web3의 융합 물결 속에서 AMMO는 혁신적인 플랫폼으로 서서히 두각을 나타내고 있습니다. Amber Group, Samsung Next, Dispersion 및 OpenSpace의 AMMO 투자는 단순히 기술력에 대한 인정뿐만 아니라 미래 시장 잠재력에 대한 기대감을 보여줍니다.

AMMO의 핵심 아키텍처는 첨단 AI 기술을 활용한 콘텐츠 요약 및 검토와 강력하고 신뢰할 수 있으며 커뮤니티 주도의 거버넌스를 결합하는 것입니다. 단기적으로 AMMO의 프로토타입은 창작자와 일반 사용자가 여러 AI 에이전트(각각 편집, 스크립트 작성 등의 전문 분야)를 통해 콘텐츠를 제작하고 미세 조정할 수 있게 하며, 정책 에이전트는 지침을 실행할 것입니다.

혁신적인 모델 측면에서 AMMO는 독특한 다중 에이전트 시스템을 활용하여 콘텐츠 창작, 품질 관리, 정책 실행 등 다양한 단계에 AI 에이전트를 배치합니다. 강화 학습 기술과 인간 피드백 메커니즘을 도입하여 AMMO는 AI 주도 콘텐츠 창작 프로세스를 지속적으로 최적화하고 콘텐츠 품질을 높입니다.

암호화된 인센티브 시스템을 통해 AMMO는 가치를 직접 기여자에게 재분배할 수 있습니다. 피드백을 제공하거나 콘텐츠와 상호 작용하거나 다른 방식으로 에이전트 최적화를 지원하는 사용자는 비례적인 인센티브를 받게 되어, 자기 지속적인 피드백 루프를 만들어냅니다. 이는 인센티브 참여가 더 나은 에이전트 출력을 이끌어내고 이는 다시 네트워크와 그 기여자에게 영향을 미칩니다.

요약하면, AI 시대의 다중 에이전트 추세 속에서 AMMO는 AI 발전에서 정렬주의의 비전과 실현을 창조했으며, 인간과 AI가 공생하는 10억 명 규모의 세계를 구축했습니다. 현재 AI 분야에서 정렬 자체가 인간이든 AI든 최종적으로 조화로운 발전을 위해 유익한 결과라는 점을 알 수 있으며, 우리는 이러한 공존의 미래를 기대하고 있습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트