원문 저자: 연구원 Kevin, BlockBooster
AI 에이전트 프레임워크는 업계 발전의 핵심 퍼즐로, 기술 구현과 생태계 성숙을 추진할 수 있는 이중 잠재력을 가지고 있습니다. 시장에서 논의되고 있는 프레임워크에는 Eliza, Rig, Swarms, ZerePy 등이 있습니다. 이러한 프레임워크는 Github Repo를 통해 개발자를 유치하고 명성을 쌓고 있습니다. "라이브러리" 형태의 토큰화를 통해 이러한 프레임워크는 파동과 입자의 특성을 동시에 가지고 있습니다. 에이전트 프레임워크 또한 엄격한 외부성과 밈코인의 특성을 동시에 가지고 있습니다. 이 글에서는 프레임워크의 "파동-입자 이중성"과 에이전트 프레임워크가 마지막 퍼즐 조각이 될 수 있는 이유를 중점적으로 다룰 것입니다.
에이전트 프레임워크가 가져오는 외부성은 버블 붕괴 후에도 싹을 틔울 수 있습니다
GOAT 탄생 이래로 에이전트 서사가 시장에 미치는 영향력은 계속 증가하고 있습니다. 마치 무술 대가와 같이 왼손은 "밈코인", 오른손은 "업계 희망"을 휘두르며 당신은 언젠가는 그 중 한 방에 패배할 것입니다. 사실 AI 에이전트의 응용 분야는 엄격하게 구분되지 않으며, 플랫폼, 프레임워크, 구체적인 응용 간의 경계가 모호합니다. 그러나 토큰 또는 프로토콜의 선호도에 따라 다음과 같이 분류할 수 있습니다:
Launchpad: 자산 발행 플랫폼. Base 체인의 Virtuals Protocol과 clanker, Solana 체인의 Dasha.
AI 에이전트 응용: 에이전트와 밈코인 사이에 존재하며, 메모리 구성에서 돋보이는 곳이 있습니다. 예를 들어 GOAT, aixbt 등이 있습니다. 이러한 응용은 일반적으로 단방향 출력이며, 입력 조건이 매우 제한적입니다.
AI 에이전트 엔진: Solana 체인의 griffain과 Base 체인의 Spectre AI. griffain은 읽기-쓰기 모드에서 읽기-쓰기-행동 모드로 진화할 수 있으며, Spectre AI는 RAG 엔진으로 체인 상의 검색을 수행합니다.
AI 에이전트 프레임워크: 프레임워크 플랫폼에서 에이전트 자체가 자산이므로, 에이전트 프레임워크는 에이전트의 자산 발행 플랫폼이자 에이전트의 Launchpad입니다. 현재 대표적인 프로젝트로는 ai16, Zerebro, ARC, 그리고 최근 주목받고 있는 Swarms 등이 있습니다.
기타 소규모 방향: 종합형 에이전트 Simmi, AgentFi 프로토콜 Mode, 증명형 에이전트 Seraph, 실시간 API 에이전트 Creator.Bid 등.
에이전트 프레임워크에 대해 더 자세히 살펴보면, 충분한 외부성을 가지고 있음을 알 수 있습니다. 각 공개 체인과 프로토콜의 개발자들은 서로 다른 개발 언어 환경에서 선택해야 하지만, 업계 전체 개발자 규모는 시가총액 증가 속도에 상응하는 증가를 보이지 않습니다. Github Repo는 Web2와 Web3 개발자들이 공감대를 형성하는 장소이며, 여기에서 개발자 커뮤니티를 구축하면 어떤 프로토콜 단독으로 개발한 "플러그 앤 플레이" 패키지보다 Web2 개발자들을 더 강력하게 끌어들일 수 있습니다.
언급된 4가지 프레임워크는 모두 오픈소스화되어 있습니다: ai16z의 Eliza 프레임워크는 6,200개의 별을 받았고, Zerebro의 ZerePy 프레임워크는 191개의 별을, ARC의 RIG 프레임워크는 1,700개의 별을, Swarms의 Swarms 프레임워크는 2,100개의 별을 받았습니다. 현재 Eliza 프레임워크는 다양한 에이전트 응용에 널리 사용되어 가장 광범위한 적용 범위를 가지고 있습니다. ZerePy의 개발 수준은 높지 않으며, 주로 X 방향으로 발전하고 있고 아직 로컬 LLM과 메모리 통합을 지원하지 않습니다. RIG는 상대적으로 개발 난이도가 가장 높지만, 개발자에게 최대한의 성능 최적화 자유를 제공합니다. Swarms는 팀이 mcs를 출시한 것 외에는 다른 사용 사례가 없지만, 다양한 프레임워크를 통합할 수 있어 상상력이 큽니다.
또한 위의 분류에서 에이전트 엔진과 프레임워크를 구분한 것이 혼란을 야기할 수 있습니다. 하지만 저는 두 가지가 구분된다고 생각합니다. 먼저 "엔진"이라고 한 이유는 현실 세계의 검색 엔진에 비유하는 것이 적절하기 때문입니다. 동질화된 에이전트 응용과 달리, 에이전트 엔진의 성능은 그 위에 있지만 완전히 캡슐화되어 API 인터페이스를 통해 조정됩니다. 사용자는 포크 방식으로 에이전트 엔진의 성능을 경험할 수 있지만, 기본 프레임워크와 같이 전체 모습을 파악하고 맞춤화할 수는 없습니다. 각 사용자의 엔진은 훈련된 에이전트의 이미지와 같으며, 이미지와의 상호 작용을 하는 것입니다. 반면 프레임워크의 본질은 체인에 적응하기 위한 것입니다. 에이전트가 에이전트 프레임워크를 만드는 이유는 궁극적으로 해당 체인과 통합하기 위해서입니다. 데이터 상호 작용 방식, 데이터 검증 방식, 블록 크기, 합의와 성능의 균형 등을 어떻게 정의할지가 프레임워크가 고려해야 할 사항입니다. 반면 엔진은 특정 방향으로 모델과 데이터 상호 작용, 메모리 관계를 충분히 미세 조정하는 것이 핵심이며, 성능이 유일한 평가 기준입니다. 프레임워크는 그렇지 않습니다.
"파동-입자 이중성"의 관점에서 에이전트 프레임워크를 평가하는 것이 올바른 방향으로 나아가는 전제 조건일 수 있습니다
에이전트가 한 번의 입출력 생명 주기를 실행하려면 세 가지 부분이 필요합니다. 첫째, 기저 모델이 사고의 깊이와 방식을 결정합니다. 둘째, 메모리는 사용자 정의 영역입니다. 기본 모델의 출력이 있은 후, 메모리에 따라 다시 수정됩니다. 마지막으로 다양한 클라이언트에서 출력 작업이 완료됩니다.
출처: @SuhailKakar
에이전트 프레임워크가 "파동-입자 이중성"을 가지고 있음을 입증하기 위해, "파동"은 "밈코인"의 특성을 가지며 커뮤니티 문화와 개발자 활동성을 나타내고, "입자"는 "업계 기대"의 특성을 가지며 기저 성능, 실제 사용 사례, 기술 깊이를 나타낸다고 할 수 있습니다. 이를 설명하기 위해 세 가지 프레임워크의 개발 튜토리얼을 예로 들어 두 가지 측면에서 설명하겠습니다:
빠른 조립 방식의 Eliza 프레임워크
1. 환경 설정
출처: @SuhailKakar
2. Eliza 설치
출처: @SuhailKakar
3. 구성 파일
출처: @SuhailKakar
4. 에이전트 성격 설정
출처: @SuhailKakar
Eliza 프레임워크는 상대적으로 사용이 쉽습니다. TypeScript 기반으로, 대부분의 Web 및 Web3 개발자에게 익숙한 언어입니다. 프레임워크가 간결하고 과도하게 추상화되지 않아 개발자가 원하는 기능을 쉽게 추가할 수 있습니다. 3단계를 통해 Eliza가 다중 클라이언트 통합을 지원하는 것을 볼 수 있으며, 이를 다중 클라이언트 통합 어셈블러로 이해할 수 있습니다. Eliza는 DC, TG, X 등의 플랫폼을 지원하며, 다양한 대형 언어 모델을 지원합니다. 위에서 언급한 소셜 미디어를 통해 입력을 받고, LLM 모델을 통해 출력하며, 내장 메모리 관리를 지원하여 어떤 습관의 개발자라도 빠르게 AI 에이전트를 배포할 수 있습니다.
프레임워크의 간결성과 인터페이스의 풍부성 덕분에 Eliza는 진입 장벽을 크게 낮추고 상대적으로 표준화된 인터페이스를 구현했습니다.
원클릭 사용 방식의 ZerePy 프레임워크
1. ZerePy 라이브러리 포크하기
출처: https://replit.com/@blormdev/ZerePy?v=1
2. X와 GPT 구성하기
출처: https://replit.com/@blormdev
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3. 문서 구조 및 임베딩 설정
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4. 벡터 저장소 및 RAG 에이전트 생성
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)은 러스트 언어 기반의 LLM 워크플로 엔진을 위한 AI 시스템 구축 프레임워크로, 더 낮은 수준의 성능 최적화 문제를 해결하고자 합니다. 다시 말해, ARC는 AI 엔진의 '도구 상자'로, AI 호출, 성능 최적화, 데이터 저장, 예외 처리 등의 백엔드 지원 서비스를 제공합니다.
Rig가 해결하고자 하는 것은 '호출' 문제로, 개발자가 LLM을 더 잘 선택하고, 프롬프트를 더 잘 최적화하며, 토큰을 더 효과적으로 관리하고, 동시 처리, 리소스 관리, 지연 시간 감소 등을 처리할 수 있도록 돕습니다. 즉, LLM 모델과 AI 에이전트 시스템의 협업 과정에서 '어떻게 잘 활용할 것인가'에 초점을 맞추고 있습니다.
Rig는 LLM 기반 애플리케이션(RAG 에이전트 포함)의 개발을 간소화하기 위한 오픈 소스 러스트 라이브러리입니다. Rig의 개방성이 더 깊기 때문에 개발자에게 더 높은 요구 사항이 있으며, 러스트와 에이전트에 대한 이해도 더 높아야 합니다. 여기의 튜토리얼은 가장 기본적인 RAG 에이전트 구성 프로세스를 다루고 있으며, RAG는 LLM과 외부 지식 검색을 결합하여 LLM을 강화합니다.
-
LLM 인터페이스 통일: 다양한 LLM 공급업체의 일관된 API를 지원하여 통합을 간소화합니다.
-
추상화된 워크플로: 사전 구축된 모듈식 구성 요소를 통해 Rig가 복잡한 AI 시스템 설계를 처리할 수 있습니다.
-
벡터 저장소 통합: 내장된 벡터 저장소 지원을 통해 RAG 에이전트와 같은 검색 에이전트에서 높은 성능을 제공합니다.
-
임베딩 유연성: 임베딩 처리를 위한 사용하기 쉬운 API를 제공하여 RAG 에이전트와 같은 검색 에이전트 개발 시 의미 이해의 어려움을 줄입니다.
Eliza와 비교하면, Rig는 개발자에게 추가적인 성능 최적화 공간을 제공하여 LLM과 에이전트의 호출 및 협업 최적화를 돕습니다. Rig는 러스트 구동 성능, 러스트의 장점인 무비용 추상화와 메모리 안전성, 고성능, 저지연 LLM 작업을 제공합니다. 따라서 보다 풍부한 자유도를 하위 수준에서 제공할 수 있습니다.
분해 조합식 Swarms 프레임워크
Swarms는 엔터프라이즈급 프로덕션 다중 에이전트 오케스트레이션 프레임워크를 제공하며, 웹사이트에는 수십 가지 워크플로와 에이전트 병렬/직렬 아키텍처가 제공됩니다. 여기서는 그 중 일부를 소개합니다.
순차적 워크플로
순차적 Swarm 아키텍처는 작업을 선형 순서로 처리합니다. 각 에이전트는 결과를 다음 에이전트에게 전달하기 전에 자신의 작업을 완료합니다. 이 아키텍처는 순서 처리를 보장하며 작업 간 종속성이 있는 경우에 매우 유용합니다.
사용 사례:
-
워크플로의 각 단계가 이전 단계에 의존하는 경우, 예를 들어 조립 라인 또는 순차적 데이터 처리.
-
엄격한 작업 순서가 필요한 시나리오.
계층 아키텍처:
상위 에이전트가 하위 에이전트 간 작업을 조정하는 상향식 제어를 구현합니다. 에이전트는 동시에 작업을 수행하고 결과를 피드백 루프에 반환하여 최종 집계를 수행합니다. 이는 높은 병렬성을 가진 작업에 매우 유용합니다.
스프레드시트 아키텍처:
동시에 작업하는 다수의 에이전트를 관리하는 대규모 군집 아키텍처입니다. 수천 개의 에이전트를 동시에 관리할 수 있으며, 각 에이전트는 자체 스레드에서 실행됩니다. 이는 대규모 에이전트 출력을 감독하는 이상적인 선택입니다.
Swarms는 에이전트 프레임워크일 뿐만 아니라 Eliza, ZerePy, Rig 프레임워크와도 호환되어, 모듈식 접근 방식으로 다양한 워크플로와 아키텍처에서 에이전트 성능을 최대화하여 해당 문제를 해결할 수 있습니다. Swarms의 구상과 개발자 커뮤니티 진행에는 문제가 없습니다.
-
Eliza: 사용성이 가장 강력하며, 초보자와 빠른 프로토타입 개발에 적합합니다. 특히 소셜 미디어 플랫폼의 AI 상호 작용에 적합합니다. 프레임워크가 간단하여 빠르게 통합하고 수정할 수 있으며, 성능 최적화가 필요 없는 시나리오에 적합합니다.
-
ZerePy: 원클릭 배포, Web3 및 소셜 플랫폼의 AI 에이전트 애플리케이션 빠른 개발에 적합합니다. 경량 AI 애플리케이션에 적합하며, 프레임워크가 간단하고 구성이 유연하여 빠른 구축과 반복에 적합합니다.
-
Rig: 성능 최적화에 중점을 두며, 특히 고 동시성 및 고성능 작업에서 뛰어난 성능을 발휘합니다. 세부적인 제어와 최적화가 필요한 개발자에게 적합합니다. 프레임워크가 다소 복잡하여 러스트 지식이 필요합니다.
-
Swarms: 엔터프라이즈급 애플리케이션에 적합하며, 다중 에이전트 협업과 복잡한 작업 관리를 지원합니다. 프레임워크가 유연하고 대규모 병렬 처리를 지원하며 다양한 아키텍처 구성을 제공하지만, 복잡성으로 인해 더 강력한 기술 배경이 필요할 수 있습니다.
전반적으로 Eliza와 ZerePy는 사용성과 빠른 개발 측면에서 장점이 있고, Rig와 Swarms는 고성능과 대규모 처리가 필요한 전문 개발자 또는 엔터프라이즈 애플리케이션에 더 적합합니다.
이것이 에이전트 프레임워크가 "산업 희망" 특성을 가지는 이유입니다. 위에서 언급한 프레임워크는 아직 초기 단계이며, 선점 우위를 확보하고 활발한 개발자 커뮤니티를 구축하는 것이 시급합니다. 프레임워크 자체의 성능 수준이나 Web2 인기 애플리케이션에 비해 뒤처지는지 여부는 주요 문제가 아닙니다. 지속적으로 개발자를 유치할 수 있는 프레임워크만이 최종적으로 승리할 수 있습니다. Web3 산업은 항상 시장의 관심을 끌어야 하기 때문입니다. 프레임워크의 성능이 강력하고 기반이 견고하더라도 사용하기 어려워 외면받는다면 본말이 전도됩니다. 프레임워크 자체가 개발자를 끌어들일 수 있는 전제 하에, 더 성숙하고 완전한 토큰 경제 모델을 가진 프레임워크가 두각을 나타낼 것입니다.
에이전트 프레임워크가 "밈코인" 특성을 가지는 이유는 매우 잘 이해할 수 있습니다. 위에서 언급한 프레임워크 토큰들은 합리적인 토큰 경제 설계가 없고, 사용 사례가 없거나 매우 단일하며, 검증된 비즈니스 모델이 없고, 효과적인 토큰 선순환 모델도 없습니다. 프레임워크와 토큰 간에 유기적인 결합이 이루어지지 않아, 토큰 가격
관한 BlockBooster
BlockBooster는 오케이엑스 벤처스(OKX Ventures) 및 기타 선도적인 기관이 지원하는 아시아 Web3 창업 스튜디오로, 훌륭한 창업가들의 신뢰할 수 있는 파트너가 되고자 합니다. 우리는 전략적 투자와 심층적인 인큐베이팅을 통해 Web3 프로젝트와 현실 세계를 연결하고, 우수한 창업 프로젝트의 성장을 지원합니다.
면책 조항
이 문서/블로그는 참고용으로만 제공되며, 저자의 개인적인 견해를 나타내며 BlockBooster의 입장을 대변하지 않습니다. 이 문서는 다음을 제공할 의도가 없습니다: (i) 투자 조언 또는 투자 권장 사항; (ii) 디지털 자산의 구매, 판매 또는 보유 제안 또는 권유; 또는 (iii) 재무, 회계, 법률 또는 세무 조언. 스테이블코인 및 엔에프티(NFT)를 포함한 디지털 자산 보유에는 매우 높은 위험이 수반되며 가격 변동이 크고 심지어 가치가 없어질 수 있습니다. 귀하의 재무 상황을 고려하여 디지털 자산 거래 또는 보유가 귀하에게 적합한지 신중히 고려해야 합니다. 특정 상황에 대한 문의가 있는 경우 귀하의 법률, 세무 또는 투자 자문사에 문의하십시오. 이 문서에 제공된 정보(시장 데이터 및 통계 정보 포함)는 일반 참고용으로만 제공됩니다. 이러한 데이터와 차트를 작성할 때 합리적인 주의를 기울였지만, 여기에 포함된 사실적 오류 또는 누락에 대해서는 책임지지 않습니다.