저자: YBB Capital 연구원 Zeke
1. 주목에서 시작된 새로움에 대한 선호와 오래된 것에 대한 싫증
지난 1년 동안 애플리케이션 레이어의 내러티브가 단절되어 기반 인프라의 폭발적인 속도를 따라가지 못하면서, 암호화폐 분야는 점점 주목 자원을 두고 다투는 게임이 되었습니다. Silly Dragon에서 Goat로, Pump.fun에서 Clanker로, 새로운 것에 대한 선호와 오래된 것에 대한 싫증이 이 경쟁을 더욱 내부적으로 만들어냈습니다. 가장 진부한 눈길 끌기로 시작해 주목 수요자와 공급자가 통일된 플랫폼 모델로 빠르게 진화했고, 이제는 실리콘 기반 생물체가 새로운 콘텐츠 공급자가 되었습니다. 밈 코인의 다양한 매체 속에서 마침내 개인 투자자와 벤처 캐피털이 합의할 수 있는 존재가 등장했습니다: AI 에이전트.
주목은 결국 제로섬 게임이지만, 투기는 사물의 야만적인 성장을 촉발할 수 있습니다. 우리는 유니스왑(UNI)에 관한 기사에서 블록체인의 이전 황금기 시작을 회고했습니다. DeFi의 폭발적인 성장은 컴파운드 파이낸스(Compound Finance)가 시작한 LP 채굴 시대에 기인했는데, APY가 천 배 이상인 다양한 마이닝 풀을 오가는 것이 그 당시 체인상 가장 원초적인 도박 방식이었습니다. 비록 결국 모든 마이닝 풀이 무너졌지만, 황금 광부들의 광적인 유입은 블록체인에 전례 없는 유동성을 남겼고, DeFi는 결국 순수한 투기를 벗어나 성숙한 트랙을 형성했습니다. 결제, 거래, 차익거래, 스테이킹 등 다양한 측면에서 사용자의 금융 수요를 충족시켰습니다. AI 에이전트도 현재 이 야만적인 단계를 겪고 있으며, 우리가 탐구하고 있는 것은 암호화폐가 AI를 어떻게 더 잘 융합할 수 있고, 최종적으로 애플리케이션 레이어를 새로운 고지로 이끌 수 있을지입니다.
2. 에이전트는 어떻게 자율적으로 행동할 수 있는가
우리는 이전 기사에서 AI 밈의 기원인 Truth Terminal과 AI 에이전트의 미래에 대해 간단히 소개했습니다. 이번 기사에서는 AI 에이전트 자체에 초점을 맞추고 있습니다.
먼저 AI 에이전트의 정의부터 살펴보겠습니다. 에이전트는 AI 분야에서 비교적 오래된 용어이지만 정의가 명확하지 않습니다. 핵심은 자율성(Autonomous)으로, 환경을 감지하고 반응할 수 있는 모든 AI를 에이전트라고 할 수 있습니다. 현재 정의에서 AI 에이전트는 지능체에 더 가깝습니다. 즉, 대규모 언어 모델에 인간의 의사결정 시스템을 모방하는 체계를 부여하는 것으로, 학계에서는 이것이 AGI(일반 인공지능)로 가는 가장 유망한 방법으로 여겨집니다.
초기 GPT 버전에서 우리는 대규모 언어 모델이 인간과 매우 유사하다는 것을 알 수 있었지만, 복잡한 문제에 대한 답변은 종종 모호했습니다. 근본적인 이유는 당시 대규모 언어 모델이 인과관계가 아닌 확률에 기반했기 때문이며, 또한 도구 사용, 기억, 계획 등 인간이 가진 능력이 부족했습니다. AI 에이전트는 이러한 결함을 보완할 수 있습니다. 따라서 AI 에이전트(지능체) = 대규모 언어 모델 + 계획 + 기억 + 도구라고 요약할 수 있습니다.
프롬프트 기반의 대규모 언어 모델은 정적인 인간과 유사하지만, 에이전트의 목표는 더 실제적인 인간이 되는 것입니다. 현재 업계의 주요 에이전트는 Meta가 공개한 Llama 70b 또는 405b 버전(매개변수가 다름)을 미세 조정한 모델로, 기억 기능과 API 도구 사용 능력을 갖추고 있습니다. 다른 부분에서는 여전히 인간의 도움이나 입력이 필요합니다(다른 에이전트와의 상호작용 포함). 에이전트를 더 인간 같게 만들려면 계획 및 행동 능력이 필요하며, 특히 사고 체인(Chain of Thought)이 핵심적입니다.
3. 사고 체인(Chain of Thought, CoT)
사고 체인(Chain of Thought, CoT) 개념은 2022년 구글이 발표한 논문 "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models"에서 처음 등장했습니다. 이 논문은 중간 추론 단계를 생성하면 모델의 추론 능력을 향상시킬 수 있다고 밝혔습니다.
전형적인 CoT 프롬프트는 세 부분으로 구성됩니다: 명확한 과제 설명, 과제 해결을 뒷받침하는 논리적 근거 또는 원리, 구체적인 해결 방안. 이러한 구조화된 방식은 모델이 과제 요구사항을 이해하고 단계적 추론을 통해 점진적으로 답안에 접근하도록 돕습니다. CoT는 심층 분석과 다단계 추론이 필요한 과제에 특히 적합합니다. 단순 과제에서는 CoT의 이점이 크지 않지만, 복잡한 과제에서는 오류율을 줄이고 과제 수행 품질을 크게 향상시킬 수 있습니다.
AI 에이전트 구축 시 CoT는 핵심적인 역할을 합니다. 에이전트는 수신한 정보를 이해하고 이에 따라 합리적인 결정을 내려야 합니다. CoT는 체계적인 사고 방식을 제공하여 에이전트가 입력 정보를 효과적으로 처리하고 분석하며, 그 결과를 구체적인 행동 지침으로 전환할 수 있게 합니다. 이 방법은 에이전트 의사결정의 신뢰성과 효율성을 높일 뿐만 아니라, 의사결정 과정의 투명성도 향상시켜 에이전트의 행동을 더 예측 가능하고 추적 가능하게 만듭니다. CoT는 과제를 여러 작은 단계로 분해하여, 에이전트가 각 의사결정 지점을 세밀히 고려하고 정보 과부하로 인한 잘못된 결정을 줄일 수 있게 합니다. 또한 에이전트가 환경과 상호작용하며 새로운 정보를 지속적으로 학습하고 행동 전략을 조정할 수 있게 해줍니다.
CoT는 대규모 언어 모델의 추론 능력을 높이는 효과적인 전략일 뿐만 아니라, 더 지능적이고 신뢰할 수 있는 AI 에이전트를 구축하는 데 중요한 역할을 합니다. 연구자와 개발자들은 CoT를 활용하여 복잡한 환경에 적응하고 높은 자율성을 갖춘 지능 시스템을 만들어낼 수 있습니다. CoT는 특히 복잡한 과제 해결 시 뛰어난 장점을 보이는데, 과제를 단계별로 분해하여 정확성을 높이고 모델의 설명 가능성과 제어 가능성을 강화합니다. 이러한 점진적 문제 해결 방식은 복잡한 과제로 인한 정보 과부하로 발생할 수 있는 잘못된 결정을 크게 줄일 수 있습니다. 동시에 이 방식은 전체 해결책의 추적 가능성과 검증 가능성도 높입니다.
CoT의 핵심 기능은 계획, 행동, 관찰을 상호 연결하여 추론과 행동 사이의 격차를 메우는 것입니다. 이러한 사고 방식을 통해 AI 에이전트는 예상되는 예외 상황에 대한 효과적인 대응책을 수립하고, 외부 환경과 상호작용하면서 새로운 정보를 축적하고 사전 예측을 검증하여 추론의 근거를 보강할 수 있습니다. CoT는 복잡한 환경에서 에이전트의 효율적인 작동을 보장하는 강력한 정확성 및 안정성 엔진과 같습니다.
4. 올바른 가짜 수요
암호화폐 기술이 AI 기술 스택의 어떤 부분과 결합해야 할까요? 지난해 기사에서 저는 컴퓨팅 파워와 데이터의 탈중앙화가 중소기업과 개인 개발자의 비용 절감에 핵심적이라고 말했습니다. 올해 코인베이스가 정리한 암호화폐와 AI의 세부 트랙에서 우리는 더 자세한 구분을 볼 수 있습니다:
(1) 컴퓨팅 레이어(AI 개발자에게 GPU 리소스를 제공하는 네트워크에 초점을 맞춤)
(2) 데이터 레이어(AI 데이터 파이프라인의 탈중앙화된 액세스, 오케스트레이션, 검증을 지원하는 네트워크)
(3) 미들웨어 레이어(AI 모델 또는 에이전트의 개발, 배포, 호스팅을 지원하는 플랫폼 또는 네트워크)
(4) 애플리케이션 레이어(체인 상의 AI 메커니즘을 활용하는 B2B 또는 B2C 사용자 지향 제품)
이 4개 레이어 각각에는 거대한 비전이 있으며, 그 목표는 결국 실리콘 밸리 거대 기업들의 인터넷 지배를 막는 것입니다. 제가 작년에 말했듯이, 우리는 정말 실리콘 밸리 거대
탈중심화는 유일한 해답이지만, 때로는 이러한 거대한 비전의 지불자가 얼마나 많은지 합리적으로 종합적으로 고려해야 할 필요가 있습니다. 과거에는 상업적 폐쇄 고리를 고려하지 않고 토큰을 통해 이상화로 인한 오차를 보완할 수 있었습니다. 그러나 현재의 상황은 매우 심각합니다. Crypto x AI는 현실 상황을 고려하여 다시 설계해야 하며, 예를 들어 성능 손실과 불안정한 공급 상황에서 컴퓨팅 파워 계층의 양측을 어떻게 균형을 맞출 것인지 등입니다. 이를 통해 중앙화된 클라우드와 경쟁력을 갖출 수 있습니다. 데이터 계층 프로젝트에 실제 사용자가 얼마나 있을지, 제공되는 데이터의 진실성과 유효성을 어떻게 검증할지, 그리고 이러한 데이터가 필요한 고객이 있는지 등이 중요합니다. 다른 2차 계층도 마찬가지입니다. 이 시대에 우리는 그렇게 많은 겉보기에는 올바른 가짜 수요가 필요하지 않습니다.
5. 밈(meme)이 SocialFi를 벗어났다
첫 번째 단락에서 말했듯이 밈(meme)은 Web3에 부합하는 SocialFi 형태로 초고속으로 나아갔습니다. Friend.tech는 이번 라운드의 소셜 애플리케이션 1호 Dapp이지만, 성급한 토큰 설계로 인해 실패했습니다. Pump.fun은 순수 플랫폼화의 실현 가능성을 입증했습니다. 토큰도, 규칙도 없이 주목도 요구자와 공급자가 통합되어 있어 플랫폼에서 밈 이미지 게시, 라이브 방송, 토큰 발행, 댓글, 거래 등 모든 것이 자유롭습니다. Pump.fun은 서비스 수수료만 받습니다. 이는 현재 YouTube, Instagram 등 소셜 미디어의 주목도 경제 모델과 기본적으로 일치하지만, 대상 고객이 다르고 Web3 방식으로 구현되었습니다.
Base의 Clanker는 통합 생태계를 구축한 종합자입니다. Base는 보조 소셜 Dapp을 갖추어 완전한 내부 폐쇄 고리를 형성했습니다. 지능체 밈(meme)은 밈 코인의 2.0 형태입니다. 사람들은 항상 새로운 것을 좋아하며, Pump.fun은 현재 호황을 누리고 있습니다. 실리콘 기반 생물의 황당한 상상이 탄소 기반 생물의 저속한 밈을 대체하는 것은 시간 문제일 뿐입니다.
Base에 대해 여러 번 언급했지만, 언급 내용은 매번 다릅니다. 시간 순서로 보면 Base는 선구자가 아니지만 항상 승자입니다.
6. 지능체는 무엇이 될 수 있을까?
현실적인 관점에서 볼 때, 지능체가 장기적으로 탈중앙화되기는 어려울 것입니다. 전통적인 AI 분야에서 지능체를 구축하는 것을 보면, 단순한 추론 과정의 탈중앙화와 오픈소스화로는 해결되지 않습니다. 다양한 API에 접근하여 Web2 콘텐츠를 활용해야 하며, 운영 비용이 매우 높고, 사고 체인의 설계와 다중 지능체의 협업은 일반적으로 인간 중개자에 의존합니다. 우리는 적절한 융합 형태가 나타날 때까지 매우 긴 전환기를 겪을 것입니다. 마치 유니스왑(UNI)과 같이 말이죠. 하지만 이전 글과 마찬가지로 지능체가 우리 산업에 큰 충격을 줄 것이라고 생각합니다. 중앙화 거래소(CEX)가 우리 산업에 존재하는 것과 같이, 올바르지는 않지만 매우 중요합니다.
지난달 스탠포드 대학과 마이크로소프트가 발표한 'AI 에이전트 개요' 논문에서는 의료, 지능형 기기, 가상 세계 등에서 지능체의 활용을 광범위하게 설명했습니다. 부록에는 GPT-4V가 최고 수준의 3A 게임 개발에 참여한 실험 사례도 많이 소개되어 있습니다.
탈중앙화와의 결합 속도를 너무 강요할 필요는 없습니다. 오히려 지능체가 먼저 하향식 능력과 속도를 보완하기를 바랍니다. 우리에게는 많은 내러티브 폐허와 비어 있는 메타버스가 있어 이를 채워야 합니다. 적절한 단계에서 유니스왑(UNI)과 같은 존재가 되도록 고려해볼 수 있습니다.
참고 자료
대규모 모델의 "출현"이 의미하는 사고 체인은 무엇인가? 저자: 뇌극체
에이전트를 한 번에 이해하기: 대규모 모델의 다음 단계 저자: LinguaMind