주목력에서 비롯된 새로움에 대한 갈망과 싫증
지난 1년 동안 애플리케이션 레이어의 내러티브가 단절되어 기반 인프라의 폭발적인 속도를 따라가지 못하면서, 암호화폐 분야는 점점 주목력 자원을 두고 벌이는 게임이 되어 갔습니다. 'Silly Dragon'에서 'Goat'까지, 'Pump.fun'에서 'Clanker'까지, 새로운 것에 대한 갈망과 싫증이 이 경쟁전을 더욱 내부적으로 만들어 왔습니다. 가장 진부한 눈길 끌기로 시작해 주목력 수요자와 공급자가 통합된 플랫폼 모델로 빠르게 진화했고, 이제는 실리콘 기반 생물체가 새로운 콘텐츠 공급자가 되었습니다. 밈 코인의 천차만별의 매체 속에서 마침내 개인 투자자와 벤처 캐피털이 합의할 수 있는 존재가 등장했습니다: AI 에이전트.
주목력은 결국 제로섬 게임이지만, 투기는 사물의 야만적인 성장을 촉발할 수 있습니다. 우리는 유니스왑(UNI)에 관한 기사에서 블록체인의 이전 황금기의 시작을 회고한 바 있습니다. 디파이(DeFi)의 폭발적인 성장은 컴파운드 파이낸스(Compound Finance)가 시작한 LP 채굴 시대에 기인했습니다. 연간 수익률 천 배 이상의 다양한 채굴 풀을 오가며 진입과 퇴출을 반복하는 것이 그 당시 체인상 가장 원초적인 게임 방식이었습니다. 비록 결과적으로는 다양한 채굴 풀이 무너졌지만, 금광 채굴꾼들의 광적인 유입은 블록체인에 전례 없는 유동성을 남겼고, 디파이는 결국 순수한 투기를 벗어나 결제, 거래, 차익거래, 스테이킹 등 다양한 금융 수요를 충족하는 성숙한 트랙이 되었습니다. 현재 AI 에이전트도 이와 같은 야만적인 단계를 겪고 있으며, 우리는 암호화폐가 AI를 어떻게 더 잘 융합할 수 있을지, 그리고 최종적으로 애플리케이션 레이어를 새로운 고지로 이끌어 갈 수 있을지 탐구하고 있습니다.
AI 에이전트의 자율성
이전 기사에서 우리는 AI 밈의 기원인 Truth Terminal과 AI 에이전트의 미래에 대해 간단히 소개했습니다. 이번 기사에서는 AI 에이전트 자체에 초점을 맞추고자 합니다.
먼저 AI 에이전트의 정의부터 살펴보겠습니다. 에이전트(Agent)는 AI 분야에서 비교적 오래된 용어이지만 정의가 명확하지 않습니다. 핵심은 자율성(Autonomous)으로, 환경을 감지하고 반응할 수 있는 모든 AI를 에이전트라고 할 수 있습니다. 현재 AI 에이전트는 지능체(Intelligent Agent)에 더 가깝습니다. 즉, 대규모 언어 모델에 인간의 의사결정 시스템을 모방한 체계를 더한 것입니다. 학계에서는 이것이 일반 인공지능(AGI)으로 가는 가장 유망한 방법으로 여겨집니다.
초기 GPT 버전에서 우리는 대규모 언어 모델이 인간과 매우 유사하다는 것을 알 수 있었지만, 복잡한 문제에 대한 답변은 종종 모호했습니다. 그 근본적인 이유는 당시의 대규모 언어 모델이 인과관계가 아닌 확률에 기반했기 때문이며, 또한 도구 사용, 기억, 계획 등 인간이 가진 능력이 부족했기 때문입니다. AI 에이전트는 이러한 결함을 보완할 수 있습니다. 즉, AI 에이전트 = 대규모 언어 모델 + 계획 + 기억 + 도구라고 요약할 수 있습니다.
프롬프트 기반의 대규모 언어 모델은 정적인 인간과 같습니다. 우리가 입력할 때만 생명력을 갖지만, 지능체의 목표는 보다 실제적인 인간이 되는 것입니다. 현재 업계의 지능체는 주로 메타가 공개한 Llama 70b 또는 405b 버전(매개변수가 다름)의 미세 조정 모델을 기반으로 하며, 기억 기능과 API 도구 사용 능력을 갖추고 있습니다. 다른 부분에서는 여전히 인간의 도움이나 입력이 필요할 수 있어, 현재 업계의 주요 지능체는 소셜 네트워크에서 KOL 형태로 존재하고 있습니다. 지능체를 보다 인간 같게 만들려면 계획 및 행동 능력이 필요하며, 특히 사고 체인(Chain of Thought, CoT)이 핵심적입니다.
사고 체인(Chain of Thought, CoT)
사고 체인(Chain of Thought, CoT) 개념은 2022년 구글이 발표한 논문 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》에서 처음 등장했습니다. 이 논문은 중간 추론 단계를 생성하면 모델의 추론 능력을 향상시킬 수 있다고 밝혔습니다.
전형적인 CoT 프롬프트는 세 부분으로 구성됩니다: 명확한 과제 설명, 과제 해결을 뒷받침하는 논리적 근거 또는 원리, 구체적인 해결 방안. 이러한 구조화된 방식은 모델이 과제 요구사항을 이해하고 단계적 논리 추론을 통해 답안에 접근할 수 있게 해줌으로써 문제 해결의 효율성과 정확성을 높입니다. CoT는 깊이 있는 분석과 다단계 추론이 필요한 과제, 예를 들어 수학 문제 풀이, 프로젝트 보고서 작성 등에 특히 적합합니다. 단순한 과제에서는 CoT의 이점이 두드러지지 않을 수 있지만, 복잡한 과제에서는 모델의 성능을 크게 향상시킬 수 있습니다.
CoT는 AI 에이전트 구축에 핵심적인 역할을 합니다. AI 에이전트는 수신한 정보를 이해하고 이에 따라 합리적인 결정을 내려야 합니다. CoT는 체계적인 사고 방식을 제공함으로써 에이전트가 입력 정보를 효과적으로 처리하고 분석하여 구체적인 행동 지침으로 전환할 수 있게 해줍니다. 이 방법은 에이전트의 의사결정 신뢰성과 효율성을 높일 뿐만 아니라, 의사결정 과정의 투명성도 향상시켜 에이전트의 행동을 더 예측 가능하고 추적 가능하게 만듭니다. CoT는 과제를 여러 작은 단계로 분해함으로써 에이전트가 각 의사결정 지점을 세밀히 고려하여 정보 과부하로 인한 잘못된 결정을 줄일 수 있게 해줍니다. 또한 CoT를 통해 에이전트는 환경과 상호작용하며 새로운 정보를 계속 학습하고 행동 전략을 조정할 수 있습니다.
CoT는 대규모 언어 모델의 추론 능력을 높이는 효과적인 전략일 뿐만 아니라, 더 지능적이고 신뢰할 수 있는 AI 에이전트를 구축하는 데에도 중요한 역할을 합니다. CoT를 활용하면 연구자와 개발자가 복잡한 환경에 적응하고 높은 자율성을 갖춘 지능 시스템을 만들어낼 수 있습니다. 특히 복잡한 과제를 처리할 때 CoT는 뛰어난 장점을 발휘합니다. 과제를 단계별로 분해하면 정확성이 높아질 뿐만 아니라 모델의 설명 가능성과 제어 가능성도 향상됩니다. 이러한 단계적 문제 해결 방식은 복잡한 과제로 인한 정보 과부하로 발생할 수 있는 잘못된 결정을 크게 줄일 수 있습니다. 또한 이 방식은 전체 해결 방안의 추적 가능성과 검증 가능성도 높입니다.
CoT의 핵심 기능은 계획, 행동, 관찰을 상호 연결하여 추론과 행동 사이의 격차를 메우는 것입니다. 이러한 사고 방식을 통해 AI 에이전트는 예상되는 예외 상황에 대한 효과적인 대응책을 수립하고, 외부 환경과 상호작용하면서 새로운 정보를 축적하고 사전 예측을 검증하여 추론의 근거를 보강할 수 있습니다. CoT는 복잡한 환경에서 AI 에이전트의 효율적인 작동을 보장하는 강력한 정확성 및 안정성 엔진과 같습니다.
올바른 가짜 수요
암호화폐 기술이 AI 기술 스택의 어떤 부분과 결합해야 할까요? 지난해 기사에서 저는 연산 능력과 데이터의 탈중앙화가 중소기업과 개인 개발자의 비용을 절감하는 핵심 단계라고 생각했습니다. 올해 코인베이스가 정리한 암호화폐와 AI의 세부 트랙을 보면 더 자세한 구분을 볼 수 있습니다:
(1) 컴퓨팅 레이어(GPU 리소스를 AI 개발자에게 제공하는 네트워크에 초점을 맞춤)
(2) 데이터 레이어(AI 데이터 파이프라인의 탈중앙화 액세스, 오케스트레이션, 검증을 지원하는 네트워크)
(3) 미들웨어 레이어(AI 모델 또는 에이전트의 개발, 배포, 호스팅을 지원하는 플랫폼 또는 네트워크)
(4) 애플리케이션 레이어(체인 상의 AI 메커니즘을 활용하는 B2B 또는 B2C 사용자 지향 제품)
탈중심화는 유일한 해답이지만, 때로는 이러한 거대한 비전의 지불자가 얼마나 되는지 합리적으로 종합적으로 고려해야 할 필요가 있습니다. 과거에는 상업적 폐쇄 고리를 고려하지 않고도 토큰을 통해 이상화된 오차를 보완할 수 있었습니다. 그러나 현재의 상황은 매우 심각합니다. Crypto x AI는 현실 상황을 고려하여 다시 설계해야 하며, 예를 들어 성능 손실과 불안정한 공급 측면에서 계산 능력 계층을 어떻게 균형을 맞출 것인지 등입니다. 데이터 계층의 프로젝트에 실제 사용자가 얼마나 있을지, 제공되는 데이터의 진실성과 유효성을 어떻게 검증할지, 그리고 이러한 데이터가 필요한 고객이 어떤 것인지 등입니다. 다른 2차 계층도 마찬가지입니다. 이 시대에는 그렇게 많은 겉보기에는 올바른 가짜 수요가 필요하지 않습니다.
5. 밈(meme)이 SocialFi를 벗어났다
첫 번째 단락에서 말했듯이 밈(meme)은 Web3에 부합하는 SocialFi 형태로 초고속으로 나아갔습니다. Friend.tech는 이번 라운드의 소셜 애플리케이션 1차 공격이었지만, 급하게 토큰 설계에 실패했습니다. Pump.fun은 순수 플랫폼화의 실현 가능성을 입증했습니다. 토큰도, 규칙도 없이 주목도 요구자와 공급자가 통일되어 있습니다. 플랫폼에서 밈 이미지를 게시하고, 라이브 방송을 하고, 토큰을 발행하고, 댓글을 달고, 거래할 수 있습니다. 모든 것이 자유로운 Pump.fun은 YouTube, Instagram 등 현재 소셜 미디어의 주목 경제 모델과 기본적으로 일치하지만, 대상 고객이 다릅니다. Pump.fun은 더 Web3적입니다.
Base의 Clanker는 통합 생태계의 종합자입니다. Base는 자체 소셜 Dapp을 보조 수단으로 사용하여 완전한 내부 폐쇄 고리를 형성했습니다. 지능형 밈(meme)은 밈 코인의 2.0 형태입니다. 사람들은 항상 새로운 것을 좋아하고, Pump.fun은 현재 유행의 중심에 있습니다. 트렌드 관점에서 볼 때 실리콘 기반 생물의 황당한 생각이 탄소 기반 생물의 저속한 밈을 대체하는 것은 시간 문제일 뿐입니다.
나는 이제까지 수없이 Base를 언급했습니다. 다만 언급할 때마다 내용이 다릅니다. 시간 순서로 보면 Base는 선구자가 아니지만 항상 승자입니다.
6. 지능형 에이전트는 무엇이 될 수 있을까?
실용적인 관점에서 볼 때 지능형 에이전트는 상당 기간 동안 탈중심화될 수 없습니다. 전통적인 AI 분야에서 지능형 에이전트를 구축하는 것을 보면, 단순한 추론 과정의 탈중심화와 오픈소스화만으로는 해결할 수 없는 문제입니다. 다양한 API에 접근하여 Web2 콘텐츠를 활용해야 하며, 운영 비용이 매우 높고, 사고 체인의 설계와 다중 에이전트의 협업은 일반적으로 인간 중개자에 의존합니다. 우리는 적절한 융합 형태가 나타날 때까지 매우 긴 전환기를 겪을 것입니다. 마치 유니스왑(UNI)과 같이 말이죠. 그러나 이전 기사와 마찬가지로 지능형 에이전트가 우리 산업에 큰 충격을 줄 것이라고 여전히 생각합니다. 중앙화 거래소(CEX)가 우리 산업에 존재하는 것과 마찬가지로, 올바르지는 않지만 매우 중요합니다.
지난달 스탠포드 대학과 마이크로소프트가 발표한 《AI 에이전트 개요》에서는 의료, 지능형 기기, 가상 세계 등에서 지능형 에이전트의 활용을 광범위하게 설명했습니다. 이 논문의 부록에는 GPT-4V가 최고 수준의 3A 게임 개발에 참여하는 실험 사례가 이미 많이 포함되어 있습니다.
탈중심화와 결합하는 속도를 너무 강요할 필요는 없습니다. 오히려 지능형 에이전트가 먼저 하향식 능력과 속도를 보완하기를 바랍니다. 우리에게는 많은 내러티브 폐허와 비어 있는 메타버스가 있어 이를 채워야 합니다. 적절한 단계에서 유니스왑(UNI)과 같은 존재가 되도록 고려할 수 있습니다.
블록비츠(theblockbeats) 공식 커뮤니티에 가입하세요:
텔레그램 구독 그룹: https://t.me/theblockbeats
텔레그램 채팅 그룹: https://t.me/BlockBeats_App
트위터 공식 계정: https://twitter.com/BlockBeatsAsia