저자: jolestar
지난주에 AI 에이전트를 다루었고, 이번 주 ai16z 가 북경에서 개최한 행사에 참석했습니다. AI 에이전트가 현재 실제로 무엇을 할 수 있는지 살펴보고, 미래에 무엇을 할 수 있을지 생각해 보았습니다.
AI 에이전트의 현재 상황은 그 유명한 밈 이미지를 떠올리게 합니다. 자동판매기 안에 사람이 숨어있는 것처럼, 우리가 상상하는 AI 에이전트는 이미 자율 의식을 가지고 있지만, 실제로는 개발자가 숨어있는 것입니다. (여기서 여러분은 이 그림을 상상해 보세요. 제가 AI에게 이 이미지를 생성해 보라고 했지만, AI는 '숨어있다'는 개념을 이해하지 못했습니다.)
AI 에이전트 프레임워크의 기본 작동 방식
AI 에이전트 프레임워크는 현재 접착제 역할을 하고 있습니다. 클라이언트(Twitter, Discord, Telegram 등)와 다양한 플러그인(각 체인 등)을 결합하고, 기본 라이브러리(메모리 저장, 세션 격리, 컨텍스트 생성 등)를 제공하며, 다양한 AI 플랫폼 API와 연결됩니다.
AI 에이전트 프레임워크와 애플리케이션 및 비즈니스 시나리오의 결합
지난해 AI 열풍 이후, 다양한 플랫폼과 도구가 등장했습니다. 가장 중요한 것은 AI와 애플리케이션을 어떻게 결합할 것인가 입니다. AI 플랫폼은 플러그인 방식을 시도했고, 워크플로 모델을 만들었으며, 기존 애플리케이션에 AI를 내장하는 방식도 있습니다. 여기서 핵심은 1) 애플리케이션의 상호작용 진입점은 어디인가? 2) AI는 기존 비즈니스 로직과 어떻게 결합할 것인가입니다.
각 AI 플랫폼은 사용자에게 채팅 창과 유사한 대화형 인터페이스를 제공합니다. 모두가 AI 애플리케이션과의 상호작용이 '의인화'된 방식이어야 한다고 생각합니다. 이 점에서 AI 에이전트는 모든 오픈 IM 및 소셜 시스템에 직접 연결되어 있어, 새로운 인터페이스를 만드는 것보다 더 쉽게 받아들여질 수 있습니다.
AI와 기존 비즈니스 로직을 어떻게 결합할 것인가. AI 에이전트는 개발자가 AI의 의사결정을 비즈니스 시나리오에 통합할 수 있는 솔루션을 제공합니다. 프로그래밍 언어는 확실성이 필요하므로, if 조건은 true 또는 false만 가능하지만, AI를 통해 복잡한 로직을 정확한 조건으로 변환할 수 있습니다.
예를 들어, 그룹 내 메시지 회신 기능의 경우, 기존 IM 봇은 명확한 메시지 명령어로 트리거되어야 했지만, AI를 통해 'shouldReplyMessage'라는 메서드를 구현할 수 있습니다. 이 메서드에 컨텍스트를 제공하면 true 또는 false를 반환합니다.
비즈니스 로직 시나리오에서 AI의 역할은 다음과 같습니다:
1. '의도' 발견: 프롬프트의 설명을 통해 AI가 상황 맥락에 따라 사용자 메시지의 '의도'를 파악하고, 이를 구체적인 코드에 매핑합니다.
2. 의사결정 지원: AI를 통해 모호한 복잡 조건을 true/false 또는 열거형으로 변환하고, 이를 비즈니스 로직에 결합합니다.
여기까지 보면 많은 사람들이 AI 에이전트에 실망할 수 있습니다. 많은 사람들이 AI를 가르치기만 하면 무엇이든 할 수 있을 것이라 생각했지만, 대규모 모델의 컨텍스트 제한 문제로 인해 현재로서는 만능 AI를 만들 수 없습니다. 하지만 다행히도 프로그래머들은 실업할 걱정이 없습니다. AI 뒤에는 여전히 많은 프로그래머들이 필요하고, if-else를 작성해야 합니다. 다만 프로그래밍이 다룰 수 있는 비즈니스 영역이 확장되고 있습니다.
두 가지 유형의 AI 에이전트
행사에서 shaw에게 질문했습니다. 시장에는 두 가지 유형의 AI 에이전트에 대한 기대가 있습니다. 1) AI 에이전트가 자신의 역할, 브랜드를 가지고 사용자에게 서비스를 제공하는 것, 2) 사용자 개인 AI 에이전트가 개인 비서 역할을 하여 사용자를 지원하는 것. 어떤 유형이 더 인기가 있을까요? 그는 두 방향 모두 좋을 것 같고, 결합될 수도 있다고 생각했습니다.
현재 시장에서 주로 탐색되고 있는 것은 첫 번째 방향입니다. 이는 서비스 AI 에이전트화와 유사하며, 향후에는 앱 인터페이스가 사라지고 모든 것이 AI 에이전트화, 의인화될 수 있습니다. 두 번째 방향은 애플리케이션 클라이언트의 에이전트화입니다. 미래의 애플리케이션 클라이언트는 비서 에이전트의 플러그인이 될 것이며, 로컬 데이터가 에이전트의 메모리 일부가 되고, 이 플러그인이 클라우드 서비스 에이전트와 통신할 것입니다. 이는 새로운 애플리케이션 아키텍처 모델이 되어 전체 기반 시설을 변화시킬 것입니다.
AI 에이전트에 대한 기반 시설 요구사항
1. 기반 시설은 비허가형(Permissionless)이어야 합니다. 그렇지 않으면 AI 에이전트가 다양한 보안 전략에 의해 제한될 것입니다. 서비스는 경제적 비용(Gas)으로 보안을 해결해야 합니다. 이 부분에서 개방성이 낮은 플랫폼은 큰 타격을 받을 것입니다. Web2 초기의 개방 플랫폼 열풍이 다시 일어날 것입니다.
2. AI 에이전트는 자금을 운용할 수 있어야 합니다. 이를 통해 위의 문제를 해결할 수 있습니다.
즉, 미래의 서비스는 블록체인 기반이든 아니든 암호화폐 방식의 키 인증과 결제를 지원해야 합니다.
AI 에이전트와 블록체인의 결합
앞서 언급한 두 가지 외에도, AI 에이전트와 블록체인의 결합은 많이 탐색되고 있는 방향입니다. 행사에서 Mikkke가 진행 중인 focEliza에 대해 이야기했습니다. 앞서 언급한 두 유형의 AI 에이전트, 특히 첫 번째 유형은 블록체인이 제공하는 실행 또는 검증 환경이 필요합니다. 왜냐하면 AI 에이전트가 서비스를 제공하게 되면 신뢰 문제가 발생하기 때문이며, 실제로 그 역할은 스마트 계약과 유사합니다.
'스마트 계약'이라는 용어에 대해 논란이 있었습니다. 그것은 단순한 코드일 뿐 '스마트'하지 않습니다. AI를 통해 스마트 계약이 실제로 '스마트'해질 수 있습니다. 문제는 스마트 계약 환경에서 AI 인터페이스를 어떻게 호출할 것인가입니다. 검증 가능한 환경에서 대규모 모델을 실행하는 것은 아직 멀어 보이지만, Oracle과 유사한 솔루션이 더 현실적인 경로일 것입니다.
AI 에이전트를 중심으로 많은 요구사항이 파생될 것입니다. AI 에이전트의 공통 지식은 어떻게 얻을 것인가? 사실 판단은 어떻게 할 것인가? 다른 플랫폼의 동일한 사용자를 어떻게 식별할 것인가? 스마트 계약의 '기억'은 어떻게 저장할 것인가? 여러 기기에 설치된 AI 에이전트들은 어떻게 기억을 공유할 것인가?
이를 통해 Web3에서 다뤘던 '데이터 온체인', '관계 온체인', DID, P2P 네트워크 등이 새로운 의미와 시나리오를 가지게 될 것임을 알 수 있습니다.
결론
21년에 AI와 블록체인에 대해 공유했던 결론을 다시 사용하겠습니다. AI에 더 우호적인 인터넷은 인간에게도 더 우호적인 인터넷입니다. 당시에는 단순한 아이디어에 불과했지만, 이제 미래가 도래했습니다.