AI Agent의 현황과 미래

이 기사는 기계로 번역되었습니다
원문 표시

작성자: jolestar

지난주에 AI 에이전트를 다루었고, 이번 주 초에 ai16z가 북경에서 개최한 행사에 참석했습니다. AI 에이전트가 현재 실제로 무엇을 할 수 있는지 살펴보고, 미래에 무엇을 할 수 있을지 생각해 보았습니다.

AI 에이전트의 현재 상황은 그 유명한 밈 이미지를 떠올리게 합니다. 자동판매기 안에 사람이 숨어 있는 것처럼, 우리가 상상하는 AI 에이전트 안에는 실제로 개발자가 숨어 있습니다. (여기서 여러분은 이 이미지를 상상해 보시면 됩니다. 제가 AI에게 이 이미지를 생성해 보라고 했지만, AI는 '숨어 있다'는 개념을 이해하지 못했습니다.)

AI 에이전트 프레임워크의 기본 작동 방식

AI 에이전트 프레임워크는 현재 접착제 역할을 하고 있습니다. 클라이언트(Twitter, Discord, Telegram 등)와 다양한 플러그인(각 체인 등)을 결합하고, 기본 라이브러리(메모리 저장, 세션 격리, 컨텍스트 생성 등)를 제공하며, 다양한 AI 플랫폼 API와 연결됩니다.

AI 에이전트 프레임워크와 애플리케이션 및 비즈니스 시나리오의 결합

지난해 AI가 열풍을 일으킨 이래, 다양한 플랫폼과 도구가 등장했습니다. 가장 중요한 것은 AI와 애플리케이션을 어떻게 결합할 것인가 입니다. AI 플랫폼은 플러그인 방식을 제공하고, 워크플로 모델을 구축하며, 기존 애플리케이션에 AI를 내장하는 방식을 시도하고 있습니다. 여기서 핵심은 1) 애플리케이션의 상호작용 진입점이 어디인지, 2) AI가 기존 비즈니스 로직과 어떻게 결합할 수 있는지입니다.

각 AI 플랫폼은 사용자에게 채팅 창과 유사한 대화형 인터페이스를 제공하고 있습니다. 이는 AI 애플리케이션과의 상호작용이 '의인화'된 방식이어야 한다는 것을 보여줍니다. AI 에이전트의 장점은 모든 오픈 IM 및 소셜 시스템에 직접 연결되어 있다는 점입니다. 이는 새로운 플랫폼을 만드는 것보다 더 쉽게 받아들여질 수 있습니다.

AI가 기존 비즈니스 로직과 어떻게 결합할 수 있을까요? AI 에이전트는 개발자가 AI의 의사결정을 비즈니스 시나리오에 통합할 수 있는 솔루션을 제공합니다. 프로그래밍 언어는 확실성을 요구하지만, AI를 통해 복잡한 로직을 정확한 조건으로 변환할 수 있습니다.

예를 들어, 그룹 내 메시지 회신 기능의 경우, 기존 IM 봇은 명확한 메시지 명령어를 통해 트리거되어야 했지만, AI를 통해 'shouldReplyMessage'라는 메서드를 구현하여 컨텍스트를 기반으로 true/false를 반환할 수 있습니다.

AI가 비즈니스 로직 시나리오에서 하는 역할은 다음과 같습니다:

1. '의도' 발견: 프롬프트의 설명을 통해 AI가 상황 맥락에 따라 사용자 메시지의 '의도'를 파악하고, 이를 구체적인 코드에 매핑합니다.

2. 의사결정 지원: AI를 통해 모호한 복잡 조건을 true/false 또는 열거형 유형으로 변환하고, 이를 비즈니스 로직에 결합합니다.

이를 보면, 많은 사람들이 AI 에이전트에 실망할 수 있습니다. 많은 사람들이 AI 에이전트를 교육하면 무엇이든 할 수 있을 것이라고 생각했지만, 대규모 모델의 컨텍스트 제한 문제로 인해 현재로서는 만능 AI를 만들 수 없습니다. 하지만 다행히도 프로그래머들은 실업할 걱정을 하지 않아도 됩니다. AI 뒤에는 여전히 많은 프로그래머들이 필요하고, if-else를 작성해야 합니다. 다만 프로그래밍이 처리할 수 있는 비즈니스 경계가 확장되고 있습니다.

두 가지 유형의 AI 에이전트

행사에서 shaw에게 질문했습니다. 시장에는 AI 에이전트에 대한 두 가지 기대가 있습니다. 1) AI 에이전트가 자신의 역할을 수행하며 자신의 ID, 브랜드를 가지고 사용자에게 서비스를 제공하는 것, 2) 사용자가 개인 AI 에이전트를 가지고 있어 이를 통해 업무를 처리할 수 있는 개인 비서와 같은 것입니다. 이 두 가지 AI 에이전트 중 어느 것이 더 인기가 있을까요? 그는 두 가지 방향 모두 좋을 것 같고, 결합될 수도 있다고 생각했습니다.

현재 시장에서 주로 탐색되고 있는 것은 첫 번째 방향입니다. 이 방향은 서비스 AI 에이전트화와 유사하며, 미래에는 앱 인터페이스가 사라지고 모든 것이 AI 에이전트화, 의인화될 수 있습니다. 두 번째 방향은 애플리케이션 클라이언트의 에이전트화입니다. 미래의 애플리케이션 클라이언트는 개인 에이전트의 플러그인이 될 것이며, 로컬 데이터가 에이전트의 메모리 일부가 되고, 이 플러그인이 클라우드 서비스 에이전트와 통신할 것입니다. 이는 새로운 애플리케이션 아키텍처 모델이 될 것이며, 전체 기반 시설을 변화시킬 것입니다.

AI 에이전트에 대한 기반 시설의 요구사항

1. 기반 시설은 비허가형(Permissionless)이어야 합니다. 그렇지 않으면 AI 에이전트가 다양한 방어 전략에 의해 제한될 것입니다. 서비스는 경제적 비용(Gas)으로 방어되어야 합니다. 이 부분에서 개방성이 낮은 플랫폼은 큰 타격을 받을 것입니다. Web2 초기의 개방 플랫폼 열풍이 다시 점화될 것입니다.

2. AI 에이전트는 자금을 운용할 수 있어야 합니다.

즉, 미래의 서비스는 블록체인 기반이든 아니든 암호화폐 개인 키 인증 및 암호화폐 결제를 지원해야 합니다.

AI 에이전트와 블록체인의 결합

앞서 언급한 두 가지 외에도, AI 에이전트와 블록체인의 결합은 많은 사람들이 탐색하고 있는 방향입니다. 행사에서 Mikkke와 대화하면서 그가 진행 중인 focEliza 프로젝트에 대해 알게 되었습니다. 앞서 언급한 두 가지 유형의 AI 에이전트, 특히 첫 번째 유형은 블록체인이 제공하는 실행 또는 검증 환경이 필요할 것입니다. 왜냐하면 AI 에이전트가 대외적으로 서비스를 제공하게 되면 신뢰 문제가 발생하기 때문이며, 실제로 그 역할은 스마트 계약과 유사합니다.

'스마트 계약'이라는 용어에 대해 과거에 논란이 있었습니다. 그것은 단순한 코드일 뿐 어디가 '스마트'한지 모호했습니다. AI를 통해 스마트 계약이 실제로 '스마트'해질 수 있습니다. 문제는 스마트 계약 환경에서 AI 인터페이스를 어떻게 호출할 것인가입니다. 대규모 모델을 검증 가능한 환경에서 실행하는 것은 아직 멀어 보이지만, Oracle과 유사한 솔루션이 더 현실적인 경로일 것입니다.

AI 에이전트를 중심으로 많은 요구사항이 파생될 것입니다. AI 에이전트의 공통 지식은 어떻게 얻을 것인가? AI 에이전트는 사실을 어떻게 판단할 것인가? AI 에이전트는 다른 플랫폼의 동일한 사용자를 어떻게 식별할 것인가? 스마트 계약의 '기억'은 어떻게 저장할 것인가? 내가 여러 기기에 AI 에이전트를 설치했다면 그들은 어떻게 기억을 공유할 것인가?

이를 통해 원래 Web3에서 다뤘던 '데이터 체인화', '관계 체인화', DID, P2P 네트워크 등이 새로운 의미와 시나리오를 가지게 될 것임을 알 수 있습니다.

결론

2021년 AI와 블록체인에 대한 발표의 결론을 다시 사용하겠습니다. AI에 더 우호적인 인터넷은 인간에게도 더 우호적인 인터넷입니다. 당시에는 단순한 아이디어에 불과했지만, 이제 미래가 도래했습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트