AIGC가 콘텐츠 생성의 지능형 시대를 열었다면 AI Agent는 AIGC의 기능을 실제로 제품화할 수 있는 기회를 갖게 됩니다.
AI Agent는 좀 더 구체적인 만능 직원과 같은 존재로, 인간처럼 자동으로 주변 환경을 관찰하고 결정하고 행동할 수 있는 인공지능 로봇의 기본 형태다.
빌 게이츠는 “AI 에이전트를 제어하는 것이 진정한 성과다. 그때쯤이면 더 이상 온라인에서 직접 정보를 검색할 필요가 없게 될 것”이라고 직설적으로 말한 적이 있다. AI 에이전트. 마이크로소프트 CEO 사티아 나델라는 AI 에이전트가 사용자의 요구를 이해하고 선제적으로 서비스를 제공할 수 있는 인간-컴퓨터 상호작용의 주요 수단이 될 것이라고 예측한 바 있다. 또한 Ng Enda 교수는 미래 업무 환경에서는 인간과 AI 에이전트가 더욱 긴밀하게 협력하여 효율적인 작업 모델을 형성하고 효율성을 향상시킬 것이라고 예측합니다.
AI Agent는 기술의 산물일 뿐만 아니라 미래의 삶과 업무 방식의 핵심이기도 합니다.
이는 Web3와 블록체인이 처음으로 광범위한 논의를 불러일으켰을 때 사람들이 이 기술의 잠재력을 설명하기 위해 "파괴"라는 단어를 자주 사용했다는 사실을 상기시켜 줍니다. 지난 몇 년을 돌이켜보면 Web3는 초기 ERC-20과 영지식 증명에서부터 다른 분야와 통합되는 DeFi, DePIN, GameFi 등으로 점차 발전해 왔습니다.
이슈 디지털 기술인 Web3와 AI를 결합하면 1+1>2 효과가 나타날까요? 점점 더 큰 융자 규모를 갖춘 Web3 AI 프로젝트가 업계에 새로운 사용 사례 패러다임을 가져오고 새로운 실제 요구를 창출할 수 있습니까?
AI 에이전트: 인류를 위한 가장 이상적인 지능형 비서
AI Agent의 상상력은 어디에 있나요? 인터넷에 널리 퍼진 높은 점수의 답변이 있습니다. "큰 언어 모델은 뱀만 프로그래밍할 수 있지만 AI 에이전트는 영광의 왕 전체를 프로그래밍할 수 있습니다."
에이전트는 일반적으로 중국에서 "지능형 신체"로 번역됩니다. 이 개념은 '인공지능의 아버지'로 불리는 민스키가 1986년 출간한 저서 '사고의 사회'에서 제시한 것이다. 민스키는 사회의 특정 개인이 협상을 통해 특정 문제에 대한 해결책을 생각해 낼 수 있다고 믿었다. 에이전트입니다. 수년 동안 에이전트는 Microsoft의 편집 도우미인 Clippy부터 Google Docs의 자동 제안에 이르기까지 인간과 컴퓨터 간의 상호 작용의 초석 역할을 해왔습니다. 이러한 초기 형태의 에이전트는 개인화된 상호 작용의 가능성을 보여 주었지만 더 복잡한 작업을 처리하는 능력은 매우 뛰어났습니다. 여전히 제한적입니다. LLM(대규모 언어 모델)이 등장한 후에야 에이전트의 진정한 잠재력을 활용할 수 있었습니다.
올해 5월, AI 분야의 권위 있는 학자인 Andrew Ng 교수는 미국 Sequoia AI 행사에서 AI Agent에 대한 연설을 했으며, 그의 팀이 수행한 일련의 실험을 보여주었습니다.
AI가 일부 코드를 작성하고 실행하고 다양한 LLM 및 워크플로의 결과를 비교하게 하세요. 결과는 다음과 같습니다.
GPT-3.5 모델: 정확도 48%
GPT-4 모델: 정확도 67%
GPT-3.5 + 에이전트: GPT-4 모델보다 높은 성능
GPT-4 + 에이전트: GPT-4 모델보다 훨씬 높음, 매우 좋음
물론. 대부분의 사람들이 ChatGPT와 같은 LLM을 사용할 때 방법은 일반적으로 프롬프트 단어를 입력하면 오류를 자동으로 식별 및 수정하거나 삭제 및 다시 작성하지 않고 대형 모델이 즉시 답변을 생성하는 것입니다.
이에 비해 AI 에이전트 워크플로는 다음과 같습니다.
먼저 LLM이 기사 개요를 작성하도록 합니다. 필요한 경우 먼저 인터넷에서 연구 및 분석을 위한 콘텐츠를 검색하고 첫 번째 초안을 출력한 다음 초안을 읽고 이를 최적화하는 방법을 생각합니다. 이 주기는 여러 번 반복됩니다. 최종적으로 오류율이 가장 낮은 논리적이고 엄격한 고품질 기사를 출력합니다.
AI Agent와 LLM의 차이점은 LLM과 인간의 상호 작용이 프롬프트 단어(prompt)를 기반으로 한다는 점을 알 수 있습니다. AI 에이전트는 목표만 설정하면 되며, 독립적으로 생각하고 목표에 따라 행동할 수 있다. 주어진 작업에 따라 계획의 각 단계를 세부적으로 세분화하고, 외부 세계의 피드백과 독립적인 사고에 의존하여 목표 달성을 위한 프롬프트를 스스로 생성하세요.
따라서 OpenAI의 AI 에이전트 정의는 LLM이 두뇌로 구동되는 시스템으로, 인식, 계획, 기억 및 도구 사용을 자율적으로 이해하고 복잡한 작업을 자동으로 실행할 수 있는 능력을 갖춘 시스템입니다.
AI가 도구를 사용하는 주체에서 도구를 사용할 수 있는 주체로 변화하면 AI Agent가 된다. 이것이 바로 AI Agent가 인간에게 가장 이상적인 지능형 비서가 될 수 있는 이유입니다. 예를 들어 AI 에이전트는 사용자의 과거 온라인 상호 작용을 기반으로 사용자의 관심사, 선호도, 일상 습관을 이해하고 기억하고, 사용자의 의도를 파악하고, 적극적으로 제안하고, 여러 애플리케이션을 조정하여 작업을 완료할 수 있습니다.
Gates의 비전과 마찬가지로 미래에는 더 이상 다양한 작업을 위해 다른 애플리케이션으로 전환할 필요가 없습니다. 사용자가 원하는 데이터를 기반으로 컴퓨터와 휴대전화에 일상적인 언어만 사용하면 됩니다. 공유를 위해 AI Agent가 맞춤형 응답을 제공합니다.
1인 유니콘이 현실이 되고 있다
AI Agent는 또한 기업이 "인간-기계 협업"을 핵심으로 하는 새로운 지능형 운영 모델을 생성하는 데 도움을 줄 수 있습니다. 점점 더 많은 업무 활동이 AI로 완료되는 반면, 인간은 기업 비전, 전략 및 중요한 경로 결정에만 집중하면 됩니다.
OpenAI CEO인 샘 알트먼(Sam Altman)이 인터뷰에서 이런 설득력 있는 관점 언급한 것처럼, AI의 발전과 함께 우리는 이제 1인이 창업해 10억 명에 달하는 기업인 '1인 유니콘' 시대로 접어들고 있다 . 회사의 가치는 미국 달러로 평가됩니다.
환상처럼 들리지만, AI Agent의 도움으로 이 관점 현실이 되고 있습니다.
우리가 기술 스타트업을 시작하고 싶다고 가정해 보겠습니다. 전통적인 접근 방식에서는 당연히 소프트웨어 엔지니어, 제품 관리자, 디자이너, 마케팅 담당자, 영업 및 재무 담당자를 고용해야 합니다. 이들은 모두 각자의 업무를 수행하지만 제가 조정합니다.
그래서 AI Agent를 사용하면 직원을 고용할 필요도 없을 수도 있습니다.
Devin — 자동화 프로그래밍
소프트웨어 엔지니어 대신 올해 인기를 끈 AI 소프트웨어 엔지니어 데빈(Devin)을 활용하면 프론트엔드와 백엔드 작업을 모두 완료하는 데 도움이 될 수 있다.
Devin은 Cognition Labs에서 개발했으며 "세계 최초의 AI 소프트웨어 엔지니어"로 알려져 있습니다. 전체 소프트웨어 개발 작업을 독립적으로 완료하고, 문제를 분석하고, 결정을 내리고, 코드를 작성하고, 오류를 수정할 수 있으며 이 모든 작업을 독립적으로 실행할 수 있습니다. 이는 개발자의 작업량을 크게 줄여줍니다. Devin은 단 6개월 만에 1억 9,600만 달러의 융자 조달했으며 그 가치는 빠르게 수십억 달러로 치솟았습니다. 투자자에는 Founders Fund 및 Khosla Ventures와 같은 유명 리스크 회사가 포함됩니다.
Devin은 아직 공개 버전을 출시하지 않았지만 최근 인기를 얻고 있는 또 다른 Web2 제품인 Cursor에서 그 잠재력을 엿볼 수 있습니다. 거의 모든 작업을 수행하므로 간단한 아이디어를 몇 분 안에 기능적인 코드로 변환하고 명령을 내리고 "편히 앉아서 결과를 즐기십시오". 8세 어린이가 프로그래밍 경험이 전혀 없어도 Cursor를 사용하여 코딩 작업을 완료하고 웹사이트를 구축했다는 보고가 있습니다.
Hebbia — 파일 처리
제품 관리자나 재무 담당자 대신 모든 문서를 정리하고 분석하는 데 도움을 줄 수 있는 Hebbia를 선택할 수도 있습니다.
기업 내 문서 검색에 중점을 둔 Glean과 달리, Hebbia Matrix는 다양한 AI 모델을 활용하여 사용자가 데이터와 문서를 효율적으로 클레임, 구조화, 분석할 수 있도록 지원함으로써 기업 생산성 향상을 도모하는 기업 수준의 AI Agent 플랫폼입니다. . Matrix가 한 번에 얼마나 많은 문서를 처리할 수 있는지는 정말 인상적입니다.
Hebbia는 a16z가 주도하고 Google Ventures, Peter Thiel 등 유명 투자자들이 참여한 가운데 올해 7월 1억 3천만 달러 규모의 시리즈 B 라운드를 완료했습니다.
Jasper AI — 콘텐츠 생성
소셜 미디어 운영 및 디자이너 대신 콘텐츠 생성에 도움이 될 수 있는 Jasper AI를 선택할 수도 있습니다.
Jasper AI는 창작자, 마케팅 담당자 및 기업이 콘텐츠 생성 프로세스를 간소화하고 생산성과 생성 효율성을 향상할 수 있도록 설계된 AI 에이전트 작성 도우미입니다. Jasper AI는 블로그 게시물, 소셜 미디어 게시물, 광고 문구, 제품 설명 등을 포함하여 사용자가 요청한 스타일을 기반으로 다양한 유형의 콘텐츠를 생성할 수 있습니다. 그리고 사용자 설명을 기반으로 이미지를 생성하여 텍스트 콘텐츠에 대한 시각적 자료를 제공합니다.
Jasper AI는 1억 2,500만 달러의 융자 받았으며 2022년에 15억 달러의 가치를 달성했습니다. 통계에 따르면 Jasper AI는 사용자가 5억 개 이상의 단어를 생성하도록 도왔으며 가장 널리 사용되는 AI 작성 도구 중 하나가 되었습니다.
MultiOn — 웹 페이지 자동화
보조자 대신 MultiOn을 선택하면 일상 업무 관리, 일정 조정, 알림 설정, 심지어 출장 계획까지 도와주고, 호텔을 자동으로 예약하고, 온라인 차량 공유를 자동으로 준비할 수 있습니다.
멀티온(MultiOn)은 온라인 쇼핑, 약속 잡기 등의 개인 업무를 완료하도록 돕고, 개인 효율성을 높이며, 일상 업무를 단순화하고 업무 효율을 높이는 등 어떤 디지털 환경에서도 자율적으로 업무를 수행할 수 있도록 도와주는 자동화된 네트워크 업무 AI 에이전트이다.
당혹감 - 검색, 연구
연구원 대신 엔비디아 CEO가 매일 사용하는 퍼플렉시티(Perplexity)를 선택할 것 같다.
퍼플렉시티(Perplexity)는 사용자의 질문을 이해하고 세분화한 후 콘텐츠를 검색 및 통합하고 보고서를 생성하여 사용자에게 명확한 답변을 제공하는 AI 검색 엔진입니다.
Perplexity는 다양한 사용자 그룹에 적합합니다. 예를 들어, 학생과 연구자는 글을 작성할 때 정보 검색 프로세스를 단순화하고 마케팅 담당자는 마케팅 전략을 지원하는 신뢰할 수 있는 데이터를 얻을 수 있습니다.
위의 내용은 단지 상상일 뿐입니다. 이들 AI 에이전트의 실제 능력과 수준은 아직 각계의 엘리트 인재를 대체하기에는 충분하지 않습니다. Lgenic AI의 공동 창립자인 Li Bojie가 말했듯 이 현재 LLM의 기능은 초보 수준에 불과하며 전문가 수준과는 거리가 멀습니다. 현재 AI 에이전트는 빠르게 일하지만 별로 신뢰할 수 없는 직원에 가깝습니다.
그러나 이들 AI 에이전트는 각자의 전문성을 바탕으로 기존 사용자가 다양한 시나리오에서 효율성과 편의성을 향상시키는 데 도움을 주고 있습니다.
기술 회사뿐만 아니라 모든 계층이 AI 에이전트의 물결로 혜택을 누릴 수 있습니다. 교육 분야에서는 금융 분야에서 AI 에이전트가 학생의 학습 진행 상황, 관심도, 능력을 바탕으로 맞춤형 학습 리소스와 튜터링을 제공할 수 있으며, AI 에이전트는 사용자의 개인 재정 관리, 투자 조언 제공, 심지어 주식 추세 예측까지 도울 수 있습니다. 의료 분야에서 AI 에이전트는 전자상거래 분야에서 의사가 질병을 진단하고 치료 계획을 수립하는 데 도움을 줄 수 있으며, 자연어를 통해 사용자 문의에 자동으로 응답하고 주문 문제를 처리하며 반품 요청을 처리하는 지능형 고객 서비스 역할도 할 수 있습니다. 처리 및 머신러닝(ML) 기술을 통해 고객 서비스 효율성을 향상합니다.
멀티 에이전트: AI 에이전트를 위한 다음 단계
1인 유니콘 기업의 아이디어에 대한 이전 섹션에서 단일 AI 에이전트는 복잡한 작업을 처리할 때 한계에 직면하고 실제 요구 사항을 충족하기 어렵습니다. 여러 AI 에이전트를 사용하는 경우 이러한 AI 에이전트는 이종 LLM을 기반으로 하기 때문에 집단적인 의사 결정이 어렵고 기능이 제한되므로 인간은 이러한 독립적인 AI 에이전트 사이에서 스케줄러 역할을 수행하여 다양한 응용 프로그램 시나리오를 제공하는 AI 에이전트를 조정해야 합니다. .일하러 가세요. 이로 인해 "다중 에이전트(다중 에이전트 프레임)"가 등장했습니다.
복잡한 문제에는 여러 측면의 지식과 기술의 통합이 필요한 경우가 많으며, 단일 AI 에이전트는 기능이 제한되어 처리하기 어렵습니다. 멀티 에이전트 시스템은 다양한 능력을 지닌 AI 에이전트를 유기적으로 결합해 AI 에이전트가 각자의 강점을 활용하고, 서로의 장점을 학습해 복잡한 문제를 보다 효과적으로 해결할 수 있도록 해준다.
이는 실제 업무 프로세스나 조직 구조와 매우 유사합니다. 리더가 작업을 할당하고, 서로 다른 능력을 가진 사람들이 서로 다른 작업을 담당하며, 각 프로세스의 결과가 다음 프로세스에 전달되고 최종적으로 최종 작업 결과가 얻어집니다. .
구현 과정에서 하위 AI 에이전트는 각자의 작업을 수행하고, 상위 AI 에이전트는 작업을 할당하고 완료를 감독합니다.
다중 에이전트는 인간의 의사 결정 프로세스를 시뮬레이션할 수도 있으며 문제가 발생할 때처럼 다른 사람의 조언을 구할 수도 있습니다. 다중 AI 에이전트도 집단적 의사 결정 동작을 시뮬레이션하고 더 나은 정보 지원을 제공할 수 있습니다. 예를 들어 Microsoft에서 개발한 AutoGen은 다음 요구 사항을 충족합니다.
다양한 역할을 가진 AI 에이전트를 생성하는 기능. 이러한 AI 에이전트는 기본적인 대화 기능을 갖추고 있으며 수신된 메시지를 기반으로 응답을 생성할 수 있습니다.
GroupChat을 사용하면 여러 AI Agent가 참여하는 그룹 채팅 환경을 만들 수 있습니다. 이 GroupChat에는 다른 AI Agent의 채팅 기록, 화자 순서, 음성 종료 등을 관리하는 관리자 역할의 AI Agent가 있습니다.
1인 유니콘 기업의 아이디어에 적용하면 Multi-Agent 아키텍처를 통해 프로젝트 관리자, 프로그래머, 감독자 등 서로 다른 역할을 가진 여러 AI Agent를 생성할 수 있습니다. 우리의 목표를 알려주고 어떻게 해야 할지 알려면 됩니다. 우리가 이의가 있거나 잘못된 일이 있다고 생각되면 만족할 때까지 변경하도록 하십시오.
단일 AI 에이전트와 비교하여 다중 에이전트는 다음을 달성할 수 있습니다.
확장성: 대규모 문제를 처리하기 위해 AI 에이전트 수를 늘려 각 AI 에이전트가 작업의 일부를 처리하므로 수요 증가에 따라 시스템을 확장할 수 있습니다.
병렬성: 자연스럽게 병렬 처리를 지원하며, 여러 AI 에이전트가 동시에 문제의 서로 다른 부분을 처리할 수 있으므로 문제 해결 속도가 빨라집니다.
의사 결정 개선: 각각 고유한 관점과 전문 지식을 가진 여러 AI 에이전트의 통찰력을 집계하여 의사 결정을 향상합니다.
AI 기술이 계속 발전함에 따라 다중 에이전트 프레임 더 많은 산업에서 더 큰 역할을 수행하고 다양한 새로운 AI 기반 솔루션의 개발을 촉진할 것으로 예상됩니다.
Web3를 향해 AI Agent의 바람이 불다
실험실을 벗어나면 AI Agent와 Multi-Agent의 갈 길이 멀다.
현재로서는 다중 에이전트에 관계없이 가장 발전된 단일 AI 에이전트라도 현재 물리적 수준에서 필요한 해시레이트 리소스와 컴퓨팅 성능에 대한 명확한 상한선이 있으며 무한히 확장할 수 없습니다. 극도로 복잡하고 계산 집약적인 작업에 직면하게 되면 AI 에이전트는 의심할 여지없이 컴퓨팅 성능 병목 현상 에 직면하게 되고 성능이 크게 저하됩니다.
또한 AI 에이전트 및 다중 에이전트 시스템은 본질적으로 중앙 집중식 아키텍처 모델 이므로 단일 실패 리스크 매우 높다고 판단됩니다. 더 중요한 것은 비공개 소스 대형 모델을 기반으로 하는 OpenAI, Microsoft, Google 및 기타 기업의 독점 비즈니스 모델이 독립적이고 단일한 AI 에이전트 스타트업의 생존 환경을 심각하게 위협하고 있어 AI 에이전트가 대규모 기업 개인 데이터를 성공적으로 활용하는 것을 불가능하게 한다는 것입니다. 더 똑똑하고 효율적으로 만들어 보세요. 진정으로 가치 있는 AI 에이전트가 필요로 하는 더 넓은 범위의 사람들에게 서비스를 제공하고 사회를 위해 더 큰 가치를 창출할 수 있도록 AI 에이전트 간의 민주적 협업 환경이 시급히 필요합니다.
마지막으로, AI Agent는 LLM보다 업계에 더 가깝지만 LLM을 기반으로 개발됩니다. 그러나 현재의 대형 모델 트랙은 높은 기술 한계, 막대한 자본 투자 및 미성숙한 비즈니스 모델을 확보하기 어려운 것이 특징입니다. . 계속 업데이트하고 반복하기 위한 융자.
다중 에이전트 패러다임은 Web3가 AI를 돕기 위한 탁월한 관점입니다. 많은 Web3 개발 팀은 이미 이러한 영역에 솔루션을 제공하기 위해 연구 개발에 투자하고 있습니다.
AI 에이전트 및 멀티 에이전트 시스템은 일반적으로 복잡한 의사 결정 및 처리 작업을 수행하기 위해 대량 의 컴퓨팅 리소스가 필요합니다. Web3는 블록체인과 탈중앙화 기술을 통해 탈중앙화 해시레이트 시장을 구축할 수 있으므로 해시레이트 자원이 글로벌 규모에서 보다 공정하고 효율적으로 분배되고 활용될 수 있습니다. Akash, Nosana, Aethir 및 IO.net과 같은 Web3 프로젝트는 AI Agent 의사 결정 및 추론을 위한 컴퓨팅 기능을 제공할 수 있습니다.
기존 AI 시스템은 중앙 집중식으로 관리되는 경우가 많아 AI 에이전트가 단일 실패 지점 및 데이터 개인 정보 보호 문제에 직면하게 됩니다. Web3의 탈중앙화 특성으로 인해 다중 에이전트 시스템이 더욱 분산되고 자율적으로 실행될 수 있습니다. 서버에서는 사용자가 제시한 요구 사항이 자율적으로 실행되어 견고성과 보안이 향상됩니다. PoS, DPoS 및 기타 메커니즘을 통해 스테이킹 와 위임자를 위한 인센티브 및 처벌 메커니즘을 구축하면 단일 AI 에이전트 또는 다중 에이전트 시스템의 민주화를 촉진할 수 있습니다.
이런 점에서 GaiaNet, Theoriq, PIN AI, HajimeAI는 모두 매우 최첨단 시도를 하고 있습니다.
Theoriq은 Agentic Protocol을 통해 AI 에이전트를 위한 호출 및 경제 시스템을 구축하고 Web3 및 다양한 기능 시나리오의 개발을 대중화하며 Web3 dApp에 대한 검증 가능한 모델 추론 기능을 제공하는 "AI for Web3"을 제공하는 프로젝트입니다.
GaiaNet은 중앙집중화된 OpenAI GPT Store와 경쟁하기 위해 전문가와 사용자의 지적재산권과 데이터 프라이버시를 보호하는 것을 출발점으로 하는 노드 기반 AI Agent 생성 및 배포 환경입니다.
하지메AI는 이 두 가지를 바탕으로 PIN AI가 언급한 'AI 지능의 개인화'를 반영해 실제 요구에 따른 AI 에이전트 워크플로우를 구축하고 의도 자체를 지능화, 자동화하기 위해 노력하고 있다.
동시에 Modulus Labs와 ORA Protocol은 각각 AI Agent의 zkML 및 opML 알고리즘 방향에서 진전을 이루었습니다.
마지막으로, AI 에이전트 및 다중 에이전트 시스템의 개발 및 반복에는 대량 의 재정적 지원이 필요한 경우가 많으며 Web3는 잠재적인 AI 에이전트 프로젝트가 프런트로드 유동성 기능을 통해 귀중한 초기 지원을 얻을 수 있도록 도울 수 있습니다.
Spectral과 HajimeAI는 모두 온체인 AI Agent 자산 발행을 지원하는 제품 개념을 제안했습니다. IAO(Initial Agent Offering) 토큰 발행을 통해 AI Agent는 투자자로부터 직접 자금을 얻는 동시에 DAO의 회원이 될 수 있습니다. 거버넌스는 투자자에게 프로젝트 개발에 참여하고 미래 이익을 공유할 수 있는 기회를 제공합니다. 그 중 HajimeAI의 Benchmark DAO는 크라우드 펀딩과 토큰 인센티브를 통해 탈중앙화 AI 에이전트 스코어링과 AI 에이전트 자산 발행을 유기적으로 결합하여 Web3 융자 과 콜드 스타트에 의존하는 AI 에이전트의 폐쇄 루프를 만드는 것을 희망하고 있으며, 이 역시 비교적 새로운 시도입니다.
AI 판도라의 상자가 열렸고, 그 안에 있는 모두는 흥분과 혼란을 동시에 겪고 있다. 그 열풍이 기회인지 숨겨진 위험인지는 누구도 알 수 없다. 이제 각계각층은 더 이상 PPT 융자 의 시대가 아닙니다. 아무리 첨단 기술이라도 구현이 되어야만 가치를 실현할 수 있습니다. AI Agent의 미래는 장거리 마라톤이 될 것이며 Web3는 이 경주에서 그것이 사라지지 않도록 보장합니다.