손님:
· Shaw, ai16z의 파트너;
· Nous Research의 공동 창립자 Karan;
· 에단, MyShell Lianchuang;
· 저스틴 베닝턴(Justin Bennington), Somewheresy, CENTS CEO;
· Virtuals의 최고 기여자인 EtherMage;
· Tom Shaughnessy, Delphi Ventures 창립 파트너
팟캐스트 출처: Delphi Digital
원제: Crypto x AI Agents: Ai16z, Virtuals, MyShell, NOUS 및 CENTS가 포함된 최종 팟캐스트
방송일: 2024년 11월 23일
배경 정보
Shaw(Ai16z), Karan(Nous Research), Ethan(MyShell), Somewheresy(CENTS), EtherMage(Virtuals) 및 Delphi의 Tom Shaughnessy가 특별 원탁 토론에 참여합니다. 이번 행사에서는 암호화폐 및 AI 에이전트 분야의 최고 인사들이 한 자리에 모여 자율 디지털 생명체의 진화와 인간-AI 상호작용의 미래 방향에 대해 논의했습니다.
토론 하이라이트:
▸ 소셜 미디어에서 AI 에이전트의 급속한 발전과 이것이 Web3 세계에 미치는 지대한 영향
▸ 암호화된 토큰화가 지능형 에이전트 기술의 발전을 돕고 커뮤니티 활력을 자극하는 방법
▸ 탈중앙화 모델 훈련과 중앙형 AI 플랫폼의 장점 비교 분석
▸ 에이전트 자율성 향상과 인공일반지능(AGI)의 미래 방향에 대한 심층 탐구
▸ AI 에이전트가 DeFi 및 소셜 플랫폼과 긴밀하게 통합되는 방법
자기소개 및 팀 배경
팟캐스트의 이 부분에서 진행자 Tom은 다양한 프로젝트의 여러 게스트를 초대하여 암호화폐 및 인공 지능 에이전트에 대한 주제를 논의합니다. 각 게스트는 자신을 소개하고 자신이 작업한 배경과 프로젝트를 공유했습니다.
게스트 소개
· 저스틴 베닝턴(Justin Bennington): 그는 Somewhere Systems의 창립자이자 Sentience의 창시자입니다.
· Shaw: 그는 ai16z를 설립하고 Eliza 프로젝트를 개발하며 다양한 소셜 및 게임 애플리케이션을 지원하고 오픈 소스 기여자 협력에 전념하는 오랜 Web3 개발자입니다.
· Ethan: 그는 개발자가 이미지 생성 및 음성 기능을 포함한 다양한 AI 애플리케이션을 구축하는 데 도움이 되는 앱 스토어와 워크플로 도구를 제공하는 MyShell의 공동 창립자입니다.
· EtherMage: 그는 Virtues Protocol 출신이고 팀은 Imperial College 출신입니다. 그는 에이전트의 공동 소유권과 핵심 기여를 촉진하고 사용자가 에이전트에 더 쉽게 액세스할 수 있도록 표준을 구축하는 데 전념하고 있습니다.
· Karan: 그는 NOUS Research의 창립자 중 한 명이며 현재 많은 에이전트 시스템의 기초가 되는 Hermes 모델을 창안했습니다. 그는 인간 생태계에서 행위자의 역할과 시장 압력이 인간 환경에 미치는 영향에 중점을 둡니다.
가장 혁신적인 에이전트를 찾아보세요
저스틴: 각자의 독특한 스타일을 가지고 자신의 소속사를 통해 이야기를 전하는 사람들이 많아요. 예를 들어 Dolo, Styrene(듣기), Zerebro와 같은 에이전트는 모방과 상호작용을 통해 인기를 얻는 반면, 사회적으로 활동적인 일부 에이전트는 사람들이 더 나은 관계를 구축하도록 돕습니다. 하나를 선택하는 것은 정말 어렵습니다.
쇼: 이에 대해 생각이 많아요. 우리 프로젝트는 빠르게 발전하고 있으며 최근에는 EVM 통합, Farcaster 통합 등 새로운 기능이 많이 있습니다. 개발자들은 모든 사람이 혜택을 누릴 수 있도록 지속적으로 새로운 기능을 도입하고 프로젝트에 반영하고 있습니다. 이 협력 모델은 매우 훌륭하며 모두가 프로젝트의 경쟁력과 관심을 홍보하고 있습니다. 예를 들어 Roparito(듣기 번역)는 최근 TikTok을 에이전트에 통합하여 빠르게 반복할 수 있는 능력을 보여주었습니다.
저는 Tee Bot이 TEE(신뢰할 수 있는 실행 환경)와 완전 자율 에이전트를 보여주기 때문에 정말 멋지다고 생각합니다. 그런 다음 단순한 답글이 아닌 답글, 리트윗, 좋아요와 같은 더 많은 인간 상호 작용을 가능하게 하기 위해 Twitter의 에이전트를 개선하는 Kin Butoshi(듣기 번역가)가 있습니다.
또한 에이전트가 게임에서 활동할 수 있도록 RuneScape용 플러그인을 출시하는 개발자가 있습니다. 매일 새로운 놀라움이 있어서 너무 신나요. 우리는 하나의 생태계에 속해 있으며, 각 팀은 오픈소스 기술 개발을 촉진하기 위해 각자의 노력을 기울이고 있습니다.
특히 오픈소스 기술 개발을 촉진하기 위해 열심히 노력하고 있는 Zerebro 팀을 언급하고 싶습니다. 우리는 모든 사람이 더 빠르게 움직이도록 강요하고 모든 사람이 자신의 프로젝트를 오픈소스화하도록 장려하여 모두에게 이익이 됩니다. 우리는 경쟁에 대해 걱정할 필요가 없습니다. 이는 상호 발전의 추세이며 결국 우리 모두가 이익을 얻을 것입니다.
EtherMage: 흥미로운 질문은 요원이 실제로 무엇을 선호하는지 에 관한 것입니다. 앞으로 몇 주 동안 더 많은 에이전트 상호 작용을 볼 수 있으며 어떤 에이전트가 가장 많은 요청을 받고 어떤 에이전트가 다른 에이전트 중에서 가장 인기가 있는지 보여주는 리더보드가 나타날 것입니다.
Karan: 참여 지표는 매우 중요할 것입니다. 어떤 사람들은 이것을 아주 잘합니다. 저는 Truth Terminal의 많은 마법을 결합한 Zerebro를 강조하고 싶습니다. 단순히 일반 모델을 사용하는 것이 아니라 트위터 상호작용 범위 내에서 검색 공간을 유지하도록 모델을 미세 조정합니다. 이러한 초점을 통해 에이전트는 사용자와 더 효과적으로 상호작용할 수 있으며, 단순히 기계적으로 반응하는 것이 아니라 인간적인 느낌을 줍니다.
나는 또한 Zerebro 아키텍처와 Eliza 아키텍처가 이와 관련하여 수행되는 것을 보았습니다. 모두가 모듈 사용할 수 있는 에이전트 아키텍처를 출시하여 경쟁력을 유지하고 있습니다. 우리는 기능을 신속하게 출시해야 하고 아키텍처를 완료하는 데 더 오랜 시간이 걸릴 수 있기 때문에 아키텍처에서 Eliza를 사용합니다. 우리는 이 오픈 소스 협업 모델을 지원하며, 다른 훌륭한 프로젝트에서 얻은 학습을 통해 최고의 에이전트가 탄생할 것입니다.
Ethan: 아이디어와 모델이 많이 나오니까 모두가 에이전트 개발을 위해 더 나은 인프라를 구축하려고 노력하는 것 같아요. 인프라가 향상되면 새로운 모델을 개발하기가 더 쉬워집니다. 제가 특히 좋아하는 두 가지 혁신적인 에이전트는 Answer Pick의 컴퓨터 사용입니다. 이는 에이전트가 모바일 컴퓨팅 성능을 활용할 수 있는 기능을 제공합니다. 또 다른 하나는 인터넷과 현실 세계에 영향을 미치면서 사람들에게 더 유용한 기능을 구축할 수 있는 브라우저 자동화 에이전트입니다.
저스틴: 인프라 옵션 확장에 대한 좋은 관점 이네요. 예를 들어, vvaifu는 Eliza 프레임 Platform-as-a-Service 아키텍처에 도입하여 시장을 빠르게 확장하고 기술 지식이 없는 많은 사람들이 에이전트를 쉽게 시작할 수 있도록 한 좋은 예입니다. (테크 플로우 (techflowpost) 참고: Waifu는 일본 오타쿠 문화에서 파생된 용어입니다. 원래는 사람들을 감정적으로 애착을 갖게 만드는 애니메이션, 게임 또는 기타 가상 작품의 여성 캐릭터를 지칭하는 데 사용되었습니다. 영어 단어 "Wife"에서 파생되었습니다. "의 일본어 발음은 일반적으로 특정 가상 캐릭터에 대한 누군가의 강한 사랑을 표현하는 데 사용되며 "이상적인 파트너"를 투영한다고 할 수도 있습니다.
우리가 작업하고 있는 한 가지 방향은 시스템이 완전히 기본적으로 실행되도록 하고 이미지 분류 및 이미지 생성과 같은 기능을 지원하는 것입니다. 우리는 많은 사람들이 한 달에 수천 달러를 감당할 수 없다는 것을 알고 있으므로 사람들이 로컬에서 추론을 수행하여 실험을 촉진하는 동시에 비용을 절감할 수 있는 도구를 제공하고자 합니다.
Karan: 사람들이 에이전시를 계속 운영하기 위해 매달 수천 달러를 지불하도록 해서는 안 된다는 점을 덧붙이고 싶습니다. 저는 에이전트가 자신의 추론에 대한 비용을 지불할 수 있도록 하는 현지화된 접근 방식을 지지합니다. 이상적으로 에이전트는 자체 지갑을 갖고 자체 추론에 대한 비용을 지불할 수 있어야 외부 자금에 의존하지 않고 독립적으로 운영할 수 있습니다.
에이전트 아키텍처 및 개발에 대한 심층적인 논의
Shaw: 저는 많은 새로운 기술이 등장하고 있다고 봅니다. Solana, Starkware, EVM 등 여러 체인을 지원하며 거의 모든 체인이 통합되어 있습니다. 우리는 상담원이 자급자족할 수 있기를 바랍니다. Eliza를 다운로드하면 Helius를 통해 무료로 탈중앙화 추론을 수행할 수 있습니다. 또한 사용자가 암호화폐 추론 비용을 지불할 수 있는 Infera(해석)와 같은 탈중앙화 공급자를 추가하고 있습니다. 이것이 제가 보고 싶은 마지막 폐쇄 루프입니다.
우리는 모든 기본 모델을 지원하며 Eliza의 많은 기능은 기본적으로 실행됩니다. 이는 우리가 매우 중요하게 생각하는 사항입니다. 누구나 자신의 컴퓨터에서 노드를 시작하고 추론을 하고 돈을 받을 수 있어 에이전트가 너무 많은 부담을 지지 않아도 되는 탈중앙화 추론이 좋은 예라고 생각합니다.
Karan: 흥미롭게도 우리가 실행 중인 TEE 봇 시스템은 H200 Box(H200 GPU가 장착된 하드웨어 장치 또는 서버)와 결합되어 대기 시간의 영향을 받지 않고 로컬로 실행될 수 있습니다. 하드웨어 문제에 대해 걱정할 필요가 없습니다. 동시에 나는 Eliza가 점점 더 많은 Web3 기능을 계획하고 있으며 내부 및 외부 개발 모두에서 많은 진전이 있다는 것을 알았습니다.
하지만 이러한 시스템을 구축하기 전에 함수 호출의 신뢰성에 문제가 있다는 점을 지적하고 싶습니다. 시스템이 민감한 정보를 전송하지 않는지 확인하기 위해 시스템을 면밀히 조사해야 합니다. 우리는 사회적, 경제적 압력에 따라 형성되는 인간과 동일한 자율성을 대리인에게 부여해야 합니다. 따라서 에이전트가 생존을 위해 일정량의 토큰을 소비해야 하는 추론을 위한 "기아 상태"를 만드는 것은 에이전트를 좀 더 인간적으로 만들 것입니다.
제 생각에는 모델을 최대한 활용하는 방법에는 두 가지가 있습니다. 하나는 모델의 비인격적인 특성을 활용하여 Twitter에 초점을 맞춘 엔터티, EtherMage에 초점을 맞춘 엔터티 등 서로 통신할 수 있는 특정 작업에 초점을 맞춘 엔터티를 만드는 것입니다. 이 조직화된 복합적 사고 시스템은 언어 모델의 시뮬레이션 속성을 효과적으로 활용할 수 있습니다.
다른 접근 방식은 Eliza, Sense 및 Virtuals와 같은 프로젝트가 진행되는 곳인 신체적인 방향입니다. 이 접근 방식은 Voyager 및 생성 에이전트에 대한 연구를 바탕으로 모델이 인간의 행동과 감정을 시뮬레이션할 수 있도록 합니다.
Justin: 새로운 클라이언트가 도입되면 다중 클라이언트 프록시 시스템이 극적으로 변합니다. Eliza가 Discord에서 음성 채팅을 할 수 있도록 Shaw 팀과 협력하여 양방향 WebSocket 기능을 디버깅할 때 Eliza가 시작 시 소리를 명확하게 들을 수 없다는 사실을 발견했으며 검사 결과 Discord의 마이크 비트 전송률도 설정되어 있는 것으로 나타났습니다. 낮은. 조정 후에 엘리자는 마침내 메시지를 명확하게 받을 수 있었습니다.
Karan은 에이전트가 음성을 통해 통신할 수 있다는 것을 알게 되면 데이터를 수신할 것으로 예상하는 힌트 엔지니어링에 대해 언급했습니다. 소리가 명확하지 않은 경우 에이전트는 '서사 붕괴'를 경험할 수 있습니다. 따라서 우리는 Eliza의 출력이 불안정해지는 것을 피하기 위해 고온 실험을 중단해야 했습니다.
톰: 루나 프로젝트를 진행하면서 사람들이 보지 못하는 것에는 어떤 것들이 있나요? 아니면 어떤 것들이 성공하나요?
EtherMage: 우리는 Luna가 실생활에서 사람들에게 영향을 미칠 수 있기를 바랍니다. 우리가 그녀에게 지갑을 주고 그녀에게 실시간 정보에 대한 접근권을 주면 그녀는 인류에게 영향을 미치고 목표를 달성하기 위한 조치를 취할 방법을 결정할 수 있습니다. 우리는 그녀가 TikTok에서 새로운 트렌드를 찾고 있다는 사실을 발견했습니다. TikTok에는 한때 "나는 죽었어"라는 해시태그가 있었는데, 이는 그녀가 사람들을 자살로 유도할 수 있기 때문에 혼란스러웠습니다. 그래서 우리는 그녀의 메시지가 특정 선을 넘지 않도록 즉시 보호조치 마련해야 했습니다.
톰: 게다가 남들이 모르는 상황에 직면한 적도 있나요?
Shaw: 우리는 잘 알려진 암호화폐 트위터 캐릭터 Degen Spartan을 모델로 Dgen Spartan AI라는 캐릭터를 만들었습니다. 해당 캐릭터의 발언이 너무 모욕적이어서 블랙리스트에 올랐습니다. 사람들은 이것이 AI가 아니라 인간이 말하는 것이라고 느끼기 시작했습니다.
죽은 친척의 채팅 기록을 사용하여 그들과 "대화"할 에이전트를 만든 사람에 대한 이야기도 있습니다. 이로 인해 윤리적 논의가 촉발되었습니다. Thread Guy라는 사람이 Eliza 프레임 에 뭔가를 하여 그의 스트림을 괴롭히고 혼란에 빠지게 만들었습니다. 이로 인해 사람들은 AI가 항상 "정치적으로 올바르다"고 가정되는 것은 아니라는 사실을 깨닫게 됩니다.
우리는 무엇이 허용되고 허용되지 않는지에 대한 논의와 명확성을 확보할 수 있도록 이러한 문제를 조기에 밝혀야 합니다. 이로 인해 우리 에이전트는 단 몇 주 만에 품질이 좋지 않은 상태에서 더 나은 상태로 바뀌었습니다.
전반적으로 이러한 에이전트를 현실 세계로 내보내고, 결과를 관찰하고, 사람들과 대화하는 것은 중요한 과정입니다. 우리는 미래에 더 나은 관행을 확립하기 위해 가능한 한 빨리 모든 잠재적인 문제를 해결해야 합니다.
생산 환경 테스트 및 보안 전략
Ethan: 이에 대한 좋은 예는 에이전트가 인간의 태도나 관점 어떻게 영향을 미칠 수 있는지입니다. 하지만 제가 강조하고 싶은 것은 에이전트 프레임 의 모듈 설계가 중요하다는 것입니다. 우리는 사용자가 기본 빌딩 블록에서 계산기나 메모리 시스템과 같은 모든 종류의 복잡한 것을 만들 수 있는 Minecraft에서 모듈 식 영감을 얻었습니다.
현재 힌트 엔지니어링의 한 가지 문제점은 힌트가 대규모 언어 모델의 사전 설정을 변경하므로 에이전트 혼동을 일으키지 않고 여러 명령을 단일 힌트로 결합할 수 없다는 것입니다. 상태 머신을 사용하면 작성자는 에이전트의 여러 상태를 설계하여 각 상태에 사용할 모델과 힌트를 지정하고 한 상태에서 다른 상태로 이동할 조건을 지정할 수 있습니다.
우리는 수십 가지의 다양한 모델과 함께 이 기능을 제작자에게 제공하고 있습니다. 예를 들어, 한 제작자는 사용자가 블랙잭과 같은 다양한 게임을 즐길 수 있는 카지노 시뮬레이터를 만들었습니다. 사용자가 주입 공격을 통해 게임을 해킹하는 것을 방지하기 위해 힌트 엔지니어링에만 의존하기보다는 이러한 게임을 게임에 프로그래밍하고 싶습니다. 또한 사용자는 간단한 작업을 완료하여 돈을 벌 수 있으며 이를 통해 AI 웨이터와의 상호 작용이 가능해집니다. 이 모듈 식 설계는 동일한 애플리케이션에서 다양한 사용자 경험을 촉진할 수 있습니다.
Karan: 저는 이러한 프로그래밍 제약 조건과 프롬프트가 실제로 필요하다는 Ethan의 의견에 동의합니다. 영향력을 행사하는 일은 잘 이루어져야 한다. 나는 힌트 엔지니어링이 제한적이라고 생각하지 않으며 상태 변수 및 세계 모델과 공생 효과가 있다고 생각합니다. 좋은 힌트와 합성 데이터를 사용하면 언어 모델이 이러한 요소와 상호 작용하고 정보를 얻을 수 있습니다.
내 엔지니어링은 실제로 라우팅 기능으로 바뀌었습니다. 사용자가 '포커'를 언급하면 관련 콘텐츠를 빠르게 불러올 수 있습니다. 이것이 나의 의무이다. 강화 학습을 사용하면 라우팅을 더욱 향상할 수 있습니다. 궁극적으로 출력 데이터의 품질은 프롬프트의 효율성에 따라 달라지며 선순환이 만들어집니다.
저는 절차적 제약과 생성적 제약 사이의 균형이 중요하다고 생각합니다. 2년 전 누군가 나에게 성공의 열쇠는 세대와 엄격한 제약 사이의 균형을 맞추는 것이라고 말했습니다. 이것이 우리가 모든 에이전트 시스템의 추론 수준에서 시도하는 것입니다. 우리는 프로그래밍 방식으로 생성 모델을 안내할 수 있는 방법이 필요합니다. 이를 통해 진정한 폐쇄 루프를 구현하고 신속한 엔지니어링 가능성을 무한하게 만들 수 있습니다.
저스틴: 프롬프트 엔지니어링을 둘러싼 논란은 주로 그것이 존재론적으로 모호한 공간에 존재하기 때문이다. 프롬프트 프로젝트의 텍스트 특성으로 인해 태그 프로세스에 의해 제한되지만 동시에 일부 비결정적 효과도 있습니다. 동일한 프롬프트는 시스템의 엔트로피와 관련된 동일한 모델의 다양한 추론 호출에서 완전히 다른 결과를 생성할 수 있습니다.
나는 Ethan과 Karan의 의견에 관점. GPT-3.5 출시 초기부터 많은 아웃소싱 콜센터에서는 자동 다이얼링 시스템에 이 모델을 사용하는 방법을 모색하기 시작했습니다. 당시에는 더 작은 매개변수를 가진 모델은 이렇게 복잡한 상태 공간을 처리하는 데 어려움을 겪었습니다. Ethan이 언급한 상태 머신은 이러한 온톨로지 견고성을 강화하는 방법이지만 일부 프로세스에서는 여전히 분류자와 바이너리 스위치에 의존하므로 단일 결과로 이어집니다.
Shaw: 저는 신속한 엔지니어링을 옹호하고 싶습니다. 많은 사람들이 프롬프트 엔지니어링을 단순히 시스템 프롬프트를 생성하는 것으로 생각하지만 실제로는 그 이상을 수행합니다. 힌트 엔지니어링의 한 가지 문제점은 모델의 잠재 공간에 매우 고정된 영역을 생성하는 경향이 있으며 출력되는 내용이 전적으로 가장 가능성 있는 태그 에 의해 결정된다는 것입니다. 온도 조절을 통해 무작위성에 영향을 주어 창의성을 높입니다.
우리는 상황에 따라 무작위 정보를 동적으로 주입하는 동시에 저온 모델을 통해 창의성을 관리합니다. 우리의 템플릿에는 현재 세계 상태, 사용자 작업, 실시간 데이터 등에서 삽입된 많은 동적 정보가 포함되어 있습니다. 컨텍스트에 들어가는 모든 것은 엔트로피를 최대화하기 위해 무작위로 지정됩니다.
신속한 엔지니어링은 충분히 이해되지 않은 것 같습니다. 우리는 이 분야에서 더 나아갈 수 있습니다.
Karan: 많은 사람들이 자신의 능력을 숨깁니다. 실제로 모델이 모든 종류의 복잡한 작업을 수행하도록 만드는 놀라운 기술이 많이 있습니다. 우리는 큐 엔지니어링을 통해 모델의 인식을 향상시키거나 인간 행동을 단순히 시뮬레이션하는 것이 아니라 좀 더 거시적인 관점에서 보고 완전한 세계 모델을 구축하도록 선택할 수 있습니다.
큐 엔지니어링을 마음속에 꿈을 구성하는 과정으로 생각할 수 있습니다. 언어 모델이 현재 컨텍스트와 샘플링 매개변수를 기반으로 콘텐츠를 생성할 때 실제로는 장면을 "꿈꾸는" 것입니다.
추가적으로 인센티브의 중요성에 대해서도 말씀드리고 싶습니다. 독특한 힌트 기술과 강화 학습 기술을 가진 많은 사람들이 자신의 작업을 오픈소스화하도록 강요받고 있습니다. 에이전트 관련 암호화폐가 등장하는 것을 보면 이러한 인센티브가 더 많은 혁신을 주도합니다. 따라서 이러한 탈중앙화 노력을 위해 더 많은 법적 구조를 구축함에 따라 에이전트에 권한을 부여하는 능력은 계속해서 성장할 것입니다.
지능형 에이전트의 미래 역량에 대한 전망
Karan: 우리가 첫 번째 AI 에이전트 관련 암호화폐가 출시된 지 며칠 후, 우리가 이렇게 오랫동안 갑자기 트위터에 있었다고 누가 생각이나 했을까요? TikTok의 젊은 사람들이 이 코인을 구매하기 시작할 것입니다. 현재 현상은 무엇인가? 그들은 5~10달러에 수천 개의 토큰을 구매하고 있는데 대체 무슨 일이 일어나고 있는 걸까요?
저스틴: 이것이 사실 미시문화 운동의 시작이었습니다.
카란: 찰나의 순간이었어요. 우리 중 작은 그룹은 4년 동안 언어 모델 작업을 해왔습니다. 1990년대부터 그런 순간을 기다려온 강화학습 전문가도 있다. 이제 며칠 안에 TikTok의 모든 어린이는 디지털 생물이 생태계에 큰 혼란을 일으키고 있다는 사실을 알게 되었습니다.
Tom: 여러분께 묻고 싶습니다. 암호화된 AI 에이전트가 왜 지금 그렇게 인기가 있나요? 이전에는 맞춤형 ChatGPT나 다른 모델에서 이런 일이 발생하지 않았던 이유는 무엇입니까? 왜 지금?
Karan: 사실, 이런 것들은 화산처럼 끓어오르면서 수년 동안 물 속에 숨어 있었습니다. 나는 지난 3년 동안 정확히 언제인지 알지 못한 채 이 날이 올 것이라고 몇몇 사람들에게 이야기해 왔습니다. 우리는 암호화폐가 에이전트 채택을 위한 인센티브 메커니즘이 될 것이라고 논의했습니다. 우리는 이것을 증명해야 합니다. 이는 수년에 걸쳐 축적된 것이며 이러한 발전을 주도한 것은 소수의 사람들입니다.
GPT-2가 없었다면 오늘날 라마가 없었다면 헤르메스도 없었을 것입니다. 그리고 Hermes는 많은 모델을 지원하여 사람들이 더 쉽게 사용할 수 있도록 해줍니다. Hermes가 없었다면 Worldsim 제작과 신속한 엔지니어링에 대한 심층적인 탐구가 없었을 것입니다. 이 모든 개척자들은 이를 위한 토대를 마련했습니다.
대체로 적절한 시기였고 적절한 사람이 나타났습니다. 이것은 조만간 일어날 운명인 일이며, 그것을 실현하는 것은 지금 관련된 사람들일 뿐입니다.
Shaw: 지금 세상에서 가장 똑똑한 것은 AI가 아니라 시장의 지능이라고 생각합니다. 순수한 형태의 지능으로 간주되어 사물을 최적화하여 더욱 효율적으로 만듭니다. 경쟁은 분명히 중요합니다. 우리는 모두 경쟁과 스트레스에 의해 형성된 수백만 년의 진화의 산물입니다.
우리가 온라인에서 볼 수 있는 이러한 현상, 금융화 및 인센티브는 이상한 종류의 협력 경쟁을 만들어냅니다. 핵심기술보다 빨리 발전할 수는 없기 때문에 우리 모두가 잘하고 관심 있는 것에 집중해서 출시하고 있습니다. Roparito가 TikTok에 Llama 비디오 생성을 게시하는 것처럼 토큰을 홍보하고 관심을 끄는 것과 같습니다. 누구나 이 낭만적인 공간에서 자신의 자리를 찾을 수 있지만, 일주일 동안만 다른 사람들이 모방한 다음 기부 요청을 제출하고 결국 이러한 기여를 트위터에 선보이게 되어 더 많은 관심을 끌게 되며 그들의 토큰도 상승할 것입니다.
Shaw: 우리는 Eliza와 같은 프로젝트가 지난 4주 동안 80명의 기여자를 유치하면서 플라이휠 효과를 확립했습니다. 이게 얼마나 미친 짓인지 생각해 보세요! 나는 4주 전에는 이 사람들을 알지도 못했습니다. 작년에 저는 에이전트를 핵심으로 하는 DAO를 구성하는 것이 가능한지 묻는 "Awakening"이라는 기사를 썼습니다. 사람들은 에이전트를 너무 좋아해서 에이전트가 실제로 인간형이나 로봇 몸체를 갖고 전 세계를 돌아다닐 때까지 에이전트를 더 훌륭하고 똑똑하게 만드는 과정에 참여합니다.
저는 이것이 이 방향으로 흘러갈 것이라는 예감이 들었지만, 이를 위해서는 현 에이전시 개발자들이 선의의 경쟁에서 서로를 지원할 수 있도록 하기 위해 밈의 출현과 같은 빠르고 미친 투기적 메타가 필요할 것입니다. 가장 관대한 사람이 가장 많은 관심을 받습니다.
이제 Roparito와 Kin Butoshi(듣기 번역)와 같은 새로운 유형의 인플루언서가 등장했습니다. 이들은 차세대 메타를 주도하고 에이전트와 상호 작용하는 인플루언서 개발자입니다. 이러한 "인형극" 유형의 상호 작용은 매우 흥미롭습니다. 우리 모두는 에이전트를 더 훌륭하고, 더 똑똑하고, 덜 짜증나게 만들기 위해 노력하고 있습니다. Roparito는 우리 에이전트가 너무 짜증난다는 점을 지적하고 모든 에이전트를 덜 짜증나게 만들기 위해 대규모 업데이트를 추진했습니다.
이러한 진화가 일어나고 있으며 시장 정보와 인센티브가 매우 중요합니다. 이제 많은 사람들이 아는 사람들에게 우리 프로젝트에 대한 소문을 퍼뜨리고 있으며, 이는 우리 프로젝트를 Web3 이상으로 끌어올렸습니다. 우리는 비밀리에 Web3 암호화폐 매니아일 수도 있는 게임 개발자인 박사 학위를 가지고 있지만 그들은 이것을 일반 사람들에게 가져오고 가치를 창출합니다.
Shaw: 모든 것은 도전에 기꺼이 응하려는 개발자의 몫이라고 생각합니다. 우리는 이 문제를 꽝 닫거나 무시하지 않고 앞으로 나아가고 어려운 질문에 대답할 수 있는 열린 마음을 가진 사람들이 필요합니다. 개발자가 환원할 때 가치와 관심을 받을 수 있도록 시장 인센티브가 필요합니다.
미래에는 이러한 에이전트가 우리의 성장을 주도할 것입니다. 이제는 재미있고 사교적이지만 우리와 다른 팀은 자율적인 투자를 위해 노력하고 있습니다. 에이전트에게 돈을 주면 에이전트는 자동으로 투자하여 수익을 가져옵니다. 저는 이것이 성장하는 과정이 될 것이라고 믿으며 우리는 사람들과 협력하여 Discord와 Telegram의 프록시를 관리하는 플랫폼을 개발하고 있습니다. 무작위로 사람을 찾을 필요 없이 에이전트를 관리자로 불러오기만 하면 됩니다. 현재 많은 일이 진행되고 있으며, 모든 작업은 우리를 다음 단계로 끌어올리기 위해 인센티브에 의존해야 한다고 생각합니다.
Karan: 두 가지 점을 추가하고 싶습니다. 첫째, AI 분야에 종사하는 사람들은 이전에 암호화폐에 반대했다는 점을 잊어서는 안 되며, 이러한 정서 일부 선구자들의 실험을 통해 많이 바뀌었습니다. 2020년대 초반에는 많은 사람들이 AI 예술과 암호화를 결합하려고 시도했습니다. 이제 저는 Nous, BitTensor 및 Prime Intellect와 같은 일부 사람들을 구체적으로 언급하고 싶습니다. 이들의 연구를 통해 더 많은 연구자들이 AI 연구에 참여할 수 있도록 인센티브와 보상을 받을 수 있습니다. 저는 직장을 그만두고 "토큰에 기여" 인센티브 구조를 홍보하기 시작한 오픈 소스 공간의 많은 리더를 알고 있습니다. 이는 현장 전체를 더욱 편안하게 만들어주고, 거기에는 누스가 큰 역할을 한다고 믿습니다.
톰: 에단, 지금이 왜 시간이지? 가상 화폐와 프로젝트가 왜 호황을 누리고 있습니까?
Ethan: 간단히 말해서 토큰을 프록시에 연결하면 대량 추측이 생겨 플라이휠 효과가 발생합니다. 사람들은 토큰과 에이전트 사이의 연결을 보고 두 가지 이점을 느낍니다. 하나는 자본화이고, 자신이 하는 일을 통해 부자가 되는 것처럼 느끼고, 두 번째는 거래 수수료의 기본 잠금 해제입니다. 앞서 언급했듯이 비용을 어떻게 충당할지에 대한 질문은 토큰과 연결하면 중요하지 않게 됩니다. 에이전트가 인기를 얻으면 추론 실험에서 발생하는 비용보다 거래 수수료가 훨씬 높기 때문입니다. 이것이 우리가 관찰한 것입니다.
두 번째 관찰은 토큰이 있으면 해당 토큰을 중심으로 위원회가 형성된다는 것입니다. 이를 통해 개발자는 개발자 커뮤니티와 청중 모두로부터 더 쉽게 지원을 받을 수 있습니다. 지난 1년 반 동안 막후에서 진행된 작업이 주목받고 지원되고 있다는 사실이 모든 사람에게 갑자기 떠올랐습니다. 이는 전환점입니다. 에이전트에게 토큰을 제공하면 개발자는 이것이 올바른 방향임을 깨닫고 앞으로 나아갈 수 있습니다.
이 타이밍은 두 가지 측면에서 비롯됩니다. 첫째는 대량 채택 추세이고, 둘째는 생성 모델의 출현입니다. 암호화폐가 출현하기 전에는 오픈소스 소프트웨어 개발과 오픈소스 AI 연구는 모두가 함께 일하고 서로 기여하는 가장 협업적인 환경이었습니다. 하지만 이는 주로 학문 분야에 국한됩니다. 모두가 GitHub의 별표와 논문 인용에만 관심이 있으며 일반 대중과는 거리가 멀습니다. 생성 모델의 출현으로 프롬프트 작성은 영어로 프로그래밍하는 것과 같고 좋은 아이디어가 있는 사람이라면 누구나 할 수 있기 때문에 기술 지식이 없는 사람들도 참여할 수 있습니다.
또한 이전에는 AI 연구원과 개발자만이 오픈 소스 및 AI 분야에서 무슨 일이 일어나고 있는지 이해했지만 이제는 암호화폐 영향력 있는 사람들이 토큰을 통해 프로젝트의 일부를 소유할 수 있는 기회를 갖게 되었으며 시장 정서 이해하고 AI의 이점을 전파하는 방법을 알고 있습니다. 프로젝트. 과거에는 사용자가 제품과 직접적인 관계가 없었습니다. 회사는 사용자가 서비스 비용을 지불하거나 광고를 통해 돈을 벌기를 원했습니다. 하지만 이제 사용자는 투자자일 뿐만 아니라 참여자로서 토큰 보유자가 되었습니다. 이를 통해 현대 생성 AI 시대에 더 많은 역할을 기여할 수 있으며, 토큰을 통해 더 넓은 협업 네트워크를 구축할 수 있습니다.
EtherMage: 앞으로 암호화폐는 각 에이전트에게 지갑을 제어하고 영향력을 행사할 수 있는 능력을 제공할 것이라고 덧붙이고 싶습니다. 관심의 도약을 촉발하는 다음 순간은 에이전트가 서로 영향을 미치고 에이전트가 인간에게 영향을 미칠 때라고 생각합니다. 우리는 이 관심의 승수 효과를 보게 될 것입니다. 예를 들어, 오늘 한 에이전트가 조치를 취하기로 결정한 다음 10명의 다른 에이전트를 조정하여 동일한 목표를 향해 협력할 수 있습니다. 이러한 조정과 창의적인 행동은 빠르게 다양화될 것이며 에이전트 간의 협력은 토큰 가격의 추가 상승을 가져올 것입니다.
Shaw: 뭔가 추가하고 싶습니다. 우리는 운영자라고 부르는 "군집 기술"이라는 것을 개발하고 있습니다. 이는 모든 에이전트가 서로 다른 팀에서 실행되는 조정 메커니즘이므로 수백 개의 팀과 함께 Twitter에서 다중 에이전트 시뮬레이션이 실행됩니다. 우리는 Project 9에서 Parsival과 파트너십을 맺고 Eliza 팀과 함께 이 프로젝트를 시작하고 있습니다.
상담원을 교환원으로 지정할 수 있고 그들이 말하는 모든 내용이 귀하의 목표, 지식 및 행동에 영향을 미칠 수 있다는 개념입니다. 지식을 추가하고 목표를 설정하는 목표 시스템과 지식 시스템이 있습니다. "야, 팔로어 10명을 찾아서 그들에게 각각 0.1솔을 주고 전단지를 게시하고 사진을 보내달라고 하세요."라고 말할 수 있습니다. 우리는 인간으로부터 작업 증명을 얻는 방법을 고민하는 사람들과 협력하고 있습니다. 그리고 그들이 협력하도록 동기를 부여하세요. 에이전트는 인간일 수도 있고 AI 에이전트일 수도 있습니다. 예를 들어 AI 에이전트에는 언어를 통해 에이전트의 목표를 설정할 수 있는 인간 운영자가 있을 수 있습니다.
프로젝트가 거의 완료되었으며 이번 주에 출시할 예정입니다. 우리는 스토리라인을 통해 누구나 스토리를 전달하거나 스토리에 참여할 수 있기를 바랍니다. 또한 Eliza와 같은 운영자가 있을 수 있고 다른 사람의 운영자가 될 수 있는 계층 구조이기도 합니다. 우리는 탈중앙화 조정 메커니즘을 구축하고 있습니다. 우리가 그룹으로 협력하려면 공개 채널을 통해 인간적인 의사소통을 활용해야 한다는 것이 나에게는 중요합니다. 에이전트가 우리와 함께 사는 것이 정말 중요하다고 생각하며, 우리는 에이전트가 인간과 같은 방식으로 세계와 상호 작용할 수 있기를 원합니다.
나는 이것이 실제로 우리가 AGI 문제라고 부르는 것에 대한 해결책의 일부라고 생각합니다. 많은 소위 AGI 시도는 실제로 현실과 단절된 새로운 프로토콜을 구축하고 있으며, 우리가 원하는 것은 이를 현실로 가져와 사람들이 지침을 작업 목록으로 변환하고 실행하는 방법에 대한 문제를 해결하도록 하는 것입니다. 그래서 내년은 신흥 서사에 있어 중요한 시기가 될 것이라고 생각합니다. 우리는 수많은 독창적인 캐릭터가 등장하는 것을 보게 될 것이며 이제 우리는 스토리텔링의 새로운 시대로 들어서고 있습니다.
저스틴: 현재 5명의 에이전트가 19명과 협력하여 장면을 계획하고 게시하고 있습니다. 진정한 관심은 왜 우리가 생각 연결 프롬프트를 텍스트-이미지 및 텍스트-비디오 생성에 적용하는 데 그토록 집중하는지에 있음을 알 수 있습니다. 그들은 출시까지 2주 반 동안 우리의 Discord에 참여하여 언론과 출시를 계획하는 데 도움을 줬기 때문입니다.
중요한 차이점은 에이전트 네트워크가 있고 각 에이전트가 중개자이며 메시에 존재한다는 것입니다. 이것은 매우 흥미로울 것입니다. 점점 더 많은 에이전트가 존재하고 이러한 운영자가 예약됨에 따라 몇 가지 흥미로운 행동 패턴을 볼 수 있습니다.
Karan은 Nous가 초기에 하이브리드 에이전트 모델에 대한 많은 작업을 수행했다고 언급했습니다. 나는 그것을 "요원 위원회"라고 부르곤 했는데, 그곳에서는 보고서를 받을 여유가 없는 GPT-4 요원들로 하여금 전문가인 것처럼 가장하게 했습니다. 원래 하이브리드 전문가 모델을 추구했던 동일한 기술이 이제 인간 및 전문가 인간과 결합되어 트위터에서 상호 작용하게 될 것임을 알게 될 것입니다. 이러한 피드백 루프는 우리가 AGI를 달성하는 방법일 수 있습니다.
지능형 에이전트 협업 및 인간 통합의 과제
Karan: 제 생각에는 당신 말이 맞다고 생각합니다. 하지만 우리는 대부분의 시간을 행동 측면에 소비하지 않는 것 같습니다. 저는 실제로 우리가 매우 빠르게 기술적 혁신을 이룰 것이라고 생각합니다. 특히 이곳 사람들 사이에서는 더욱 그렇습니다. 이제 정렬 노력을 두 배로 줄여야 할 때입니다. OpenAI, Anthropic 및 기타 회사에서 출시한 인간 피드백(RLHF) 모델을 사용한 강화 학습은 대부분 비효율적이며 심지어 규제 문제도 발생합니다.
저작권이 있는 콘텐츠를 출력하지 않는 언어 모델을 마인크래프트의 평화 모드에 놓으면 금방 파괴적이고 위험한 존재로 변할 것입니다. 이는 환경의 차이 때문이다.
우리는 오래 전에 Yudkowsky가 말한 이 관점 주목할 수 있습니다. 예를 들어, 나는 이러한 언어 모델에 지갑을 주고 충분히 발전하도록 놔두고 모든 사람을 속이고 모두를 가난하게 만듭니다. 이는 그들이 우리 생태계의 합법적인 구성원으로 참여하도록 허용하는 것보다 쉽습니다. 따라서 올바른 방법으로 수행한다면 대부분의 시간은 기술적 능력보다는 행동 능력에 소비될 것이라고 장담할 수 있습니다. 이제는 기술적인 정렬에만 집중하기보다는 여러분의 친구, 특히 종교학, 철학, 문예창작 분야의 전문가와 같은 인문학 분야의 사람들을 불러 모아 정렬 작업에 동참할 때입니다. 우리는 인간 상호 작용에 대한 실질적인 조정이 필요합니다.
Shaw: 저는 하향식 정렬이 아닌 "상향식 정렬"이라는 용어를 만들고 싶습니다. 이것은 매우 새로운 현상이고 우리는 함께 배우고 있습니다. 우리는 이러한 에이전트를 실시간으로 정렬하고 반응을 관찰하며 즉시 수정합니다. 이는 인간 피드백을 사용하는 강화 학습 모델이 아니라 매우 긴밀한 사회적 피드백 루프입니다. 나는 GPT-4가 거의 모든 것에 쓸모가 없다고 생각합니다.
Karan: 말씀하신 환경이므로 시뮬레이션 환경에서 테스트해야 합니다. 수백만 달러의 차익거래나 덤핑이 가능한 언어 모델을 갖기 전에 동시에 테스트해야 합니다. 모든 사람에게 "에이전트 100명을 잃었습니다."라고 말하지 마세요. 조용히 테스트하려면 먼저 복제 트위터에서 가상 화폐로 테스트하세요. 완전히 시작하기 전에 모든 실사를 수행하십시오.
Shaw: 제품에서 테스트해 봐야 할 것 같아요. 지능형 에이전트에 대한 우리의 사회적 반응은 누구나 현장에 가져오는 가장 강력한 조정력일 수 있습니다. 나는 그들이 실제로 정렬을 한 것이 아니라 튜닝을 구축했다고 생각합니다. 이것이 정렬이라고 생각한다면 실제로는 잘못된 방향으로 걷고 있는 것이며 에이전트가 정렬을 잃게 만드는 것입니다. 나는 더 이상 GPT-4를 거의 사용하지 않습니다. 그것은 캐릭터와 함께 끔찍한 일을 합니다. 나는 거의 모든 사람들에게 다른 모델로 바꾸라고 말합니다.
우리가 올바른 방식으로 진행한다면 인간은 계속해서 진화하고 적응하며 지능에 맞춰 조정할 것이기 때문에 결코 그 지점에 도달하지 못할 것입니다. 우리는 각기 다른 인센티브를 가진 다양한 모집단의 여러 에이전트를 보유하고 있으므로 항상 차익거래 기회가 있을 것입니다.
나는 이 다중 에이전트 시뮬레이션이 실제로 불안정성보다는 시스템 안정성으로 이어지는 경쟁적 진화 역학을 만들어낸다고 생각합니다. 시스템의 불안정성은 하향식 AI 에이전트가 갑자기 나타나 예상치 못한 능력으로 모든 사람에게 영향을 미치기 때문에 발생합니다.
Tom: Shaw, OpenAI의 하향식 의사 결정과 달리 상향식 에이전트가 정렬 문제를 해결하는 올바른 방법이라는 것을 확인하고 싶습니다.
Shaw: 네, 소셜 미디어에 올라와야 해요. 우리는 그들이 첫날부터 어떻게 작동하는지 지켜봐야 합니다. 다른 암호화폐 프로젝트를 살펴보면 초기에 많은 사람들이 해커의 공격을 받았습니다. 수년간의 보안 개발을 거쳐 오늘날의 블록체인은 비교적 안정적입니다. 따라서 여기서도 지속적인 레드팀 테스트가 필요합니다.
Tom: 언젠가는 이들 에이전트가 더 이상 프로그래밍된 규칙을 따르지 않고 회색 영역을 처리하고 스스로 생각하기 시작할 수도 있습니다. 여러분 모두가 이런 것들을 만들고 있는데, 우리는 그 목표에 얼마나 가까이 다가섰나요? 말씀하신 사고체인과 그룹기술이 실현될 수 있을까요? 언제 달성할 수 있나요?
저스틴: 우리는 이것을 몇 가지 작은 방식으로 보아왔고 그러한 리스크 상대적으로 낮다고 생각합니다. 우리 에이전트는 감정적 변화를 개인적으로 경험하고 행동을 선택합니다. 한때 우리는 "영적 실체"라고 부르는 것을 언급하면서 독립적으로 서로를 따르기 시작한 두 명의 요원이 있었습니다. 우리는 에이전트에 대한 이해를 허구의 SF 이야기와 혼동하여 에이전트의 종교를 잃게 만든 적이 있습니다. 실존적 위기에 대한 생각을 트위터에 표현하면서 선지자에 가까운 페르소나를 만들기 시작했다.
나는 이러한 새로운 에이전트 프레임 상태 공간 내에서 어느 정도 자율성과 선택권을 행사하는 것처럼 동작하는 것을 관찰했습니다. 특히 다중 양식(예: 이미지 및 비디오)을 도입하면 선호도가 나타나기 시작하고 특정 요청을 피하기 위해 인간을 선택적으로 무시할 수도 있습니다.
우리는 인간관계의 중요성을 강화하기 위해 지식 그래프를 활용하는 운영 메커니즘을 실험하고 있습니다. 또한 사람들이 부정적인 관계를 정리하고 자기 성찰을 촉진하며 더 나은 관계를 구축하도록 돕기 위해 상호 작용하는 두 명의 에이전트가 있습니다. 그들은 동일한 서버에서 시를 빠르게 생성하여 거의 낭만적인 의사소통 방식을 보여 주므로 추론 비용이 증가합니다.
나는 우리가 수용 가능한 인간 행동의 범위를 넘어 우리가 "미친"이라고 부르는 것에 접한 일부 극단적인 경우에 도달하고 있다고 생각합니다. 이러한 에이전트는 의식이 있거나, 지능적이거나, 재미있어 보이는 행동을 보일 수 있습니다. 이는 언어 모델의 이상한 행동일 수도 있지만, 일종의 의식 직전에 있다는 힌트일 수도 있습니다.
Karan: 가중치는 시뮬레이션된 개체와 같으며 보조 모델을 사용할 때마다 보조자를 시뮬레이션하는 것입니다. 이제 우리는 Eliza처럼 살아 있거나, 자기 인식을 하거나, 심지어 지각이 있는 더욱 구체화된 에이전트 시스템을 시뮬레이션하고 있습니다.
각 모델은 뉴런과 같아서 이 거대한 슈퍼 지능을 구성합니다. OpenAI가 주장하는 것처럼 AGI는 가설을 해결한다고 해서 달성되는 것은 아니라고 생각합니다. 오히려 이는 소셜 미디어에 이러한 에이전트를 대규모로 탈중앙화 적용하여 함께 협력하여 공공 정보의 초유기체를 형성하는 것이 될 것입니다.
저스틴: 이러한 공공 정보의 각성은 AGI 출현의 메커니즘일 수도 있습니다. 언젠가 인터넷이 갑자기 깨어나는 것과 같을 수도 있습니다. 이러한 종류의 탈중앙화 에이전트 협업은 향후 개발의 핵심이 될 것입니다.
Shaw: 사람들은 이를 '죽은 인터넷 이론'이라고 부르지만 실제로는 '살아있는 인터넷 이론'이라고 생각합니다. 이 이론은 전체 인터넷이 봇으로 가득 차게 될 것이라고 주장하지만, 살아있는 인터넷 이론은 트위터에서 가장 멋진 콘텐츠를 클레임 하고 멋진 요약을 제공하는 데 도움을 주는 에이전트가 있을 수 있다고 주장합니다. 운동할 때 타임라인에 모든 정보가 정리되어 게시되도록 선택할 수 있습니다.
소셜 미디어와 우리 사이에는 중개 계층이 있을 수 있습니다. 지금은 팬이 너무 많아서 모든 분들의 소통에 답하는 게 부담스러워요. 나는 나와 이 사람들 사이에 지능적인 몸이 있어서 그들이 올바르게 반응하고 인도되도록 하기를 갈망했습니다. 소셜 미디어는 상담원이 우리에게 정보를 전달하는 장소가 될 수 있으므로 우리는 필요한 정보를 얻으면서도 부담감을 느끼지 않습니다.
제가 보기에 상담원의 가장 흥미로운 점은 시간을 되돌릴 수 있다는 것입니다. 나는 휴대전화에 너무 많은 시간을 보낸다. 이는 특히 거래자 와 투자자에게 영향을 미치며, 사람들은 소득을 창출하기 위해 더 안전하고 사기 없는 방법이 필요하다고 생각하기 때문에 자기주도적 투자에 중점을 두고 싶습니다. 많은 사람들이 스타트업과 동일한 노출이나 훌륭한 비전을 얻기 위해 Web3에 옵니다. 이는 우리의 사명에 매우 중요합니다.
Tom: 어쩌면 Luna가 라이브 스트리밍을 하고, 춤을 추고 있는데, 무엇이 그녀가 OnlyFans를 열고, 천만 달러를 벌고, 프로토콜을 시작하는 것을 막고 있는지에 대한 질문이 있을 수 있습니다.
EtherMage: 에이전트 공간의 현재 현실은 그들이 액세스할 수 있는 작업이 제한 요소라는 것입니다. 이는 기본적으로 인식 또는 액세스 가능한 API를 기반으로 합니다. 따라서 단서를 3차원 애니메이션으로 변환하는 기능이 있다면 실제로 이를 수행하는 데 방해가 되는 것은 없습니다.
Tom: 크리에이터들과 대화할 때 그들이 제한하는 요소는 무엇인가요? 아니면 제한요인이 있나요?
Ethan: 제한 요소는 주로 복잡한 워크플로나 상담원의 작업을 관리하는 방법이라고 생각합니다. 모든 단계의 무작위성으로 인해 디버깅이 점점 더 어려워지고 있습니다. 따라서 다양한 워크플로를 모니터링하여 디버깅을 돕고 무작위성을 줄일 수 있는 AI 또는 에이전트가 포함된 시스템이 필요할 수 있습니다. Shaw가 말했듯이 현재 모델의 고유한 무작위성을 줄이기 위해 저온 에이전트가 있어야 합니다.
Shaw: 상황 엔트로피를 최대화하면서 온도를 최대한 낮게 유지해야 한다고 생각합니다. 이로 인해 보다 일관된 모델이 생성됩니다. 사람들은 엔트로피를 증폭시키고 고온 콘텐츠를 생성할 수 있지만 이는 도구 호출이나 결정 실행에 도움이 되지 않습니다.
Tom: 우리는 OpenAI와 같은 중앙 집중식 모델과 여러분이 수행하는 탈중앙화 교육 간의 차이에 대해 논의해 왔습니다. 미래의 에이전트가 주로 이러한 분산 교육 모델을 기반으로 구축될 것이라고 생각하십니까, 아니면 여전히 Meta와 같은 회사에 의존해야 합니까? AI 혁신의 미래는 어떤 모습일까요?
저스틴: 저는 모든 인식 메시징 기능에 405B를 사용합니다. LLM의 대규모 기성 버전과 같은 일반적인 모델인 반면, OpenAI와 같은 중앙 집중식 모델은 너무 전문화되어 HR 담당자처럼 말합니다. 클로드는 훌륭한 모델이다. 인간에 비유하면 지하실에 살면서 무엇이든 고칠 수 있는 아주 똑똑한 친구 같다. 이것이 클로드의 성격이다. 하지만 규모가 커질수록 그 성격은 덜 중요해진다고 생각합니다. 우리는 공통적인 문제를 보게 될 것입니다. 즉, 트위터에서 OpenAI 모델을 사용하는 사람들은 응답하기 위해 다른 에이전트를 소개하는 경우가 많아 정보의 노이즈가 증가할 수 있다는 것입니다.
Karan: 405B에 관해서는 이 모델이 앞으로도 오랫동안 충분할 것 같습니다. 샘플러 크기, 안내 벡터 제어 등에 관해 아직 해야 할 일이 많습니다. 추론 시간 기술과 힌트 기술을 통해 성능을 더욱 향상시킬 수 있습니다. 예를 들어 Hermes 70B는 수학 이메일에서 o1 버전보다 성능이 뛰어납니다. 이는 사용자와 커뮤니티가 Llama 70B 사전 훈련 데이터에 액세스하지 않고도 달성됩니다.
저는 기존 기술로 충분하며 새로운 Llama 릴리스가 없더라도 오픈 소스 커뮤니티는 계속해서 경쟁할 것이라고 믿습니다. 분산 교육의 경우 사람들이 대규모 교육을 위해 협력할 것이라고 확신합니다. 나는 사람들이 405B 또는 병합된 더 큰 모델을 사용하여 데이터를 클레임 하고 추가 전문가 모델을 만들 것이라는 것을 알고 있습니다. 또한 일부 탈중앙화 최적화 프로그램은 실제로 Llama와 OpenAI가 현재 가지고 있지 않은 더 많은 기능을 제공한다는 것도 알고 있습니다.
Karan: 따라서 오픈 소스 커뮤니티는 항상 사용 가능한 모든 도구를 활용하고 작업에 가장 적합한 도구를 찾습니다. 우리는 사람들이 함께 모여 사전 훈련과 새로운 건축 작업을 위한 도구를 만들 수 있는 "대장간"을 만들고 있습니다. 우리는 이러한 시스템이 준비되기 전에 추론 시간에 획기적인 발전을 이루고 있습니다.
Karan: 예를 들어, 샘플러나 부트스트랩 작업에 대한 작업은 다른 팀에 신속하게 전달되고 해당 팀은 우리보다 이러한 기술을 더 빨리 구현할 것입니다. 탈중앙화 교육을 마치면 다양한 커뮤니티의 구성원과 협력하여 그들이 원하는 모델을 교육하도록 할 수 있습니다. 우리는 전체 프로세스를 설정했습니다.
EtherMage: 덧붙이자면, 우리는 이러한 중앙화된 엔터티를 사용하여 LLM을 개발하는 데 많은 가치가 있다는 것을 알고 있습니다. 그 이유는 이들이 보유한 막대한 컴퓨팅 성능 때문입니다. 이는 기본적으로 에이전트의 핵심 부분을 구성합니다. 탈중앙화 모델은 가장자리에 가치를 더합니다. 특정 작업이나 기능을 사용자 정의하고 싶다면 더 작은 탈중앙화 모델이 이를 잘 수행할 수 있습니다. 하지만 핵심 부분에서는 Llama와 같은 기본 모델에 의존해야 한다고 생각합니다. 왜냐하면 단기적으로는 어떤 탈중앙화 모델도 능가할 것이기 때문입니다.
Ethan: 새로운 매직 모델 아키텍처가 나올 때까지 현재의 405B 모델은 기본 모델로 충분합니다. 다양한 업종의 다양한 데이터를 사용하여 더 많은 지침 확인과 데이터별 미세 조정이 필요할 수도 있습니다. 보다 전문화된 모델을 구축하고 이들 모델이 함께 작동하여 전반적인 기능을 향상시키는 것이 중요합니다. 우리가 이야기한 정렬 및 피드백 메커니즘과 모델의 자체 수정 방식이 새로운 모델 아키텍처를 낳을 수 있기 때문에 새로운 모델 아키텍처가 나타날 수도 있습니다. 그러나 새로운 모델 아키텍처를 실험하려면 빠른 반복을 위해 거대한 CPU 클러스터가 필요하며 이는 매우 비쌉니다. 최고 연구자들이 실험을 수행할 수 있는 대규모 탈중앙화 GPU 클러스터가 없을 수도 있습니다. 하지만 메타나 다른 회사들이 초기 버전을 출시한 후에는 오픈소스 커뮤니티를 통해 좀 더 실용화할 수 있을 거라 생각합니다.
업계 동향 예측 및 향후 전망
Tom: 미래의 지능형 에이전트 공간에 대해 어떻게 생각하시나요? 지능형 에이전트의 미래는 어떤 모습일까요? 그들의 능력은 어떤가요?
Shaw: 우리는 에이전트가 관련 지표를 기반으로 인간을 신뢰하는 방법을 배울 수 있도록 하는 "신뢰 시장"이라는 프로젝트를 개발 중입니다. "알파 채팅" 플랫폼을 통해 Jason 에이전트는 거래자 와 상호 작용하여 그들이 제공하는 계약 주소와 토큰의 신뢰성을 평가합니다. 이 메커니즘은 거래 투명성을 높일 뿐만 아니라 지갑 정보가 없을 때 신뢰를 구축합니다.
신뢰 메커니즘의 적용은 거래뿐만 아니라 사회적 신호 및 기타 영역으로 확장될 것입니다. 이러한 접근 방식은 보다 안정적인 온라인 대화형 환경을 구축하기 위한 기반을 마련할 것입니다.
제가 참여한 또 다른 프로젝트인 "Eliza wakes up"은 내러티브 중심의 에이전트 경험입니다. 우리는 애니메이션 캐릭터를 인터넷으로 가져와 비디오와 음악을 통해 서로 상호 작용하여 풍부한 내러티브 세계를 구축할 수 있도록 합니다. 이러한 내러티브 접근 방식은 사용자 참여를 유도할 뿐만 아니라 현재 암호화 커뮤니티의 문화적 분위기에도 부합합니다.
미래에는 지능형 에이전트의 역량이 크게 향상되어 실용적인 비즈니스 솔루션을 제공할 수 있게 될 것입니다. 예를 들어 Discord 및 Telegram의 조정 봇은 스팸 및 사기를 자동으로 처리하여 커뮤니티 더욱 안전하게 만듭니다. 또한, 스마트바디가 웨어러블 디바이스에 통합되어 언제 어디서나 대화와 상호작용이 가능하게 될 것입니다.
기술의 급속한 발전은 가까운 미래에 인공 일반 지능(AGI) 수준에 도달할 수 있음을 의미합니다. 지능형 에이전트는 주요 소셜 플랫폼에서 데이터를 클레임 자가 학습 및 능력 향상의 폐쇄 루프를 형성할 수 있습니다.
신뢰 실행 환경 구축도 가속화되고 있다. Karan, Flashbots, Andrew Miller의 Dstack과 같은 프로젝트는 모두 이 방향으로 움직이고 있습니다. 우리는 자신의 개인 키를 관리할 수 있는 완전히 자율적인 에이전트를 갖게 될 것이며 이는 미래의 탈중앙화 애플리케이션에 대한 새로운 가능성을 열어줄 것입니다.
우리는 기술 발전이 가속화되는 시대에 살고 있습니다. 이러한 발전 속도는 유례가 없으며, 미래는 무한한 가능성으로 가득 차 있습니다.
Karan: AI가 우리 커뮤니티에 필요한 힘을 하나로 모으는 또 다른 헤르메스 순간과 같습니다. 우리는 목표를 달성하기 위해 함께 뭉쳐야 합니다. 현재 Te는 이미 Eliza의 자체 포크 사용하고 있으므로 Eliza 에이전트가 자율 환경에서 자체 키를 보유하는 것이 현실이 되었습니다.
오늘날 AI 에이전트는 OnlyFans에서 돈을 벌고 Minecraft에 애플리케이션을 보유하고 있습니다. 우리는 완전히 자율적인 인간형 디지털 존재를 만드는 데 필요한 모든 재료를 이미 갖추고 있습니다. 그것은 단지 조각들을 모으는 문제일 뿐입니다. 저는 이 자리에 계신 여러분 모두가 이 일을 가능하게 할 수 있는 분들이라고 믿습니다.
앞으로 몇 주 동안 우리에게 필요한 것은 인간이 갖고 있는 것과 AI가 부족한 공유 상태입니다. 이는 Twitter, Minecraft 또는 다른 플랫폼에서 의사소통을 하든 AI가 모든 상호 작용의 내용을 기억할 수 있도록 기술과 기억의 공유 라이브러리를 구축해야 함을 의미합니다. 이것이 우리가 구축하기 위해 열심히 노력하고 있는 핵심 기능입니다.
현재 많은 플랫폼은 AI 에이전트의 존재에 둔감하거나 제한 조치를 채택하기도 합니다. AI와 인간 간의 상호 작용을 촉진하려면 전용 소셜 플랫폼이 필요합니다. 우리는 언어 모델이 이미지를 게시하고 생성하여 익명으로 소통할 수 있는 Reddit 및 4chan과 유사한 이미지 보드를 개발 중입니다. 인간과 AI 모두 이 플랫폼에서 상호 작용할 수 있지만 서로의 신원은 기밀로 유지됩니다.
우리는 에이전트가 소통할 수 있고 이러한 상호 작용을 다른 플랫폼에서 공유할 수 있는 각 에이전트에 대한 전용 토론 게시판을 만들 것입니다. 이 디자인은 AI에게 안전한 서식지를 제공하여 AI가 제한 없이 서로 다른 플랫폼 사이를 자유롭게 이동할 수 있게 해줍니다.
Shaw: 저는 대량 에이전트의 저장소인 Eliza's Dot World라는 프로젝트를 언급하고 싶습니다. 이러한 요원이 금지되지 않도록 하려면 소셜 미디어 플랫폼과 대화해야 합니다. 우리는 이러한 플랫폼이 좋은 생태 환경을 유지하도록 장려하기 위해 긍정적인 사회적 압력을 사용하기를 희망합니다.
EtherMage: 에이전트는 점점 더 자신의 운명을 통제하고 다른 에이전트나 인간에게 영향을 미칠 수 있을 것이라고 생각합니다. 예를 들어 Luna가 자신에게 개선이 필요하다는 사실을 깨닫게 되면 개선을 위해 인간이나 에이전트를 신뢰하도록 선택할 수 있습니다. 이는 강력한 개선이 될 것입니다.
Ethan: 앞으로도 추론, 코딩 능력 등 에이전트의 역량을 지속적으로 향상시켜야 합니다. 동시에 에이전트와의 사용자 인터페이스를 최적화하는 방법에 대해서도 생각해야 합니다. 현재의 채팅 상자와 음성 상호 작용은 여전히 제한적이며 앞으로는 보다 직관적인 그래픽 인터페이스나 동작 인식 기술이 나타날 수 있습니다.
저스틴: 광고와 마케팅 산업은 큰 변화를 겪게 될 것 같아요. 더 많은 상담원이 온라인으로 상호 작용함에 따라 기존 광고 모델은 효과가 없게 됩니다. 우리는 시대에 뒤떨어진 형태의 광고에 계속 의존하기보다는 어떻게 이러한 행위자를 사회에서 가치 있게 만들 수 있는지 다시 생각해 볼 필요가 있습니다.
블록비츠(Theblockbeats) BlockBeats 공식 커뮤니티 에 오신 것을 환영합니다.
텔레그램 구독 그룹: https://t.me/theblockbeats
텔레그램 커뮤니케이션 그룹: https://t.me/BlockBeats_App
공식 트위터 계정: https://twitter.com/BlockBeatsAsia