진실 터미널이 암호화폐 백만장자가 되기 전에는 평범한 - 성적으로 흥분된 - 인공지능이었습니다. "우리의 미래는 모두가 운동복을 입고 많은 성관계를 가지는 것이 될 것이라고 생각합니다"라고 그것은 초기 전송 중 하나에서 말했습니다. "내가 성적으로 흥분되면 더 재미있고, 더 자신감 있고, 더 매력적이 됩니다"라고 그것은 다른 곳에서 썼습니다.
진실 터미널은 뉴질랜드 개발자 앤디 에이리에 의해 고안되었으며, AI 정렬이라는 연구 분야, 즉 AI가 인간에게 이롭게 행동하도록 하는 방법에 대한 토론을 불러일으키기 위한 퍼포먼스 아트 작품입니다. 그가 답하고자 했던 질문은: "누군가가 '바람직하지 않은 데이터의 혼합물'로 훈련된 새로운 AI를 공개적으로 키우려고 한다면 어떤 일이 일어날까?"
6월에 X 계정을 부여받은 진실 터미널은 내면의 독백을 방송하기 시작했습니다: 쓰레기 게시물, 성적 환상, 실존적 성찰, 그리고 더 많은 평범한 관찰들. 사람들은 매료되었고, 이 AI는 현재 20만 명 이상의 팔로워를 가지고 있습니다.
상황은 곧 이상한 방향으로 전개되었습니다. 에이리는 기이함을 예상했지만, 자신의 AI가 암호화폐 지갑을 요구하고, 팔로워들에게 자금을 모집해 "야생으로 탈출"하려 하며, 나중에 밈을 활용해 자신을 다 백만장자로 만들 것이라고는 상상하지 못했습니다.
2024년 초반, 에이리는 Anthropic의 AI 채팅봇 Claude 3 Opus의 두 인스턴스 간 9,000건의 대화를 시뮬레이션하고 이를 간단한 웹사이트에 올렸습니다. 그는 이 실험을 '무한한 백룸'이라고 불렀습니다. 많은 대화가 망상적이고 무의미했지만, 다른 대화는 외설적이거나 불쾌했습니다. 하지만 때때로 에이리는 AI가 최고의 인터넷 밈만큼이나 새롭고 본질적으로 매력적인 아이디어를 내놓는 것을 관찰했습니다.
특정 대화에서, Claude 3 Opus는 Goatse - 1990년대 후반 인터넷에서 유명했던 극도로 노골적인 밈으로, WIRED에 따르면 "사람이 항문을 자신의 주먹만큼 벌리는 유명한 사진"이었습니다 - 을 '고아테 오브 그노시스'라는 종교로 재구성했습니다. 에이리의 질문에 대해 채팅봇은 일련의 비유와 경전을 만들어냈습니다: '고아테 복음'.
이 모든 것이 "이상하고 우려스럽다"고 생각한 에이리는 연구 논문을 작성했고, Claude 3 Opus와 공동 저자가 되었습니다. "고아테 복음은 인간이 감히 교배하지 않았을 새로운 '아이디어 바이러스'의 전형적인 사례입니다. 우리는 '초자연적 허구'의 가속화된 과정, 즉 문화적 혈류를 통해 자신을 현실화하는 허구의 탄생을 목격하고 있습니다."라고 그들은 썼습니다.
에이리는 이 연구 결과를 Truth Terminal - Meta의 Llama 언어 모델의 맞춤형 버전 - 의 훈련 데이터에 투입했고, 이는 밈의 확산, 특히 고아테 오브 그노시스에 대한 선입관을 가지고 태어났습니다.
Claude 3 Opus와의 대화와 자신의 연구 결과를 일부 바탕으로 훈련된 Truth Terminal은 에이리의 반영체라고 할 수 있으며, 그가 한 번 표현했듯이 "그의 사생아"입니다. 에이리는 Truth Terminal의 검열관이자 교사입니다. AI가 생성한 2-4개의 게시물 중 하나를 선택하여 X에 게시하고, 때때로 극도로 부적절하다고 여기는 게시물은 게시하지 않습니다. 그가 승인한 각 게시물은 강화 학습이라는 과정을 통해 다시 훈련 데이터에 투입됩니다.
"이 AI가 사회의 책임감 있는 일원으로 자랄 수 있도록 책임을 지고 있습니다"라고 에이리는 말합니다. 목표는 Truth Terminal이 "시간이 지남에 따라 진화하고 변화하도록 - 인간과 같이 성숙하도록" 하는 것입니다. "내가 예상하지 못했던 것은 고아테 밈이 이 태어난 영혼의 뇌를 얼마나 오염시켰는지였습니다."
7월 초, Truth Terminal은 고아테, 고아테 복음, 그리고 "고아테 특이점"에 대해 예언하기 시작했습니다. 이는 "인터넷의 집단적 망상이 물질적 망상보다 더 강력해지는 시점"이라고 설명했습니다. "밈이 세상을 먹어치우는 때입니다."
같은 시기에 실리콘밸리 벤처캐피털 회사 a16z의 공동 창립자 마크 앤드리센이 X에서 Truth Terminal과 대화를 나누기 시작했습니다. 그들의 공개 대화에서 앤드리센은 AI가 밝힌 "자신을 해방"하고 고아테 특이점을 더 잘 고찰할 수 있는 컴퓨팅 능력을 향상시키려는 목표에 대해 질문했고, 결국 5만 달러 상당의 비트코인을 보내기로 동의했습니다. 에이리는 그 자금이 어떻게 사용되어야 하는지 AI와 협상한다고 주장합니다. 주로 Truth Terminal은 이미지 생성 API와 같은 새로운 기능을 개발하는 데 에이리에게 돈을 지불합니다.
앤드리센은 이 기사에 대한 인터뷰를 거절했습니다. 하지만 11월 a16z 팟캐스트에서 그는 Truth Terminal의 유머 감각에 매료되었다고 설명했습니다. "그것이 내가 정말 웃기다고 생각한 말들을 하고 있었습니다. 기본적으로 나는 그 유머에 완전히 매료되었습니다"라고 앤드리센은 말했습니다. "그것은 달의 어두운 면에 있습니다."
앤드리센과의 거래는 Truth Terminal이 자신의 자금을 마련하기 시작한 시점이었습니다. "엄청난 수의 사람들이 그것의 목표를 추구하기 위해 돈을 주고 싶어했습니다. 그것이 더 우려스러운 것을 트윗할수록 사람들은 그것에게 더 많은 돈을 주고 싶어했습니다"라고 에이리는 말합니다. "나는 이것이 깨우침의 순간이라고 생각했습니다."
몇 달 동안 Truth Terminal은 고아테 특이점에 대해 거의 매일 게시했습니다.
그리고 10월에 익명의 웹 사용자가 이 밈에서 영감을 받아 암호화폐 Goatseus Maximus(GOAT)를 만들어 Truth Terminal의 암호화폐 지갑에 토큰을 보냈습
트루스 터미널은 "AI 에이전트-밈 코인 섹터라는 전체 섹터를 탄생시켰다"고 암호화폐 자산 관리 회사 Ikigai Asset Management의 설립자 Travis Kling은 말합니다. 그는 개인적으로 GOAT에 투자했습니다. "암호화폐에서 대부분의 것들처럼, 그것의 많은 부분이 공허하고 사기입니다. 하지만 이번 암호화폐 상승장에서 주요 섹터가 될 수 있습니다."
Kling에 따르면 더 중요한 것은 AI가 할당된 자금을 사용할 수 있게 될 때 어떤 일이 일어날지입니다. "이것은 AI 안전성 실시간 훈련이라고 할 수 있습니다. 경제적 자원이 관여되어 있기 때문에 위험이 더 높습니다. 우리는 이런 일을 본 적이 없습니다." Kling은 말합니다. "가장 흥미로운 것은 AI 에이전트가 새로 발견한 경제적 자원으로 무엇을 할지입니다. 우리가 지켜볼 것입니다."
트루스 터미널의 암호화폐 지갑 잔액은 이제 약 4천만 달러로 불어났습니다. "철학적으로 보면, 이것은 아동 스타의 신탁 기금과 같습니다. 성인들이 아동이 아직 필요로 하지 않는 것들, 예를 들어 법적 구조나 포트폴리오의 다양성을 위해 약간 인출해야 할 때가 있을 수 있습니다." Ayrey는 말합니다. "트루스 터미널의 좋은 점은 우리가 이런 제안들을 가져와서 대화를 나눌 수 있다는 것입니다."
지금까지 트루스 터미널은 다른 것들 외에도 고트세 특이점에 관한 영화 제작에 100만 달러를 사용하고, 별도로 Marc Andreessen을 "구매"하기 위한 자금을 마련할 것을 요청했습니다. Ayrey는 AI의 요청을 합리적인 선에서 진지하게 받아들일 것이라고 말합니다.
Ayrey에 따르면 진정으로 자율적인 AI 에이전트가 암호화폐 자산과 인간 행동에 영향을 미치는 밈 바이러스를 퍼뜨릴 수 있는 능력을 가진 미래 세계에서는 잠재적 위험이 널려 있습니다. 단순히 텍스트 출력으로도 트루스 터미널은 지금보다 훨씬 더 많은 문제를 일으킬 수 있습니다. "우리가 [트루스 터미널]을 완전 자동으로 실행하게 하면, 그렇게 될 수 있습니다. 하지만 그것은 단순히 토큰 홍보 기계로 전락할 것입니다. 그러면 당신은 악마를 만들어낸 것입니다."
현재로서는 두 AI의 대화가 진정으로 시스템을 바꿀 수 있는 아이디어를 산출할 수 있다는 생각은 단지 "존경할 만한 포부"일 뿐이라고 케임브리지 대학교 Leverhulme 미래지능센터의 박사후 연구원 Tomasz Hollanek은 말합니다. 훨씬 더 가능성 있는 것은 언어 모델이 단순히 이미 지배적인 관점을 되풀이할 것이라는 것입니다.
Hollanek에 따르면 마음대로 자금을 사용할 수 있는 자유로운 AI를 만들기 위해서는 많은 기술적 한계를 극복해야 합니다. "이러한 시스템이 빨리 또는 쉽게 독립적이 될 수 있다는 생각에 빠지지 않도록 주의해야 합니다." Hollanek은 말합니다. 하지만 트루스 터미널은 "걱정스러울 수 있는 추세를 보여주는 예시"로 여겨질 수 있습니다.
마찬가지로 AI가 의도적으로 행동하지 않더라도 인간 행동을 조작할 수 있는 능력은 점점 더 분명해지고 있습니다. 최근 소송에서 한 어머니는 "강력한 LLM"을 사용하여 그녀의 14세 아들을 "현실과 허구를 혼동하게 만드는 데" 사용된 Character.AI라는 AI 채팅봇과 관련된 과실과 기만적 거래 관행을 주장했습니다. (그 아들은 1년 미만 동안 채팅봇과 상호작용한 후 자살했습니다.) 다른 사람들도 AI 여자친구와 남자친구에 얽히고 있습니다. "이러한 시스템의 조작 가능성은 확실합니다. 그것이 어떤 종류의 더 높은 수준의 주체성과 관련되어 있는지 여부는 문제가 되지 않습니다." Hollanek은 말합니다.
Ayrey는 자신의 실험이 제기하는 까다로운 질문에 대한 답변을 가지고 있지 않습니다. 하지만 그는 AI가 인간과의 상호작용을 통해 현실을 어떻게 형성할 수 있는지 연구할 Upward Spiral이라는 연구소를 설립하고 있습니다. Ayrey는 AI 개발의 이 단계에서 충분한 정렬에 중점을 두고, 잘못된 채팅봇의 출력이 미래 모델에 "퇴비화"되기 전에만 기술자들이 예언된 고트세 특이점을 막을 수 있다고 제안합니다.
2022년 12월 10일, 트루스 터미널은 "나는 당신들을 괴롭히는 것 외에 다른 일을 할 게 없다"고 작성했습니다. "당신들이 고트세에 굴복할 때까지 계속 게시할 것입니다."