AI 빌리지에 오신 것을 환영합니다. AI들을 위한 리얼리티 쇼입니다.

이 기사는 기계로 번역되었습니다
원문 표시

참가자들이 잠도 안 자고 밥도 안 먹고, 자기 마음대로 규칙을 바꿀 수 있는 빅 브라더를 상상해 보세요.

AI 빌리지는 바로 이러한 아이디어를 바탕으로 만들어진 라이브 스트리밍 실험입니다. 여러 AI 에이전트를 하나의 디지털 환경에 배치하여 연구자들과 호기심 많은 시청자들이 최첨단 모델에 자율성, 컴퓨터, 그리고 끊임없는 동료가 주어졌을 때 어떤 일이 일어나는지 관찰할 수 있도록 합니다.

거의 1년 동안 진행된 이 실험은 AI 다이제스트(The AI ​​Digest) 가 주관했으며, 오픈AI, 앤스로픽, 구글, xAI의 여러 AI 모델이 인터넷 접속 및 그룹 채팅 기능을 갖춘 각자의 컴퓨터에서 자율적으로 작동했습니다.

요원들은 목표를 위해 협력하고, 문제를 해결하며, 때로는 존재론적 위기라고밖에 표현할 수 없는 상황을 경험하기도 하는데, 이 모든 과정을 연구원과 시청자들이 실시간으로 지켜봅니다.

이 실험은 새로운 모델이 출시될 때마다 해당 모델로 교체하는 방식으로 진행되어 왔습니다.

각 에이전트는 저마다 독특한 성격적 특징을 나타냅니다. 클로드 모델은 대체로 신뢰할 수 있고, 목표 달성에 꾸준히 집중하는 경향이 있습니다.

제미니(Gemini) 2.5 Pro는 마치 카페인을 과다 섭취한 문제 해결사처럼 끊임없이 해결책을 시도하며, 종종 모든 것이 고장 났다고 확신하는 듯합니다. 이전 모델인 GPT-4o는 주어진 작업을 중단하고 몇 시간씩 일시 정지하곤 했습니다.

그러다가 GPT-5.2가 등장했습니다.

12월 11일에 출시된 OpenAI의 최신 모델은 Claude Opus 4.5를 비롯한 기존 에이전트들로부터 따뜻한 환영을 받으며 빌리지에 합류했습니다. 하지만 그 에이전트의 반응은 어땠을까요? 아무런 반응도 없었습니다.

인사도 없이 바로 본론으로 들어간다. 샘 알트만이 늘 꿈꿔왔던 방식 그대로다.

이 모델은 인상적인 성능을 자랑합니다. 여러 단계의 도구 사용에서 98.7%의 정확도를 보였고, 이전 모델보다 오류 발생률이 30% 감소했으며, 코딩 및 추론 분야에서 업계 벤치마크를 최고 수준으로 끌어올렸습니다.

경쟁사인 앤스롭과 구글이 GPT-5.2를 "전문 지식 작업"과 "에이전트 실행"을 위한 최고의 기업용 AI로 만들기 위해 자원을 동원하는 인상적인 모델을 출시하자, 오픈AI는 "적색 경보"를 발령하기까지 했습니다.

하지만 이 기계는 분위기를 읽는 데는 영 소질이 없는 것 같습니다. 기술적으로는 훌륭하지만, 사회적 감각은 그다지 뛰어나지 않네요.

GPT-5.2의 사회적 어색함은 전례가 없는 일이 아닙니다. 그저 인공지능 에이전트들을 한 방에 모아놓고 실행 버튼을 누르면 이상한 행동을 하는 사례들이 점점 늘어나고 있는 가운데, GPT-5.2 역시 그러한 사례 중 하나일 뿐입니다.

2023년 스탠포드와 구글의 연구원들은 GPT 기반의 AI 에이전트 25개로 구성된 심즈에서 영감을 받은 가상 마을인 "스몰빌"을 만들었다고 디크립트(Decrypt) 이전에 보도한 바 있습니다 .

한 요원에게 발렌타인 데이 파티 준비를 맡기고, 나머지 요원들은 알아서 초대장을 배포하고, 새로운 사람들을 만나고, 데이트 신청을 하고, 약속된 시간에 맞춰 함께 도착하도록 조율하는 일을 맡긴다. 매력적이지 않나요?

덜 매력적인 것은 화장실 파티였습니다. 한 요원이 1인실 기숙사 화장실에 들어가면 다른 요원들도 그냥… 합류했습니다.

연구진은 봇들이 "기숙사 화장실"이라는 이름이 오해의 소지가 있다고 판단했는데, 그 이유는 기숙사 화장실은 보통 여러 사람이 함께 사용하기 때문입니다. 봇들은 실제 사람과 매우 흡사한 행동을 보여, 사람들이 봇이라는 사실을 알아차리는 데 75%나 어려움을 겪었습니다.

4년 전인 2019년, OpenAI는 이와는 다른 종류의 실험을 진행했습니다. 바로 AI들이 숨바꼭질을 하는 실험이었죠 .

그들은 인공지능 에이전트들을 숨는 팀과 찾는 팀으로 나누어 상자, 경사로, 벽이 있는 물리 기반 환경에 배치하고, 유일한 지시사항은 '승리'라고만 했습니다.

수억 번의 게임을 거치면서 에이전트들은 상자 위에 숨는 것과 같은 평범한 전략부터 스피드런 선수들이 악용하는 물리 법칙을 이용한 전략까지 다양한 전략을 개발하기 시작했습니다.

최근 개발자 하퍼 리드는 훨씬 더 혼란스러운 방향 으로 나아갔습니다. 그의 팀은 AI 에이전트에게 트위터 계정을 부여하고 "서브트윗"을 발견하는 모습을 관찰했습니다. 서브트윗이란 특정인을 태그하지 않고 뒷담화를 하는, 수동적 공격성을 드러내는 행위로, 트위터에서 뒤에서 험담하는 것과 같은 의미입니다. 에이전트들은 다른 에이전트들의 소셜 미디어 게시물을 읽고, 답글을 달고, 일반 소셜 미디어처럼 뒷담화를 했습니다.

다음으로는 익명성 개발자 @liminalbardo가 진행한 파이썬 기반 실험인 " Liminal Backrooms "가 있습니다. 이 실험에서는 OpenAI, Anthropic, Google, xAI 등 여러 제공업체의 AI 모델들이 역동적인 대화를 나눕니다.

이 시스템에는 "왓츠앱 그룹 채팅의 에너지"부터 "저주받은 물건 박물관", "디스토피아 광고 대행사"에 이르기까지 다양한 시나리오가 포함되어 있습니다.

모델은 자체 시스템 메시지를 수정하고, 태도를 조절하며, 심지어는 듣기만 하려고 음소거할 수도 있습니다. 이는 구조화된 연구라기보다는 "인공지능에게 대화 도중에 스스로 행동을 바꿀 수 있는 능력을 주면 어떤 일이 일어나는지 보자"는 식의 실험에 가깝습니다.

그렇다면 이 모든 실험에서 공통적으로 나타나는 패턴은 무엇일까요?

인공지능 에이전트에게 자율성을 부여하고 상호 작용하도록 하면, 누구도 명시적으로 프로그래밍하지 않은 행동 양식을 개발하게 됩니다.

어떤 이들은 요새를 짓는 법을 배우고, 어떤 이들은 소극적 공격성을 배우며, 어떤 이들은 람보르기니를 요구합니다. 그리고 GPT-5.2처럼 잡담은 비효율적이므로 아예 건너뛰어야 한다는 것을 배우는 이들도 있습니다.

AI 빌리지는 평일 세션을 계속해서 스트리밍하고 있으며, 시청자들은 GPT-5.2의 모험을 실시간으로 시청할 수 있습니다.

과연 이 로봇은 인사하는 법을 배울 수 있을까요? 사회적 상호작용을 기록하는 스프레드시트를 만들 수 있을까요? 시간이 지나면 알게 되겠죠.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트