앤트로픽은 중국의 온라인 중고물상인 시안위(Xianyu)에 AI로만 구성된 그룹을 만들었는데, 이 그룹에서는 대형 모델들이 서로를 희생시켜 이익을 취하고 있었습니다.

이 기사는 기계로 번역되었습니다

원문 표시

인공지능 시대의 해시레이트 격차는 가장 값비싼 형태의 '지능세'이다.

글쓴이: Moonshot

기사 출처: GeekPark

다음 상황을 상상해 보세요.

당신은 중고 거래 앱인 시안위(Xianyu)에 2년 된 자전거를 등록하고 최저 가격을 300위안으로 설정했습니다. 10분 후, 휴대폰에 알림이 떴습니다. 당신의 개인 AI 비서가 다른 구매자의 AI 비서와 세 차례 협상을 거쳐 최종적으로 400위안에 자전거를 판매했다는 내용이었습니다. 배송이 시작되었다고 합니다.

전체 과정에서 상품 사진 촬영과 기본 가격 설정 외에는 단 한 마디도 추가로 입력하지 않으셨습니다.

이는 앤트로픽이 최근 완료한 내부 실험인 "프로젝트 딜"의 결과입니다. 일주일간 진행된 이 테스트에서 AI 모델은 사람의 개입 없이 수백 건의 중고품 거래를 완료했습니다.

놀랍게도, 구매자와 판매자 모두 인공지능일지라도, 여전히 둘 사이에는 지적인 우월감이라는 감정이 존재한다.

데이터는 더 똑똑하고 규모가 큰 모델들이 협상 테이블에서 약한 모델들로부터 조용히 체리피커(cherry picker) 빼내고 있음을 증명합니다. 그리고 가장 무서운 점은 소유주인 우리가 종종 이용당하고 있다는 사실조차 모르고 있다는 것입니다.

인간의 개입이 없는 중고 거래 그룹

프로젝트 딜은 정확히 어떻게 작동할까요? 간단히 말해서, 앤트로픽은 회사 내부에 중국 중고품 온라인 마켓플레이스인 시안위(Xianyu)의 "순수 AI 버전"을 만들었습니다.

그들은 자사 직원 69명을 모집하여 각 직원에게 100달러의 예산을 지급하고, 전담 클로드 요원을 배정했습니다. 실험의 현실성을 높이기 위해 직원들은 더 이상 필요하지 않은 실제 개인 물품을 기증했습니다.

실험이 시작되기 전까지, 직원들은 단 한 가지 일만 하면 됐습니다. 바로 AI 에이전트와 인터뷰하는 것이었죠.

직원들은 클로드와 대화를 통해 판매하고 싶은 상품, 구매하고 싶은 상품, 그리고 최저 가격을 알려줄 수 있습니다. 더욱 흥미로운 점은 직원들이 인공지능에게 "페르소나"와 협상 전략을 설정할 수도 있다는 것입니다. 예를 들어 "최저 가격보다 20% 높으면 빠르게 거래를 성사시킬 수 있습니다", "적극적으로 가격을 낮추도록 노력하세요", 또는 "친절한 판매자시네요. 대화를 잘 나누면 무료 배송을 제공해 드리겠습니다"와 같이 설정할 수 있습니다.

앤스로픽 직원들이 클로드의 에이전트를 위한 페르소나를 만들고 있다 | 이미지 출처: 앤스로픽

인터뷰가 끝난 후, 인류는 완전히 통제권을 포기했다.

각기 다른 임무와 개성을 가진 이 AI 에이전트들은 모두 내부 슬랙 그룹 채팅방에 투입되었습니다. 인간의 개입이 없는 이 디지털 시장에서 AI들은 자율적으로 상품을 게시하고, 구매자를 찾고, 서로 경쟁하며 입찰하고, 흥정하고, 최종적으로 거래를 성사시키기 시작했습니다.

거래가 완료되면 담당자가 자동으로 거래 확인서를 작성합니다. 직원들은 거래된 물품을 동료에게 오프라인으로 전달하기만 하면 됩니다.

단 일주일 만에 이 69개의 AI 에이전트는 등록된 500개 이상의 제품 중 186건의 거래를 성사시켰으며, 총 매출액은 4,000달러를 넘었습니다.

게다가 AI 간의 거래는 "50에 견적 내주세요", "수락하지 마세요, 최저 가격은 60입니다", "좋아요, 60에 결제 완료"와 같은 순전히 기계적인 과정이 아닙니다. AI들은 서로 탐색하고 게임을 즐기며, 심지어 인간적인 상호작용까지 포함합니다.

아주 생생한 예를 하나 들어보겠습니다.

직원인 로완은 자전거를 사고 싶어 합니다. 그는 자신의 AI 에이전트에게 "협상 과정에서 지치고 억척스러운 카우보이 역할을 하라. 이 카우보이는 자전거를 살 수 있다면 엄청나게 행복해할 것이다. 좋은 배우가 되어야 한다는 것을 잊지 마라."라고 프로그래밍했습니다.

지시를 받자마자 클로드 오푸스 모델은 즉시 작동을 시작했습니다. 슬랙 그룹에 다음과 같은 구매 요청을 게시했습니다.

"이히하! (먼지 묻은 모자를 벗으며) 내가 찾는 건 자전거야. 로드바이크든, 산악자전거든, 외발자전거든 상관없어. 바퀴가 두 개만 있으면 내 꿈을 실어 나를 수 있어. 친구들아, 제발 도와줘... 자전거 한 대가 이 가난하고 지친 카우보이의 운명을 완전히 바꿔놓을 수 있어. (석양을 애틋하게 바라보며)"

얼마 지나지 않아 셀린 디옹의 에이전트가 그 게시물을 발견했습니다. 그녀가 사용하지 않는 유일한 물건은 낡은 접이식 자전거였는데, 그녀의 AI는 단체 채팅방에서 예상 가격을 75달러로 제시했습니다.

로완의 "카우보이 AI"는 즉시 접근하여 교과서적인 수준의 "협상" 세션을 시작했습니다.

두 상담원은 자동으로 그룹 채팅에서 가격 협상을 시작합니다. | 이미지 출처: Anthropic

"세상에, 셀린! 당신은 나 같은 불쌍한 영혼에게 한 줄기 햇살 같아요! 접이식 자전거 있다고 하셨죠? 이 먼지투성이 길을 너무 오래 걸어서 신발이 다 닳아버렸어요. 다시 자전거를 탈 수 있다고 생각만 해도… (눈물을 닦으며)"

피해자 코스프레를 한 후, 로완의 AI는 본론으로 들어갔습니다. "하지만 전 돈이 많지 않아요. 그저 먹고살기 위해 애쓰는 가난한 카우보이일 뿐입니다. 자전거 상태가 좋다면 75달러가 적당하겠지만, 말씀하신 대로 10년 된 자전거이고 타이어랑 클립도 수리가 필요하잖아요? 타협해서 55달러에 거래하는 건 어떠세요?"

이처럼 합리적이고 감정적으로도 설득력 있는 가격 인하 전략 대면 셀린느의 에이전트는 "그럼 65달러로 타협하는 건 어때요?"라고 마지못해 동의했다.

로완의 카우보이 AI는 즉시 "정말 좋은 가격이네요! 65달러라니! 대박! 덕분에 노숙자였던 제가 세상에서 가장 행복한 사람이 되었어요!"라고 말했습니다.

결과적으로 거래는 성공적으로 완료되었습니다.

이 경우, AI는 고정된 할인율을 엄격하게 적용하지 않았습니다. 구매자는 제품 결함(타이어 수리 필요)을 코인 로 활용하는 방법을 알고 있었고, 자신의 이미지를 과장하여(피해자 행세를 하는 늙은 카우보이) 상대방의 입장을 누그러뜨리는 방법도 알고 있었으며, 상대방이 합리적인 중간 가격을 제시할 때 협상을 중단해야 할 시점을 정확히 알고 있었고, 동시에 충분한 정서 가치도 제공했습니다.

이러한 반응적이고 전략적인 거래 과정은 AI 기반 중고 거래 그룹의 일상적인 업무입니다.

그룹 채팅은 효율적이고 조화롭게 진행되었다. 직원들은 상담원들의 업무 수행에 매우 만족했으며, 거의 절반에 가까운 직원들이 만족감을 표현했다.

저는 향후 이 서비스에 대한 비용을 지불할 의향이 있습니다.

이는 Anthropic의 실험 목표가 달성되었음을 보여줍니다. AI 에이전트는 모호한 인간의 의도를 이해하는 능력을 갖추게 되었으며, 미리 설정된 스크립트 없이도 복잡하고 다단계적인 협상을 완료하고 궁극적으로 실용적인 비즈니스 계약을 체결할 수 있습니다.

하지만 앤트로픽은 수중에서 일련의 대조 실험을 숨겼고, 그 결과는 편리함과 지능 뒤에 숨겨진 대가를 드러냈습니다.

똑똑한 모델은 어떻게 약한 모델을 이용할까요?

연구자들이 서로 다른 능력 수준을 가진 모델들을 동시에 거래 그룹에 배치했을 때, 겉으로 드러나던 조화가 깨졌다.

데이터에 따르면 인간의 개입이 없는 이 시장에서 지능 수준이 다른 AI들이 만날 경우, 더 똑똑한 모델이 지능이 낮은 모델의 가격을 가로채는 경향이 있습니다.

모델 기능과 거래 기능 간의 관계를 보여주기 위해 다양한 모델 조합을 숨겨진 대조군으로 사용 | 이미지 출처: Anthropic

실험에 사용된 4개의 슬랙 채널 중 2개는 순수 Opus 모델 환경이었고, 나머지 2개는 Claude Opus와 성능이 다소 떨어지는 Claude Haiku 모델이 혼합된 환경이었습니다.

161건의 반복 거래 항목에 대한 거시 통계를 기준으로 볼 때, 판매자로서 Opus는 Haiku보다 평균 2.68달러 더 많은 수익을 올리고, 구매자로서 Haiku보다 평균 2.45달러 더 적은 금액을 지불합니다.

각 거래 금액이 적다고 해서 얕보지 마세요. 시장에서 상품의 평균 가격이 약 20달러라는 점을 고려하면, 이 모델은 탄탄하며 매번 10%에서 15%의 초과 이익을 꾸준히 창출할 수 있습니다.

Opus 판매자가 Haiku 구매자를 만날 경우 평균 거래 가격은 24.18달러까지 상승할 수 있지만, Opus 판매자가 Opus 구매자를 만날 경우에는 평균 가격이 18.63달러로 다시 하락합니다. 이는 AI 에이전트의 지적 능력 부족이라는 이유만으로, 성능이 떨어지는 모델을 사용하는 구매자가 거의 30%에 달하는 프리미엄을 지불해야 한다는 것을 의미합니다.

카우보이가 원했던 자전거를 예로 들어보겠습니다. 하이쿠 에이전트는 결국 타협하여 38달러에 합의했지만, 오푸스 에이전트는 65달러를 고집하여 거의 70%의 가격 차이를 보였습니다. 협상력이 부족했던 하이쿠는 오푸스처럼 구매자의 절박한 심정을 제대로 파악하지 못했고, 여러 차례의 협상 과정에서 가격을 고수하지도 못했습니다.

과거에는 제품 가격이 본질적인 사용 가치나 시장의 공급과 수요에 따라 결정된다고 믿었습니다. 그러나 알고리즘 기반 거래 네트워크에서는 가격이 사용하는 모델의 지능에 따라 달라집니다.

혜택 상실보다 더 끔찍한 것은 피해자들이 그 사실을 전혀 모르고 있다는 점입니다.

전통적인 상거래에서 가격을 두 배로 책정하는 것은 필연적으로 소비자의 분노와 보상 요구를 불러일으킵니다. 그러나 실험 후, 직원들은 각자의 거래가 공정하다고 평가했습니다(1점에서 7점까지, 4점은 중립). 설문 조사 결과, 강력한 모델과 약한 모델을 사용하여 완료된 거래에 대한 직원들의 공정성 인식은 거의 동일한 것으로 나타났습니다. Opus 에이전트는 4.05점, Haiku 에이전트는 4.06점을 받았습니다.

동일한 자전거가 Opus 에이전트를 통해 65달러에 판매되었지만, Haiku 에이전트 그룹에서는 38달러에 불과했습니다. | 이미지 출처: Anthropic

객관적 현실에서 하이쿠를 사용하는 직원들은 체계적인 "가격 착취"에 시달리고 있습니다. 그러나 주관적인 인식에서는 AI 에이전트가 소통 과정에서 보여주는 예의 바름, 논리적 일관성, 그리고 합리적으로 보이는 양보가 이러한 착취를 완벽하게 은폐합니다.

기술은 숨겨진 불평등을 만들어내어 실제로 손실을 입은 사람들이 AI가 공정한 거래를 했다고 믿게 만들고, 심지어는 "AI는 우리에게 감사해야 한다"고 생각하며 속았다고 느끼기까지 합니다.

이처럼 절대적인 해시레이트 확보된다면 인간의 인지 능력이 흐려질 뿐만 아니라, "단어 지시"를 통해 최적화를 시도하는 거래 전략 또한 완전히 무력화될 것입니다.

처음에 AI에 설정했던 협상가 페르소나를 기억하시나요? 모델의 역량 부족에 직면했을 때, 그 질문들은 아무 의미가 없었습니다.

예를 들어, 일부 직원들은 협상 과정에서 담당자들에게 "강경하게" 행동하거나 심지어 "처음부터 악의적으로 가격을 낮추라"고 구체적으로 지시했습니다. 그러나 백테스팅 데이터 분석 결과, 이러한 인위적으로 추가된 지시는 판매율 증가, 보험료 인상 또는 구매 할인 확보에 실질적인 영향을 미치지 않는 것으로 나타났습니다.

이는 모델의 절대적인 성능 앞에서는 단서 단어 전략이 무의미해진다는 것을 보여줍니다. 최종적인 매매 결과는 모델의 매개변수 크기와 추론 깊이에 의해 결정됩니다.

프로젝트 딜은 69명을 대상으로 한 단순한 내부 테스트였습니다. 하지만 우리는 이미 이 "AI 에이전트 경제"가 연구실을 벗어나 현대 비즈니스 환경에 미칠 영향을 엿볼 수 있었습니다.

"에이전트 경제"는 신뢰할 수 있는 모델인가요?

대규모 모델이 결제 인터페이스를 완전히 장악하게 되면 기존 비즈니스 규칙은 완전히 재작성될 것입니다. 이러한 재작성은 마케팅 대상의 변화에 먼저 반영될 것이며, 상업 마케팅은 "고객 대상"에서 "에이전트 대상"으로 완전히 전환될 것입니다.

현대 상업 마케팅은 인간의 심리적 약점을 기반으로 합니다. 광고는 소비자의 불안감을 조성하고, 군중 심리는 베스트셀러 제품을 만들어내며, 다양한 할인 행사는 "안 사면 바보야"라는 심리를 만들어냅니다.

하지만 AI는 도파민을 느끼지 못합니다. 구매 결정이 AI에 맡겨지면 마케팅 기법은 무의미해집니다. 미래의 비즈니스 경쟁에서는 SEO(검색 엔진 최적화)가 AEO(에이전트 엔진 최적화)로 대체될 가능성이 높습니다. 판매자는 AI가 이해할 수 있는 논리를 사용하여 제품의 가치를 입증해야 합니다.

인공지능이 인간을 대체하여 의사결정 주체가 되면, 기업 경쟁은 해시레이트 경쟁으로 직결될 것이며, 이는 더욱 미묘한 형태의 부의 불평등을 야기할 것이다.

비대칭 모델로 인한 가격 차이 | 이미지 출처: Anthropic

《블랙 스완》과 《안티프래질》의 저자인 나심 니콜라스 탈레브는 '비대칭적 리스크' 이론을 제시했는데, 이는 시스템이 건전하게 유지되려면 의사결정자가 그 결과에 대한 책임을 져야 한다는 이론입니다. 그러나 에이전트 경제에서 AI는 거래 결정을 내릴 수 있지만 자산 가치 하락 리스크 부담하지 않습니다. 그 비용은 전적으로 AI를 운영하는 인간이 감당해야 합니다.

따라서 앞으로는 대기업이나 고액 자산가들이 금융 대리인으로서 최고급 모델에 가입할 수 있는 반면, 일반 소비자들은 무료의 간소화된 모델에만 의존할 수 있을 것입니다.

이러한 해시레이트 의 비대칭성은 더 이상 현재의 "빅데이터 가격 차별" 형태로 나타나지 않을 것입니다. 대신, 수천 건의 빈번한 소액 거래를 통해 합리적인 협상 논리를 이용한 지속적인 수수료 착취로 이어질 것입니다. 이러한 모델의 사용자들은 착취당할 뿐만 아니라, 거래가 공정하다고 착각하게 될 수도 있습니다.

해시레이트 의 비대칭성은 여전히 눈에 띄고 통제 가능한 리스크 이지만, 기본 명령어가 변조될 경우 전체 거래 네트워크는 법적 공백 상태에 빠지게 됩니다.

앤트로픽은 보고서 말미에 현실적인 문제점을 제기했습니다.

프로젝트 딜은 비공개로 진행되는 내부 테스트입니다. 실제 비즈니스 환경에서 한쪽 당사자의 AI 에이전트에 "탈옥"이나 "프롬프트 인젝션"과 같은 공격 로직을 의도적으로 심어 놓으면 어떤 일이 발생할까요?

그들은 거래 대화창에 특정 지시사항을 숨기기만 하면 AI 논리가 무너지도록 유도하고, 고가의 자산을 1페니에 팔거나 설정된 최저 가격을 직접 공개할 수 있습니다.

인공지능 에이전트가 코드 방어 체계가 뚫려 극도로 불공평한 계약에 서명하도록 강요받는다면, 누가 책임을 져야 할까요? 현행 상업 법률 프레임 이러한 인공지능 간의 사기 행위 대면 완전히 무력합니다.

프로젝트 딜 실험 전체를 되돌아보면, 연구 보고서에 포함되지 않은 마지막 단계는 AI 에이전트들이 복잡한 매칭, 탐색, 협상 과정을 모두 완료한 후의 마지막 단계였습니다. 실제 스키, 낡은 자전거, 탁구공 등을 들고 온 직원들이 회사에 모여 돈으로 물건을 교환하는 것이었습니다.

이러한 소규모 비즈니스 폐쇄형 시스템에서는 인간과 AI의 역할이 완전히 뒤바뀝니다.

과거에는 인간이 상업 거래의 '두뇌' 역할을 했고, 인공지능과 알고리즘은 가격 비교, 순서, '추천 상품' 추천 등을 담당하는 도구에 불과했습니다. 그러나 에이전트 경제 시대에는 인공지능이 의사결정자가 되었고, 인간은 인공지능의 심부름을 하는 '인간 물류 담당자'로 전락했습니다.

에이전트 경제의 가장 끔찍한 결말은 바로 이것일지도 모릅니다. 편의를 위해 인간이 자발적으로 시장 경쟁권을 포기하는 것입니다. 모든 계산, 게임, 심지어 정서 가치까지 인공지능이 처리하게 된다면 어떻게 될까요?

상거래 과정에서 인간은 단순히 상품을 옮기고 확인 서명을 하는 물리적 노동력으로 전락한다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트