이제 주요 모델 제조업체들은 토큰 열풍에 작별을 고해야 할 때입니다.

이 기사는 기계로 번역되었습니다

원문 표시

Anthropic은 타사 도구로 인한 해시레이트 비용 급증 때문에 OpenClaw와 같은 도구에 대한 Claude 구독을 제한한다고 발표했는데, 이는 에이전트 시대에 대규모 모델에 대한 구독 기반 모델의 지속 불가능성을 드러낸 것입니다.

글쓴이: 카이 카이

기사 출처: Bohu Finance(bohuFN)

“토큰을 싼 가격에 판매하고 제3자에게 개방하는 것은 보기에는 편리해 보이지만 함정입니다.”

최근 샤오미 그룹의 MiMo 플랫폼 책임자인 뤄푸리는 X 플랫폼에 기고한 글에서 토큰 가격 전쟁을 "함정"에 비유하며 대형 모델 기업들이 가격 전쟁에 맹목적으로 참여하지 말 것을 경고했습니다.

며칠 전, 앤트로픽은 갑자기 타사 도구의 클로드 구독 접근을 차단하겠다고 발표했는데, 이는 루오 푸리가 토큰 가격 책정 논리에 대한 글을 발표할 기회가 되기도 했습니다.

전국적인 '랍스터 양식' 열풍 속에서 뤄푸리의 공개 서한과 앤트로픽의 '금지' 조치는 업계에서 보기 드문 '반대 목소리'가 되어 이 열풍에 찬물을 끼얹었습니다.

하지만 문제는 주요 모델 제조업체들이 정말로 이러한 비용을 이해하지 못하는가 하는 점입니다. 아니면 업계에서 암묵적으로 존재하는 일종의 게임, 즉 엄청난 양의 토큰을 미래로 가는 티켓과 맞바꾸는 행위, 인공 일반 지능(AGI)의 미래에 거는 도박일 뿐일까요?

그렇다면 자는 척하는 사람을 누가 깨울 수 있겠어요?

01 앤트로픽은 더 이상 버틸 수 없었다.

며칠 전, Anthropic은 모든 사용자에게 이메일을 보내 4월 4일 오후 3시(현지 시간)부터 Claude Pro 및 Max 구독으로 OpenClaw와 같은 타사 도구 사용이 더 이상 허용되지 않는다고 발표했습니다.

상황은 갑작스럽게 전개되었고, 앤트로픽은 사용자들에게 한 달 구독료에 해당하는 일회성 보조금을 지급했습니다. 하지만 월 200달러로 클로드 서비스를 무제한 이용할 수 있었던 예전과 비교하면, 이 보조금은 턱없이 부족한 금액이었습니다.

이 소식은 소셜 미디어에서 즉각적인 논란을 불러일으켰고, 사용자들은 오픈클로 창립자 피터 스타인버그와 앤스로픽 간의 오랜 갈등을 고려할 때 이번 조치를 "강을 건너면서 다리를 불태우는 격"이라며 맹렬히 비난했습니다.

OpenClaw가 처음 출시되었을 때 이름은 Clawdbot이었습니다. 하지만 이 이름이 Anthropic사가 소유한 Claude라는 이름과 매우 유사하다는 이유로 Anthropic사가 변호사를 통해 이름 변경을 요구하는 서한을 보내면서 분쟁이 시작되었습니다.

더욱 중요한 것은, OpenClaw가 오픈 소스 지능형 에이전트에 대한 시장 수요를 입증한 후, Anthropic이 Claude Cowork를 출시했다는 점입니다. 이는 보안상의 고려 외에도 OpenClaw를 자사 제품으로 대체하려는 시도로 해석되기도 했습니다.

하지만 이러한 설명들 중 어느 것도 "금지"의 진정한 이유를 설명하지 못합니다. 앤트로픽이 조치를 취하게 된 결정적인 이유는 바로 비용 문제였습니다.

앤트로픽은 사용자들에게 보낸 서한에서 "타사 도구들이 시스템에 과도한 부담을 주고 있으며, 우리는 핵심 제품 사용자들의 사용자 경험을 보장하는 것을 최우선으로 해야 합니다."라고 밝혔습니다.

해외 언론 보도에 따르면, 유명 유니콘 기업인 커서(Cursor)는 작년에 월 200달러짜리 클로드 코드(Claude Code) 구독료가 최대 2,000달러의 컴퓨팅 자원을 소모할 수 있다고 추산했는데, 이는 앤트로픽이 막대한 보조금을 지급해왔음을 시사합니다. 다른 분석가들도 앤트로픽의 구독 모델에 드는 실제 해시레이트 비용이 5,000달러에 달할 수 있다고 지적했습니다.

이는 대형 모델들이 운영해왔던 구독 기반 요금 모델이 에이전트 시대에는 더 이상 실현 가능하지 않을 수 있음을 의미합니다.

한편, 에이전트 모델 하에서는 토큰 사용량이 기하급수적으로 증가하고 있습니다.

대규모 모델이 아직 대화 단계에 있을 때, 한 번의 대화에 약 1,000~3,000개의 토큰이 소모됩니다. 플랫폼은 구독 모델을 작동시키기 위해 대부분의 사용자를 대표하는 평균 사용량 값만 계산하면 됩니다.

하지만 에이전트 기반 시나리오에서는 한 명의 사용자가 동시에 10개 또는 심지어 100개의 에이전트를 실행할 수 있으며, 각 에이전트는...

해당 작업은 24시간 내내 실행되며, 각 작업은 여러 모델 추론을 유발합니다. 상호작용 횟수가 증가함에 따라 토큰 소비가 눈덩이처럼 불어나는 효과가 발생하고, "적은 사용량"으로 "더 많은 사용량"을 보조하는 구독 시스템은 균형을 잃게 됩니다.

참고로, 일반적인 ChatGPT 사용자는 매일 채팅을 하더라도 한 달에 백만 토큰 정도만 소비하는 반면, "쉬림프 파밍"과 같은 고액 토큰 사용자는 하루에 3천만에서 1억 토큰을 소비합니다.

반면, 대규모 모형 제조업체의 비용은 사용량 급증에도 불구하고 자연스럽게 감소하지 않고 오히려 계속 증가했습니다.

스탠포드 대학교의 "2025 AI 지수 보고서"는 효율적인 소형 모델 덕분에 GPT-3.5 수준 모델의 추론 비용이 지난 2년 동안 원래 비용의 1/280로 떨어졌고, 하드웨어 비용은 매년 30%씩 감소했다고 지적합니다.

하지만 추론 비용은 감소했지만, 학습 비용은 여전히 엄청납니다. 더욱 중요한 것은 전 세계 해시레이트 여전히 부족하고, 에이전트 사용자가 많아질수록 기업의 운영 비용은 더욱 높아진다는 점입니다.

예를 들어, 오픈아이(OpenAI)는 투자자들에게 해시레이트 지출이 2028년까지 1210억 달러에 달할 것으로 예상하며, 그 시점에서 손실이 850억 달러에 이를 수 있고, 이는 상장 기업 중 손실 기록을 넘어설 가능성이 있다고 밝혔습니다.

앤트로픽의 학습 비용은 오픈아이얼의 약 40% 수준으로 그리 높지는 않지만, 현재 자금 소진이 심각한 상황이므로 제3자 도구에 의해 체리피커(cherry picker) 당하는 것을 원치 않는 것은 당연합니다.

(이미지: OpenAI와 Anthropic의 학습 비용 비교)

02 토큰 가격은 함정입니다.

앤트로픽이 더 이상 버틸 수 없다면, 국내 대형 모형 제조업체들은 어떻게 될까요?

뤄푸리는 아마도 앤트로픽의 상황에 가장 공감할 수 있는 동료일 것입니다. 그녀는 소셜 미디어에 클로드 코드가 수익성이 없을 가능성이 높고, 심지어 손실을 보고 있을 수도 있다고 게시했습니다. 클로드 코드의 가격 책정 방식이 제대로 작동하려면 사용자들이 앤트로픽 자체 프레임 사용해야 하는데, 그렇지 않으면 문제가 발생하기 때문입니다.

그녀는 OpenClaw를 사례 연구로 사용하여 타사 프레임 통합에서 발생할 수 있는 잠재적인 문제점을 지적했습니다.

"OpenClaw의 컨텍스트 관리 방식을 살펴봤는데, 정말 형편없습니다. 사용자 쿼리 하나당 여러 차례에 걸쳐 가치가 낮은 도구 호출이 발생하는데, 각 호출은 각각 독립적인 API 요청이며 긴 컨텍스트를 포함하고, 종종 10만 개가 넘는 토큰을 사용합니다."

간단히 말해, OpenClaw는 Claude Code의 기본 프레임 보다 동일한 작업을 훨씬 더 많이 실행하므로 실제 비용이 구독료보다 수십 배 더 많이 발생할 수 있습니다. 비용 구조 측면에서 볼 때, OpenClaw를 가볍게 사용하는 사용자조차도 헤비 사용자와 마찬가지입니다.

따라서 토큰을 저렴한 가격에 판매하고 제3자에게 개방하는 것은 겉보기에는 사용자 친화적이지만 실제로는 함정입니다. 비용을 통제하기 위해 기업은 해시레이트 낮추거나 더 저렴하고 덜 정교한 모델을 사용할 수밖에 없는데, 사용자들은 이러한 덜 정교한 모델로 인해 반복적으로 문제를 겪게 되어 결국 사용자 경험이 저하됩니다.

하지만 뤄푸리의 발언은 국내 대형 모형 산업계 내에서 소수 의견에 불과하다. 적어도 현재로서는 대부분의 대형 제조업체와 대형 모형 회사들은 여전히 소량 생산을 자신들의 역량을 가늠하는 중요한 지표로 여기고 있다.

글로벌 대규모 모델 통합 및 라우팅 플랫폼인 오픈라우터의 데이터에 따르면, 중국 대규모 모델의 주간 통화량이 한 달 연속 해외 모델을 넘어섰습니다. 통화량이 가장 많은 모델은 샤오미, 지에웨싱천, 미니맥스 등 모두 국내 모델입니다.

글로벌 IT 대기업들도 이러한 추세를 부추기고 있는데, 예를 들어 직원들에게 AI 도구를 더 자주 사용하도록 장려하는 방식입니다. 메타는 토큰 소비량 순위표까지 만들었는데, 이는 IT 대기업들에게 암묵적인 핵심성과지표(KPI)가 되었습니다.

따라서 토큰 가격이 비싼 이유는 단순히 높은 가격 때문만이 아니라, 끝이 보이지 않는 소모전이기 때문입니다. 모두가 필사적으로 더 많은 토큰을 소비할수록, 해시레이트 발생하는 수요를 결코 따라잡을 수 없을 것입니다.

더욱이, 토큰 소비가 허황된 번영인지에 대한 질문과 비교해 볼 때, 대규모 기업들은 실제 돈의 유혹을 뿌리치기가 더 어렵습니다. 앤트로픽의 연간 매출은 단 3개월 만에 90억 달러에서 300억 달러로 급증했습니다.

토큰 가격은 "함정"일 수 있지만, 주요 글로벌 제조업체들이 서로 경쟁하는 상황에서 누구도 먼저 "브레이크"를 걸려고 하지 않습니다.

알리바바, 바이트댄스, 텐센트와 같은 주요 기술 기업들은 AI 슈퍼 게이트웨이 확보를 위한 경쟁을 오랫동안 벌여왔지만, 여전히 "돈을 쏟아부어 트래픽을 끌어모으는" 인터넷 전략에서 벗어나지 못하고 있습니다. 뇌물을 주고 트래픽 투자를 늘리는 것은 일일 활성 사용자(DAU)를 끌어올릴 수는 있지만, "돈의 힘"이 사라지면 사용자들은 금세 떠나갑니다.

'랍스터'는 새로운 기회를 제공합니다. 사용자가 설치를 완료하면, 마치 자신의 '지능형 비서'를 클라우드 플랫폼에 내장하는 것과 같습니다. 토큰이 지속적으로 소모될 뿐만 아니라, 개인 데이터도 생태계에 축적됩니다. 마이그레이션 비용은 점점 더 높아질 것이며, 대기업들은 당연히 이러한 새로운 '생태계 진입점'을 놓치지 않을 것입니다.

Kimi와 Zhipu 같은 2차 공급업체들에게 "Lobster"의 등장은 해시레이트 대한 수요를 촉진시켜, 그들의 모델을 호출할 수 있게 해주고 API 성장을 위한 강력한 스토리를 제공했습니다. 이는 그들이 API를 더욱 적극적으로 판매하도록 동기를 부여하기에 충분합니다.

논리적으로 볼 때, 뤄푸리의 토큰에 대한 평가는 옳습니다. "가격 하락"은 무한정 지속될 수 없습니다. 하지만 "랍스터"를 기반으로 한 성장 스토리를 성공적으로 구현해 온 대기업들은 조금 더 "잠자는 척"하는 것이 좋을지도 모릅니다.

03. 효율성은 가격보다 더 중요합니다

자는 척하는 사람을 깨울 수는 없지만, 현실은 다를 수 있다. 토큰 소비가 끊임없이 증가하고 있지만 그에 상응하는 수익 증가는 이루어지지 않고 있는데, 이는 대규모 기업이 피할 수 없는 문제이다.

앤트로픽을 벤치마킹 대상으로 삼는 즈푸(Zhipu)를 예로 들면, 2025년에는 "높은 성장과 높은 손실"이라는 성적표를 내놓았습니다. 총 매출은 7억 2,400만 위안으로 전년 대비 131.9% 증가했지만, 손실은 47억 1,800만 위안으로 전년 대비 59.5% 증가했습니다.

Zhipu의 창립자인 장펑은 Zhipu가 Anthropic과 유사한 대안이 되는 것을 목표로 한다고 밝힌 바 있으며, Anthropic이 200달러에 팔린다면 Zhipu는 200위안에 팔겠다고 농담조로 말하기도 했습니다. 올해 3월, Zhipu는 원클릭 설치 프로그램인 AutoClaw를 출시했는데, 개인용 버전은 3,500만 토큰에 월 39위안, 1억 토큰에 월 99위안으로 책정되어 진입 장벽이 상당히 낮습니다.

하지만 이로 인한 재정적 부담 또한 매우 큽니다. 즈푸의 2025년 연구개발비는 31억 8천만 위안으로 전년 대비 44.9% 증가했습니다. 자체 인프라가 없는 즈푸는 외부 해시레이트 공급업체에 막대한 구매 비용을 지불해야 하는데, 이 비용은 2022년 1,463만 위안에서 2025년 상반기 11억 4,500만 위안으로 급증했습니다.

2026년부터 피할 수 없는 두 가지 고정 지출 항목인 연구 개발 투자와 해시레이트 비용에 대면 국내외 클라우드 업체들은 AI 해시레이트, 스토리지 및 기타 관련 제품 가격을 잇달아 조정해 왔습니다. 그러나 국내 모델이 여전히 해외 모델보다 저렴합니다.

2025년 12월 CMB 증권이 발표한 연구 보고서에 따르면, 국내 대규모 모델 API의 평균 가격은 토큰 백만 개당 약 3.88위안인 반면, 해외 모델은 토큰 백만 개당 약 20.46위안으로 국내 모델 API 가격의 5배 이상이었다.

가격 경쟁력으로 인해 수요가 급증했고, 이러한 상황에서 국내 대형 모델 제조업체들은 당분간 가격 경쟁에서 벗어나기 어려울 것으로 보인다. 그러나 소비가 공급을 초과함에 따라 무상 할당량 및 보조금 지급이 점차 축소되는 것은 불가피한 추세다.

뤄푸리는 대형 모델 산업의 해결책은 토큰 가격 인하가 아니라 "토큰 효율성이 높은 에이전트 프레임"와 "더 강력하고 효율적인 모델"의 결합이라고 언급했습니다. 에이전트 시대는 해시레이트 가장 많이 소모하는 자들의 시대가 아니라 해시레이트 가장 스마트하게 사용하는 자들의 시대입니다.

이는 대형 모형 제조업체들이 두 가지 방향으로 발전하도록 유도할 것입니다.

한편으로, 경쟁의 중심이 "해시레이트 규모"에서 "엔지니어링 효율성"으로 옮겨가고 있습니다. 단순히 API만 판매하는 기업은 점점 더 한계에 부딪히게 될 것입니다. 비즈니스 모델에 더 많은 가능성을 불어넣기 위해서는 모델 레이어를 스마트 하드웨어, 애플리케이션 제품 및 기타 기술과 심층적으로 통합해야 합니다.

반면, 토큰 수수료에 대한 단계별 가격 책정을 권장합니다. 현재 주류 결제 모델은 기본적으로 구독, 사용량 기반 요금제, 토큰 플랜 패키지를 포함하며, 이는 사용량 한도를 초과한 후에만 비용을 지불하는 방식입니다.

장기적으로 볼 때, 토큰 가격 책정에 있어 단순히 "수량에 따른 등급제"를 적용하는 것 외에도, 추론 능력이나 작업량과 같은 요소를 기반으로 하는 더욱 정교한 결제 시스템을 도입할 수 있습니다. 이는 플랫폼의 최대 해시레이트 에 대한 부담을 완화할 뿐만 아니라 수익 증대에도 기여할 수 있습니다.

예를 들어, DeepSeek은 "퀵 모드"와 "전문가 모드"라는 두 가지 새로운 진입점을 조용히 출시했는데, 이는 수익 공유 모델의 새로운 시도로 여겨집니다. Volcano Engine의 Tan Dai는 향후 특정 분야에 특화된 지능형 에이전트를 인큐베이팅 하고 답변한 질문 수에 따라 요금을 부과할 수도 있다고 밝혔습니다.

토큰 열풍은 당분간 지속될 수 있지만, 전체적인 모델에서 토큰 비용은 모든 기업과 사용자가 무시할 수 없는 비용 요소가 되었습니다.

궁극적으로 대규모 비즈니스는 순전히 기술적인 사업이 아니라 효율성과 가치 창출의 게임입니다. 장기적인 사업을 구축하고자 하는 대규모 기업은 당연히 비용과 편익을 계산하는 방법을 배워야 합니다. 탄탄한 기반을 갖춰야만 진정으로 높은 곳을 향해 나아갈 수 있습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트