클로드 페이블, 가격 두 배로 인상…최고 수준의 AI는 이제 사치가 되어가고 있다.

이 기사는 기계로 번역되었습니다
원문 표시

2026년 6월 9일, Anthropic은 복잡한 코드 계획 및 생성에 초점을 맞춘 새로운 모델인 Claude Fable 5를 출시했습니다. 출시 자체는 놀라운 일이 아니었지만, 함께 발표된 두 가지 정보가 개발자 커뮤니티에서 빠르게 논의를 불러일으켰습니다. 첫째, Fable 5의 API 가격이 이전 버전인 Opus 4.8의 두 배였고, 둘째, 6월 22일 이후에는 Fable 5가 Pro, Max 및 기타 구독 플랜에서 제외되어 API 호출 또는 사용 크레딧을 통해서만 접근할 수 있게 된다는 점이었습니다.

레딧의 개발자들은 Fable 5를 Max 20x 요금제로 실행하면 분당 신용 한도의 2%가 소모된다고 보고했습니다. 해커 뉴스(Hacker News)의 한 사용자는 일일 사용량을 기록하며 신용 한도 내에서 Fable 5 API 토큰 구매에 82.92달러를 지출했다고 밝혔습니다. 강력한 게임이지만, 그만큼 비용도 빠르게 소모됩니다.

이는 단순히 모델 가격 책정의 문제가 아닙니다. 최고 수준의 AI 모델이 기능에 따라 등급별로 가격이 책정되고, 최상위 등급 모델이 보편적인 구독 서비스에서 제외된다면, 더욱 중요한 질문이 제기됩니다. 과연 누가 최고의 모델을 활용하고 있을까요?

가격이 두 배로 오르고, 카운트다운이 시작됩니다.

Anthropic의 공식 발표에 따르면, Claude Fable 5는 최초로 공개 출시된 Mythos 등급 모델입니다. Mythos는 Anthropic의 최고 성능 모델 등급으로, 이전에는 Project Glasswing 파트너에게만 제공되었습니다. Fable 5는 기본적으로 Mythos 5의 "공개 출시" 버전으로, 정확한 코드 구조 구축 및 개발자의 심층적인 요구 사항 파악과 같은 시나리오에서 Claude Sonnet보다 훨씬 향상된 성능을 제공합니다.

이러한 기능에는 직접적인 비용이 수반됩니다. 앤스로픽의 공식 가격 페이지에 따르면, Fable 5 API 입력 가격은 백만 토큰당 10달러이고, 출력 가격은 50달러입니다. 비교하자면, 역시 앤스로픽에서 개발한 Opus 4.8은 입력 가격이 5달러, 출력 가격이 25달러이며, Sonnet 4.6은 입력 가격이 3달러, 출력 가격이 15달러입니다. Fable 5의 출력 가격은 Sonnet의 3.3배입니다.

접근 권한 또한 제한적입니다. 앤스로픽은 페이블 5가 6월 22일까지 모든 구독 플랜에 포함될 것이라고 확인했습니다. 6월 23일부터는 구독 플랜에서 페이블 5가 제외되며, 사용자는 이용 크레딧을 사용해야만 플레이할 수 있습니다. 공식 발표에 따르면 "용량이 허용되는 대로 표준 구독 기능으로 복원될 것"이지만, 구체적인 일정은 제시되지 않았습니다.

펜실베이니아 대학교 와튼 스쿨의 에단 몰릭 교수는 자신의 블로그 oneusefulthing.org에 Fable 5에 대한 심층 리뷰를 게재했습니다. 그는 "Fable은 Opus보다 두 배나 비싸고, 토큰 소모 속도를 보면 생산 비용이 '매우 높을 것'이라는 것을 알 수 있다"고 썼습니다. 몰릭 교수는 오랫동안 AI 모델 기능의 발전을 추적해 왔으며, 그의 이러한 평가는 가격 전략 자체에 대한 것이 아니라 모델 운영에 필요한 인프라 비용에 대한 지적입니다.

토큰 소모 속도는 얼마나 빠를까요? 레딧 사용자들은 클로드 맥스 20x 플랜으로 페이블 5를 사용할 경우 분당 약 2%의 크레딧 한도가 소모된다고 보고했습니다. 이 플랜은 월 200달러이며, 이 속도라면 한 시간도 채 안 되어 한 달 크레딧이 모두 소진될 것입니다. 해커 뉴스 개발자 사이먼 윌리슨은 일일 API 사용량을 기록했는데, 크레딧 한도 중 82.92달러를 소모했습니다.

Fable 5의 가격 및 접근 전략은 차세대 모델의 향상된 기능이 가격에 직접적으로 반영된다는 분명한 메시지를 전달합니다. 구독 플랜의 "무료 체험"은 사용자가 사용 습관을 형성하기 위한 용도로만 사용됩니다. 체험 기간이 만료되면 사용자는 두 가지 선택에 직면하게 됩니다. 예측하기 어려운 API 비용을 지불하고 서비스를 계속 사용하거나, 이전 등급의 모델로 되돌아가는 것입니다.

9달러부터 120달러까지 단계별로 구성되어 있습니다.

Fable 5의 가격 책정 방식은 단지 예외적인 사례가 아닙니다. 현재 시판 중인 주류 모델 API의 가격을 살펴보면, 가격대가 매우 다양하다는 것을 분명히 알 수 있습니다.

구글의 공식 가격 페이지에 따르면, Gemini 3.5 Flash의 유료 버전 출력 가격은 백만 토큰당 9달러입니다. OpenAI의 공식 가격 페이지에는 GPT-5.4 출력 가격이 15달러, GPT-5.5는 30달러, GPT-5.5 Pro는 120달러로 나와 있습니다. Anthropic의 Sonnet 4.6 출력 가격은 15달러, Opus 4.8은 25달러, Fable 5는 50달러입니다.

Gemini 3.5 Flash의 9달러부터 GPT-5.5 Pro의 120달러까지, 가격 차이는 13배가 넘습니다. 이는 더 이상 단순한 "고급형 vs. 저가형"의 이분법이 아닙니다. 제조업체들은 적극적으로 3단계 구조를 구축하고 있습니다. 최하위 계층은 대중화 및 고객 확보를 담당하는 초저가형 엔트리 레벨 모델이고, 중간 계층은 일상적인 개발 요구를 충족하는 중가 고성능 모델이며, 최상위 계층은 사용 빈도가 높고 가치가 높은 시나리오의 사용자를 대상으로 하지만 가격은 비싸고 성능은 가장 뛰어납니다.

단계별 가격 책정의 이면에는 명확한 기능 수준 표시가 있습니다. 앤스로픽은 소네트, 오푸스, 페이블, 미토스라는 네 가지 등급으로 모델 기능을 분류하고, 오픈아이언은 스탠다드와 프로 버전을 통해 GPT-5 시리즈의 다양한 사양을 구분하며, 구글은 플래시와 프로 버전을 통해 제미니 3 시리즈의 포지셔닝을 차별화합니다. 이러한 등급은 더 이상 단순한 내부 명칭이 아니라 가격에 직접적으로 반영됩니다.

더욱 주목할 만한 변화는 접근 권한과 관련된 것입니다. 앤스로픽의 공식 가격 페이지에 게시된 모델 목록에서 Fable 5는 "6월 22일까지 구독 플랜에 포함"으로 표시되어 있는 반면, Opus 4.8과 Sonnet 4.6에는 이와 같은 시간 제한이 없습니다. 앤스로픽은 새로운 계층형 접근 방식을 실험하고 있습니다. 기능에 따라 서로 다른 모델을 서로 다른 구독 등급에 할당하는 대신, 최상위 모델을 구독 시스템에서 직접 분리하고 별도의 API 호출 채널을 구축하는 것입니다.

감당할 수 없는 청구서에 대한 불안감

백만 토큰당 50달러라는 가격은 기업 구매 시나리오에서 그다지 높은 편은 아닙니다. 클로드 페이블(Claude Fable)의 컨텍스트 창은 최대 1백만 토큰을 저장할 수 있으며, 최대 출력값은 128,000 토큰입니다. 하나의 복잡한 작업을 처리하는 데 수만에서 수십만 개의 토큰이 소모될 수 있습니다. 추론 모델로서 페이블 5가 "더 오래 생각하고 더 많은 토큰을 생성하는" 능력은 설계 결함이 아니라 오히려 강점입니다. 이 모델은 최종 답을 출력하기 전에 여러 단계의 추론을 수행하며, 각 단계마다 토큰 비용이 발생합니다.

문제는 사용자가 이러한 사용량을 제어할 수 없다는 점입니다. Max 20x 플랜을 사용하는 한 개발자는 분당 크레딧 한도의 2%를 소진했고, 사이먼 윌리슨은 하루에 82.92달러를 사용했습니다. 이러한 사용량은 "체험 기간" 동안 발생했으며 플랜의 크레딧 한도 내였습니다. 하지만 6월 22일 이후에는 이와 유사한 사용량은 API 요금 청구 또는 크레딧으로 직접 전환됩니다.

토큰은 회계 단위로서 모델 설계자가 결정하며, 사용자는 '사용량'을 제어할 수 없습니다. AI 쿼리를 전력 소비에 비유하자면, 핵심적인 모순은 사용자가 '절전 모드'를 선택할 수도 없고 다음 쿼리가 얼마나 '전력'을 소비할지 예측할 수도 없다는 점입니다. 링크드인에 게재된 한 업계 토론 글에서는 이러한 현상을 'AI 세금'의 핵심 특징으로 요약하며, "진정한 AI 세금은 모델 가격뿐 아니라 예측 불가능성 그 자체"라고 지적했습니다.

이러한 예측 불가능성은 기업보다 개별 개발자에게 훨씬 더 큰 영향을 미칩니다. 기업은 대량 계약을 체결하고, 예산 한도를 설정하고, 팀 내에서 비용을 분담할 수 있습니다. 하지만 종량제 API를 대면 개별 사용자의 경우, 단 한 번의 심각한 디버깅 세션에 한 달 구독료 전체가 소요될 수 있습니다. Hacker News의 한 사용자는 "비용 효율적인 라우팅이 있으면 좋은 기능에서 필수적인 요구 사항이 되었다"고 언급했습니다. "비용 효율적인 라우팅"이란 기본 작업에는 저렴한 모델을 사용하고 필요한 경우에만 더 비싼 모델을 호출하는 것을 의미합니다. Fable 5 이전에는 이것이 최적화 전략에 가까웠지만, Fable 5의 가격과 사용량 때문에 이 전략은 사용하지 않으면 과도한 지출을 초래할 수 있는 필수적인 구성이 되었습니다.

주류 API는 다양한 모델에 대한 호출 인터페이스를 제공하여 개발자가 자체 라우팅 로직을 정의할 수 있도록 합니다. 그러나 이를 위해서는 사용자가 프로그래밍 기술을 보유하고, 모델 간의 차이점을 이해하며, 모델 저하로 인한 잠재적인 품질 손실을 감수해야 합니다. 이러한 추가적인 장벽은 더 많은 사람들의 접근을 막습니다.

월 200달러의 요금으로는 모든 기능을 이용할 수 있는 패스를 살 수 없습니다.

단계별 접근 시스템도 변경됩니다. 클로드 페이블 5의 전략은 다음과 같습니다. 6월 22일 이전에는 모든 유료 사용자가 이용할 수 있지만, 6월 22일 이후에는 월 최대 요금인 200달러를 지불하는 Max 20x 사용자조차도 직접 접근할 수 없고, 사용 크레딧을 통해 API를 호출해야 합니다.

반면, OpenAI의 접근 전략은 다른 방식을 취합니다. 공식 ChatGPT 가격 페이지에 따르면, ChatGPT Pro는 100달러와 200달러 두 가지 요금제를 제공하며, 두 요금제 모두 GPT-5 Pro에 대한 접근 권한을 제공합니다. 더 높은 등급의 모델 기능은 더 높은 요금제에 해당하지만, 구독 자체는 모든 기능에 대한 접근 권한을 포함하는 패키지입니다.

두 전략의 차이는 단순히 가격 차이에만 있는 것이 아닙니다. OpenAI의 모델은 구독료를 통해 진입 장벽을 설정합니다. 월 200달러를 지불할 여력이 있는 사람만 최고의 모델을 이용할 수 있습니다. 반면 Anthropic의 Fable 5 전략은 두 가지 측면에서 진입 장벽을 만듭니다. 하나는 비용(사용량에 따라 지불하는 API)이고, 다른 하나는 기술적 장벽(API 접근 권한 요구)입니다. Hacker News의 사용자 토론에서는 이러한 전략을 "무료 샘플 약물 전략으로 중독되면 가격을 올리는 방식"이라고 비판하는 의견도 있고, 다른 의견으로는 Anthropic이 현재 고정 가격 구독 모델로는 Fable 5의 추론 비용을 감당할 수 없는 해시레이트 공급망의 실제적인 문제일 가능성이 더 높다고 보고 있습니다.

동기가 무엇이든 간에, 그 결과는 분명합니다. 구독은 더 이상 "모든 것을 포함하는 패스"가 아니라 "입장권"이 되어버렸습니다. 최고급 모델의 기능은 입장권 가격에 포함되지 않습니다. TechCrunch는 Fable 5 출시 관련 기사에서 Fable 5가 "최초로 공개된 Mythos급 모델"이라고 언급했습니다. Fable 5 이전에는 Mythos급 모델은 Project Glasswing 파트너에게만 제공되었습니다. 이제 진입 장벽은 낮아졌지만, 완전히 사라진 것은 아닙니다.

우회하는 사용자

단계별 접근 시스템은 이미 사용자 행동에 뚜렷한 변화를 가져왔습니다. 일부 사용자는 공식 채널을 우회하는 방법을 찾기 시작했습니다.

한 가지 접근 방식은 제3자 집계 서비스를 이용하여 모델을 실행하는 것입니다. 이러한 "중개자"들은 공식 정가보다 낮은 가격으로 토큰을 제공하는데, 이는 일반적으로 기업들이 대량으로 구매한 유휴 할당량, 지역별 가격 차이로 인한 차익 거래 기회, 또는 공개되지 않은 경로를 통해 확보한 것입니다. 가격은 낮지만 개인정보 보호와 안정성은 보장되지 않습니다. Zhihu와 같은 플랫폼에서 관련 논의가 계속해서 격화되고 있는데, 사용자들의 진정한 관심사는 "저렴한 토큰을 사용할 수 있는가"가 아니라 "누가 데이터를 관리할 것인가"입니다.

또 다른 방법은 오픈 소스 또는 저렴한 대안으로 전환하는 것입니다. 일부 개발자는 DeepSeek과 같은 모델을 다양한 개발 도구에 통합하여 공식적인 가격 책정 및 검증 절차를 우회하는 방법을 보여주는 튜토리얼을 공유했습니다. 이러한 방식은 일부 기능 손실 및 개인정보 보호 리스크 상승 를 초래할 수 있지만, 비용을 크게 절감할 수 있습니다.

Hacker News와 Reddit의 개발자 토론에서 자주 언급되는 하이브리드 접근 방식은 "기본적으로 더 저렴한 모델을 사용하고, 중요한 단계에서만 Fable로 전환하는 것"입니다. 이는 합리적인 리소스 최적화 방안처럼 들립니다. 2~3년 전 "AI 민주화"에 대한 논의를 되돌아보면, 모두가 최고의 모델에 동등하게 접근할 수 있어야 한다는 것이 주류였습니다. 하지만 이제 "최고의 모델을 사용하는 것"은 신중한 계산이 필요한 문제가 되었습니다.

로컬 배포는 또 다른 관점을 제시합니다. 대규모 모델을 원활하게 실행할 수 있는 GPU는 가격이 비싸고, 120비트 모델을 실행할 수 있는 완벽한 시스템은 대부분의 개인 개발자가 감당하기 어렵습니다. 로컬 배포의 장벽은 또 다른 형태의 유료 장벽인데, 이번에는 사용량 기반 요금제가 아닌 하드웨어 구매를 통해 장벽이 형성되는 것입니다.

이러한 우회는 "똑똑한 사용자가 비용을 절약하는 꼼수"가 아닙니다. 대량 사용자가 적극적으로 대안을 찾는다는 것은 원래 경로가 좁아지고 있다는 뜻입니다. 환승 지점에서의 개인정보 침해 리스크, 오픈 소스 모델의 기능적 한계, 지역 배포를 위한 하드웨어 투자 등 모든 우회에는 비용이 따릅니다.

계단은 이미 내 발밑에 있다.

인공지능을 수도나 전기 같은 공공시설과 비교해 보면, 공공시설의 첫 번째 원칙은 보편적 서비스와 공평한 접근입니다. 하지만 인공지능 모델의 가격 책정 추세는 정반대 방향으로 가고 있습니다. 모델의 성능이 뛰어날수록 가격은 높아지고, 최상위 모델은 보편적 구독 방식에서 벗어나고 있으며, 토큰 기반 요금제는 비용 예측을 어렵게 만듭니다. 전기 공급이 단순히 더 많은 요금을 내는 사용자에게 "더 강한 전류"를 공급하는 것이 아닌 반면, 인공지능은 바로 그런 방식으로 작동하고 있습니다.

이것은 단순히 "비싸냐 싸냐"에 대한 가격 논쟁이 아닙니다. Claude Fable과 같은 최고급 모델이 일반 구독 서비스에서 제외되고, GPT-5.5 Pro의 출력 가격이 플래시 모델보다 13배나 비싸지고, 개인 개발자가 하루에 82달러를 탕진할 수 있는 상황에서, "감당하기 어려운 가격"은 단순한 가격 문제를 넘어 구조적인 문제로 변모하고 있습니다.

AI 도구 사용 분야에서는 명확한 계층 구조가 나타나고 있습니다. 최상위에는 무제한 API 호출과 전용 하드웨어를 사용할 수 있는 기업 사용자가 있고, 중간에는 예산을 신중하게 책정하여 최고급 모델을 사용하는 개인 개발자가 있으며, 최하위에는 무료 또는 저렴한 모델만 사용할 수 있는 일반 사용자가 있습니다. 이 계층 구조의 각 단계는 기술적 숙련도가 아니라 구매력과 기술 접근성에 따라 결정됩니다.

앤트로픽의 6월 22일 마감일은 이러한 과정의 가장 최근 단계일 뿐, 첫 번째 단계도 아니고 마지막 단계도 아닐 것입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
61
즐겨찾기에 추가
11
코멘트