인공지능 거물들이 어두운 숲으로 진입한다

이 기사는 기계로 번역되었습니다
원문 표시

텍스트: Xiang Xianzhi

류츠신은 소설 『삼체』에서 이후 수없이 인용된 이미지, '암림'을 등장시켰다. 모든 문명은 무장한 사냥꾼과 같다. 먼저 모습을 드러내는 자가 죽음을 맞이한다. 숲은 텅 비어 있지 않다. 모두가 불을 켜면 총알이 날아올 것을 알기에, 모두가 불을 끄고 있다.

2026년 봄, 최고의 AI 연구소들이 이 어두운 숲으로 들어갔습니다.

앤트로픽은 4월 16일 클로드 오푸스 4.7을 출시했습니다. 같은 날, 안전 문제를 이유로 오푸스 4.7의 성능이 미출시 모델인 미토스보다 떨어진다고 공개적으로 인정하는 이례적인 행보를 보였습니다.

4월 23일, OpenAI는 공식 웹사이트에 GPT-5.5를 공개했습니다. 같은 날, Anthropic은 공식 블로그에 "최근 Claude Code 품질 보고서 업데이트"라는 제목의 글을 게시하며, Claude Code의 효율성이 지난 한 달 동안 실제로 저하되었음을 인정했습니다. OpenAI는 새로운 버전을 출시했고, Anthropic은 개선 작업을 진행했습니다. 하지만 이 "새로운 챔피언"은 마치 자랑하는 듯한 어조였습니다. "Claude Code의 효율성이 일시적으로 저하된 것은 인정하지만, 아직 Mythos가 숨겨져 있다는 사실을 잊지 마세요."

4월 24일, "신비로운 동양의 힘"을 자랑하는 딥시크 V4 프리뷰가 공개되었고, 량원펑 팀은 이 모델이 화웨이 어센드 950PR과 심층적으로 통합되었음을 공식적으로 처음 발표했습니다. 하지만 진정한 "본격화된" V4 Pro Max는 어센드 950 슈퍼노드가 하반기에 양산될 때까지 출시되지 않을 것이라는 점은 모두가 알고 있었습니다.

세 회사, 세 가지 행동. 표면적으로는 각 회사의 제품 개발 일정처럼 보이지만, 함께 살펴보면 한 가지 공통점이 드러납니다.

각 회사는 적어도 하나의 "무기"를 보유하고 있습니다. 공개된 버전보다 더 강력한 모델, 아직 공개되지 않은 차세대 아키텍처, 그리고 아직 널리 사용되지 않은 칩 슈퍼노드 등이 그것입니다. 하지만 어느 회사도 감히 이 무기를 먼저 꺼내 들지 못하고 있습니다 .

이 업계에서 '비밀 공개'의 대가는 단순히 비밀을 누설하는 것만큼 간단하지 않습니다. 비밀을 공개한다는 것은 자신의 역량 한계를 경쟁사에게 벤치마크로 넘겨주는 것을 의미하며, 보안 점검, 강화된 규제, 그리고 여론의 압력을 가장 먼저 감당해야 한다는 것을 의미합니다. 또한 다음 경쟁에서 모든 경쟁사의 표적이 되는 것을 의미합니다. 숲속에는 영웅심이란 없습니다. 먼저 총을 쏘는 자는 누구든 다음 표적이 됩니다.

그러므로 사냥꾼에게 가장 합리적인 선택은 불을 끄고 숨을 참고 무기를 등 뒤에 숨기는 것입니다.

이것이 게임에서 최적의 해결책입니다.

인류의 두려움 없음

반면 클로드는 지난 한 달 동안 최악의 성적을 거둔 아티스트 중 한 명입니다.

Anthropic은 Opus 4.7로 충분히 일찍 업데이트했음에도 불구하고 여러 차트에서 여전히 선두를 유지하고 있으며, Mythos는 기업 고객에게만 제공하는 등 다소 느긋한 접근 방식을 보이고 있습니다.

하지만 클로드에게 있어 Opus 4.7의 이 시기는 "부정적인 리뷰가 쏟아져 들어오면서" 거의 최악의 사용자 경험이었다.

3월 초, Anthropic은 Claude Code의 기본 추론 깊이를 높음에서 중간으로 변경했습니다. 이러한 결정의 배경은 이해할 만합니다. 높은 모드에서는 UI가 자주 멈추고 응답 속도가 느려 유료 사용자들이 불편함을 느꼈기 때문입니다. 하지만 문제는 당시 이러한 변경 사항을 공지하지 않았다는 점입니다.

3월 말, 또 다른 "효율성 최적화" 기능이 도입되었습니다. 클로드 코드 세션이 한 시간 이상 유휴 상태일 경우, 시스템은 이전 추론 블록을 삭제하도록 설계되었습니다. 이는 해시레이트 절약하기 위한 것이었습니다. 그러나 실제로는 각 대화 라운드가 끝날 때마다 클로드가 마치 기억상실증에 걸린 듯 맥락을 완전히 잊어버리는 현상이 발생했습니다. 개발자 커뮤니티는 몇 주 동안 "클로드가 지난 라운드에서 내가 요청한 내용을 잊어버리기 시작했다"는 불만 대량 났습니다.

최근까지 세 번째 변화가 있었는데, 바로 시스템 프롬프트에 상세 출력량을 줄이는 명령어가 추가된 것입니다. 앤스로픽 본인의 말에 따르면, 이 명령어는 클로드 코드의 인코딩 품질을 직접적으로 3% 저하시켰다고 합니다.

세 가지 요인이 복합적으로 작용하여 AMD의 고위 임원이 깃허브에 "클로드는 복잡한 엔지니어링 작업을 수행하는 데 신뢰할 수 없을 정도로 퇴보했다"는 성명을 발표했습니다. 4월 16일 악시오스의 "앤트로픽의 AI 다운그레이드로 파워 유저들이 타격을 입다"라는 기사가 이 문제를 널리 알리는 계기가 되었습니다.

그러자 앤트로픽은 실제로 문제가 있음을 인정했습니다.

딥시크

4월 7일, 그들은 추론 과정에 적용했던 조정 사항들을 조용히 되돌렸고, 4월 10일에는 캐시 버그를 수정했으며, 4월 20일에는 상세 출력 압축에 대한 시스템 안내 메시지를 제거했습니다. 하지만 실제 사건 검토 보고서는 4월 23일에야 공개되었는데, 공교롭게도 그날은 GPT-5.5가 공식 출시된 날이었습니다.

"내 엔지니어링 전략에 버그가 있으니 그냥 고치면 되지 않나?"라는 식의 무시하는 태도는 오픈아이얼의 주요 발표 시기와 거의 정확히 일치했다. 이를 단순한 우연이라고 하기는 어렵다.

더욱 흥미로운 점은 Opus 4.7이 출시되었을 때 Anthropic이 이례적인 행보를 보였다는 것입니다. 바로 Opus 4.7의 성능이 아직 출시되지 않은 모델인 Mythos보다 떨어진다는 사실을 공개적으로 인정한 것입니다. 이는 분명 "전략적 후퇴"였습니다. Anthropic은 자사의 가장 강력한 기능들을 기업용으로 남겨두고 일반 대중에게 서둘러 공개하지 않으려 했던 것입니다. 왜냐하면 개발팀이 아직 Mythos를 출시할 준비가 되지 않았기 때문입니다 .

이 주장은 그럴듯합니다. 하지만 비즈니스 관점에서 보면 나머지 절반도 마찬가지로 사실입니다. 앤트로픽은 클로드 코드의 성능 저하를 공개적으로 인정하기까지 6주를 기다렸고, 오픈아이얼이 새로운 정보를 발표하려던 시점에야 이 문제를 제기했습니다. 동종 업계의 엄청난 압력이 없었고, 오푸스 4.7이 "우리에겐 아직 백업 계획이 있다"는 것을 증명하지 못했다면, 이 성명은 결코 나오지 않았을지도 모릅니다.

클로드의 입장에서 "치약을 짜는 것"은 의도적으로 기능을 제한한다는 의미가 아니라, 기능 출시 및 문제 공개 속도가 경쟁사의 속도를 따라가야 한다는 뜻입니다.

최첨단 기술을 선보이는 것은 필연적으로 경쟁사의 표적이 되게 만듭니다. 앤트로픽의 관점에서 보면, 4.6 버전으로 인한 경쟁사들의 압박이 아직 가시지 않았기 때문에 지금 더 강력한 카드를 꺼낼 필요는 없다는 것입니다.

OpenAI의 낡은 수법

앤스로픽이 "신화를 숨기고 있다"면, 오픈AI의 접근 방식은 훨씬 더 미묘합니다. 오픈AI는 기능 공개를 자체 서버 부하 곡선과 자동 라우터라는 계층화 메커니즘에 맡깁니다.

GPT-5.5가 출시된 바로 그날인 4월 23일, 장고 프레임 의 공동 창립자이자 AI 커뮤니티에서 잘 알려진 독립 리뷰어인 사이먼 윌리슨은 자신의 블로그에 신중한 어조로 "이전 버전과 크게 다르지 않다"는 글을 올렸습니다.

딥시크

그는 중요한 정보를 덧붙였습니다. GPT-5.5는 OpenAI가 GPT-4.5 이후 처음으로 완전히 재학습시킨 기본 모델이라는 것입니다. 다시 말해, 지난 6개월 동안 출시된 5.1, 5.2, 5.3, 5.4 버전은 모두 점진적인 업데이트였습니다. 즉, OpenAI는 경쟁사들이 어떤 모델을 출시할지 몰랐기 때문에 이 네 번의 마이너 버전 업데이트를 미뤄왔던 것입니다.

"업데이트에 드는 노력을 줄이는 것"을 더 쉽게 이해하는 방법이 있습니다. 바로 치약을 짜는 것에 비유하는 것입니다.

하지만 GPT-5.5 출시 후 불과 몇 시간 만에 더욱 기억에 남을 만한 일이 벌어졌습니다. Codex 사용자가 GitHub에 이슈 #19241을 제기하여, 고속 모드가 처음에는 매우 빨랐지만 사용자가 추가될수록 눈에 띄게 느려졌음에도 불구하고 요금은 여전히 ​​고속 모드를 기준으로 청구된다고 불만을 제기했습니다. 그 내용은 낯익은 문구였습니다. "고부하 상태에서 GPT-5.5 고속 모드의 성능이 저하되는지 조사해 주십시오."

이는 GPT-5가 처음 출시된 2025년 8월 7일에 일어났던 일과 거의 정확히 일치합니다. 당시 레딧의 r/ChatGPT에서는 "GPT-5는 끔찍하다"라는 글이 4600표가 넘는 추천을 받았고, 샘 알트만은 다음 날 AMA에서 "자동 전환 기능이 고장 났다... GPT-5는 훨씬 멍청해 보였다"라고 인정하며, 라우터가 사용자들을 위해 백그라운드에서 펌웨어를 다운그레이드했음을 시인했습니다.

8개월 후 똑같은 상황이 다시 반복되었다.

더욱 아이러니한 것은 GPT-5.5 공식 출시 하루 전날, OpenAI의 Codex가 실수로 내부 스테이징 환경을 프로덕션 환경에 배포했다는 점입니다. 몇몇 프로 사용자들이 스크린샷을 찍어 몇 분 만에 수정했지만, 유출된 콘텐츠는 이미 널리 퍼져 나갔습니다. 당시 유출된 셀렉터에는 GPT-5.5 외에도 "대륙을 움직이는 지능"이라는 툴팁이 있는 Glacier 시리즈, Heisenberg라는 생명 과학 모델, Arcanine이라는 이름의 모델, 그리고 oai-2.1이라는 코드명을 가진 여러 버전이 포함되어 있었습니다.

다시 말해, 오픈아이(OpenAI)가 GPT-5.5를 "차세대"라고 발표했을 당시, 내부적으로는 최소 5~6개의 병렬 개발 라인이 가동 중이었고, 그 중 어느 것도 아직 대중에게 공개되지 않았다는 뜻입니다.

OpenAI 자체도 이를 인정했습니다. 2026년 공식 로드맵에서 학계에서 오랫동안 논의되어 온 용어인 '역량 과잉(capability overhang)'을 사용하여 현재 대규모 모델의 실제 역량과 사용자가 실제로 달성할 수 있는 효과 사이에 큰 격차가 있음을 시인했습니다.

어디서 많이 들어본 얘기 같지 않나요? 앤스로픽이 미소스에 대해 했던 말과 거의 똑같습니다. 4월 22일 코덱스 유출이 정말 사고였다고 하더라도, 오픈아이언이 로드맵에 "기능 과잉"이라는 문구를 선제적으로 포함시킨 것은 "우리는 선택지가 많으니, 알아서 해결하라"는 아주 분명한 메시지를 전달하는 것입니다.

사용자에게 판매하는 것보다 훨씬 더 많은 제품을 보유하고 있어야만 기회를 포착할 수 있습니다. GPT-5.5의 24시간 이벤트는 이러한 전제를 다시 한번 생생하게 보여주었습니다.

딥시크의 인내심 있는 기다림

DeepSeek은 "압축"에 대한 접근 방식을 완전히 바꿨습니다. 더 이상 기능을 숨기지 않고, 더 적절한 시기를 기다렸다가 제공하는 방식입니다.

1.6T MoE, 1M 컨텍스트, Pro/Flash 듀얼 사양을 갖춘 이 제품은 1M 토큰당 3.48달러라는 가격으로 출시되었는데, 이는 GPT-5.5 가격의 극히 일부에 불과하며 Opus 4.7과는 엄청난 차이를 보입니다. 해외 독립 리뷰어들은 이 제품에 대해 단 두 문장으로 다음과 같은 결론을 내렸습니다. 성능은 GPT-5.4/Gemini 3.1-Pro와 비슷하지만 약간 떨어지며, 가격은 "최첨단 연구소의 경제성을 뛰어넘는다"는 것입니다.

하지만 DeepSeek 자체 프레임워크 내에서 V4 프리뷰는 "놀라울 정도로 저렴한" V3보다 훨씬 비쌉니다. 누구나 알다시피, 이건 정식 버전이 아닙니다.

DeepSeek V4의 이야기는 출시로 끝나는 것도 아니고, 시작되는 것도 아닙니다.

모든 것은 2025년 출시 예정이었던 R2 버전에서 시작되었습니다. R2는 원래 2025년 5월 출시 예정이었지만, 결국 가을이나 겨울로 연기되었습니다. 딥시크 차이나의 전체 인프라는 화웨이의 CANN 생태계로 이전되었습니다. 어떤 연구소에게든 이는 한 분기 안에 완료할 수 있는 프로젝트가 아니었습니다. 컴파일러, 연산자, 통신 라이브러리, 추론 프레임, MoE 라우팅 등 모든 것을 다시 작성해야 했습니다.

DeepSeek은 V4를 통해 Ascend를 자사의 훈련 하드웨어 목록에 공식적으로 처음 포함시켰습니다. V4는 하이브리드 훈련을 위한 첫 번째 버전이며, Ascend가 처음으로 적용된 버전입니다 .

하지만 화웨이의 로드맵에 따르면 대규모 학습에 최적화된 차세대 칩인 Ascend 950DT는 2026년 4분기에야 양산될 예정입니다. 즉, V4 학습은 이전 세대인 950PR을 사용해도 가능하지만, V4 Pro Max와 같은 1.6T MoE 버전을 완벽하게 학습시키고 대규모로 배포하려면 차세대 칩이 출시될 때까지 기다려야 합니다.

진정한 엔지니어링 과제는 "V4를 훈련시킬 수 있는지 여부"(이미 훈련되어 있음)가 아니라 "V4를 Ascend에서 최고 속도로 안정적이고 저렴하게 실행하는 방법"입니다.

Ascend 950PR은 2026년 1분기에 양산될 예정이며, 1.56 PFLOPS의 FP4 해시레이트 와 112GB의 온칩 메모리를 자랑합니다. 이는 스펙상으로 NVIDIA의 H20과 견줄 만하거나 그 이상입니다. 하지만 단일 칩을 가동하는 것과 초당 수백만 개의 토큰에 달하는 추론 요청을 안정적으로 처리하는 슈퍼노드 클러스터 전체를 운영하는 것은 완전히 다른 문제입니다. 본격적인 V4 Pro Max는 바로 이러한 "슈퍼노드", 즉 Ascend 950 시리즈의 대규모 클러스터 버전을 위해 특별히 설계되었으며, 2026년 하반기에 순차적으로 출시될 예정입니다.

이는 앞의 두 전략과는 완전히 다른 전략입니다. Anthropic과 OpenAI는 점진적 접근 방식을 취하는데, 더 강력한 버전을 이미 확보했지만 아직 공개하지 않겠다는 것입니다. 반면 DeepSeek은 완성된 버전을 보유하고 있으며 가격이 더 하락할 시점을 기다리겠다는 전략입니다.

이 차이점은 중요합니다.

DeepSeek의 진정한 강점은 "최첨단 성능"이 아니라 "충분한 성능을 보장하면서도 다른 업체들이 감히 넘볼 수 없는 수준으로 토큰 가격을 낮추는 것"입니다. V4 프리뷰는 NVIDIA 카드와 Ascend 950PR에 맞춰 개발되었지만, 대량 생산 규모에서 최대 성능의 추론을 구현하려면 슈퍼노드가 가동될 때까지 기다려야 합니다. 슈퍼노드가 가동되면 두 가지 일이 동시에 일어날 것입니다. 첫째, V4 Pro Max의 모든 기능을 완전히 활용할 수 있게 됩니다. 둘째, 추론 비용과 API 가격이 한 단계 더 낮아질 것입니다. 가격 경쟁력으로 시장을 공략하는 DeepSeek에게는 후자가 전자보다 훨씬 더 치명적일 것입니다.

사람들이 진정으로 기대했던 "딥시크(DeepSeek)의 순간"은 2025년 초에 일어났지만, 이번 릴리스에서는 다시 나타나지 않았습니다. V4 프리뷰 릴리스는 사실상 티저였고, 진정한 하이라이트는 하반기에 있을 "딥시크 + 화웨이 어센드(Ascend)"의 순간이었습니다.

이러한 관점에서 볼 때, 량원펑 팀은 어쩔 수 없이 '숨기는' 것이 아니라, 상업적으로 신중한 '선택'을 한 것입니다. 즉, 국내 슈퍼노드 대규모 배치가 완료된 직후, 가장 영향력 있는 시점에 최강 버전을 출시하기로 한 것입니다. 그 전에 V4 프리뷰를 통해 비용 효율성에 대한 인식을 더욱 공고히 할 계획입니다.

딥시크

DeepSeek의 목표는 국내 대규모 모델을 최고 수준으로 끌어올리는 장기적인 전략이 아니라, 칩, 학습, 추론, 가격 책정이라는 네 가지 요소가 동시에 원활하게 작동하도록 보장하는 시스템적인 전략입니다. 그리고 후자가 전자보다 훨씬 더 중요합니다.

며칠 전 젠슨 황은 드와르케시 파텔의 팟캐스트에서 딥시크가 화웨이 칩에 탑재되어 출시된다면 "우리나라에 끔찍한 결과가 될 것"이라고 말했습니다.

현재 엔비디아가 최상위 해시레이트 장악하고 있습니다. 하지만 황런쉰이 제시한 "5단계 AI 케이크"—에너지, 칩, 인프라, 모델, 애플리케이션—에 따르면, 중국의 대규모 AI 산업은 이미 각 단계에서 실행 가능한 국내 솔루션을 보유하고 있으며, 그 격차는 눈에 띄게 좁혀지고 있습니다. 마지막 조각인 칩을 갖춘 딥시크의 오픈소스 대규모 AI 프로젝트는 미국 모델을 넘어 더욱 큰 의미를 지닙니다. 이는 과도한 비용 부담 없이 전 세계적인 지능 평등을 달성하는 데 중요한 발걸음입니다.

이를 통해 전 세계는 특정 패권국이 장악하고 있는 첨단 해시레이트 우회하여 매우 효율적인 지능형 사회에 진입할 수 있게 될 것입니다.

앤트로픽의 "숨어있는" 행위는 선제적인 조치입니다. 그들은 미소스를 보유하고 있지만 안전상의 이유로 공개하지 않고 있습니다.

OpenAI의 "숨겨진" 측면은 바로 그 구조에 있습니다. 프로 버전이 있지만, 인프라 및 가격 책정 방식을 이유로 일반적으로 사용자에게 제공하지 않습니다.

딥시크의 "은폐"는 필수적입니다. 이는 사회적 지능의 도약에 대한 전체적인 서사적 패러다임과 관련이 있습니다.

하지만 다른 관점에서 보면, 이는 류츠신이 묘사한 암흑의 숲과 매우 유사합니다. 칠흑같이 어두운 지혜의 숲에서는 어떤 최고 사냥꾼도 먼저 총을 쏘지 못할 것입니다.

자신을 드러낸다는 것은 숨길 것이 없고, 비장의 카드가 없으며, 다른 사냥꾼의 먹잇감이 된다는 것을 의미합니다.

누가 먼저 치명적인 총격을 가할지는 아무도 모릅니다. 하지만 한 가지는 확실합니다. 오늘날 당신이 사용하는 모든 모델은 본래의 모습이 아닙니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
86
즐겨찾기에 추가
17
코멘트