딥시크는 2월 중순경 V4 모델을 출시할 계획인 것으로 알려졌으며, 내부 테스트 결과가 사실이라면 실리콘밸리의 AI 거물들은 긴장해야 할 것입니다.
항저우에 본사를 둔 AI 스타트업이 코딩 작업에 특화된 모델을 2월 17일(음력 설날)경에 출시할 계획 이라고 The Information이 보도했습니다 . 프로젝트에 정통한 관계자에 따르면, V4는 내부 벤치마크에서 Anthropic의 Claude와 OpenAI의 GPT 시리즈를 모두 능가하는 성능을 보였으며, 특히 매우 긴 코드 입력문을 처리할 때 두드러졌다고 합니다.
물론 해당 모델에 대한 벤치마크나 정보가 공개적으로 공유되지 않았기 때문에 이러한 주장을 직접 검증하는 것은 불가능합니다. 딥시크(DeepSeek) 측에서도 해당 소문에 대해 확인해주지 않았습니다.
하지만 개발자 커뮤니티는 공식 발표를 기다리지 않고 있습니다. 레딧의 r/DeepSeek와 r/LocalLLaMA는 이미 뜨거운 반응을 보이고 있고, 사용자들은 API 크레딧을 비축하고 있으며, X 플랫폼의 열성적인 사용자들은 V4가 실리콘 밸리의 수십억 달러 규모 규칙에 따르지 않는, 끈질긴 약자로서의 DeepSeek의 입지를 굳힐 수 있을 것이라는 예측을 재빨리 공유하고 있습니다.
이는 딥시크의 첫 번째 시장 파괴 행위는 아닙니다. 2025년 1월, 이 회사가 R1 추론 모델을 출시했을 때 전 세계 시장에서 1조 달러 규모의 매도세가 발생했습니다.
그 이유는 무엇일까요? DeepSeek의 R1 모델은 개발 비용이 단 600만 달러에 불과했음에도 불구하고 수학 및 추론 벤치마크에서 OpenAI의 o1 모델과 동등한 성능을 보였기 때문입니다. 이는 경쟁사들이 투자한 비용보다 약 68배나 저렴한 가격입니다. 이후 V3 모델은 MATH-500 벤치마크에서 90.2%의 정확도를 기록하며 Claude의 78.3%를 크게 앞질렀고, 최근 업데이트된 " V3.2 Speciale " 버전에서는 성능이 더욱 향상되었습니다.
V4의 코딩 중심 접근 방식은 전략적 전환점이 될 것입니다. R1이 순수 추론, 즉 논리, 수학, 형식적 증명에 중점을 두었다면, V4는 추론 및 비추론 작업을 모두 포함하는 하이브리드 모델로, 높은 정확도의 코드 생성이 직접적인 수익으로 이어지는 기업 개발자 시장을 겨냥합니다.
V4가 선두 자리를 차지하려면 현재 SWE-bench Verified에서 80.9%의 최고 점수를 기록하고 있는 Claude Opus 4.5를 넘어서야 합니다. 하지만 DeepSeek의 과거 출시 사례를 보면, 중국 AI 연구소가 직면한 여러 제약 조건에도 불구하고 이는 불가능한 일이 아닐 수도 있습니다.
소문이 사실이라면, 이 작은 연구실이 어떻게 그런 위업을 달성할 수 있었을까요?
이 회사의 비장의 무기는 1월 1일에 발표된 연구 논문 , 즉 '다중 제약 하이퍼 연결(mHC)'에 숨겨져 있을지도 모릅니다. 창립자인 량원펑이 공동 저술한 이 새로운 학습 방법은 대규모 언어 모델의 확장에 있어 근본적인 문제, 즉 모델이 불안정해지거나 학습 도중에 성능 저하 없이 용량을 확장하는 방법을 해결합니다.
기존 AI 아키텍처는 모든 정보를 하나의 좁은 경로로만 전달합니다. mHC는 이 경로를 여러 개의 스트림으로 확장하여 학습 붕괴 없이 정보를 교환할 수 있도록 합니다.
카운터포인트 리서치의 AI 수석 분석가인 웨이 썬은 비즈니스 인사이더 와의 인터뷰 에서 mHC를 "획기적인 돌파구"라고 평가했습니다. 그녀는 이 기술이 딥시크가 미국의 수출 제한으로 인해 첨단 칩에 대한 접근성이 제한적인 상황에서도 "컴퓨팅 병목 현상을 우회하고 지능 수준을 비약적으로 향상시킬 수 있음을 보여준다"고 말했습니다.
Omdia의 수석 분석가인 Lian Jye Su는 DeepSeek이 자사의 방법론을 공개하려는 의지는 "중국 AI 산업의 새로운 자신감을 보여주는 신호"라고 평가했습니다. DeepSeek의 오픈소스 접근 방식은 개발자들 사이에서 큰 인기를 얻고 있는데, 이는 DeepSeek이 폐쇄형 모델과 수십억 달러 규모의 투자 유치로 방향을 전환하기 전의 OpenAI의 정신을 계승하고 있다고 여겨지기 때문입니다.
모두가 동의하는 것은 아닙니다. 레딧의 일부 개발자들은 딥시크의 추론 모델이 간단한 작업에 컴퓨팅 자원을 낭비한다고 불평하는 반면, 비평가들은 딥시크의 벤치마크가 실제 환경의 복잡성을 반영하지 않는다고 주장합니다. 2025년 4월에는 "딥시크는 형편없다. 더 이상 아닌 척하지 않겠다"라는 제목의 미디엄(Medium) 게시물이 큰 화제를 모았는데 , 이 게시물에서는 딥시크 모델이 "버그가 가득한 뻔한 코드"와 "환상적인 라이브러리"를 만들어낸다고 비난했습니다.
딥시크는 여러 문제점을 안고 있습니다. 개인정보 보호 문제가 회사를 괴롭혀 왔으며, 일부 정부는 딥시크의 자체 앱을 금지했습니다. 또한, 중국과의 연관성과 모델 검열 의혹은 기술적 논쟁에 지정학적 마찰을 더하고 있습니다.
하지만 그 성장세는 부인할 수 없습니다. Deepseek은 아시아에서 널리 채택 되었으며, V4가 코딩 관련 약속을 이행한다면 서구권 기업에서도 도입이 이어질 수 있을 것입니다.
타이밍도 중요한 요소입니다. 로이터 통신 에 따르면 , 딥시크는 원래 2025년 5월에 R2 모델을 출시할 계획이었지만, 창립자인 량 회장이 성능에 불만을 품으면서 출시 시기를 연장했습니다. 이제 V4는 2월 출시를 목표로 하고 있고, R2는 8월에 출시될 가능성이 있다는 보도가 나오는 것을 보면, 딥시크는 조급함이나 자신감을 드러내는 속도로 움직이고 있는 것으로 보입니다. 어쩌면 둘 다일지도 모릅니다.





