작성자: 우천어
인간의 기쁨과 슬픔은 서로 통하지 않습니다. 2016년 인공지능 원년을 시작으로 AI 산업은 이미 여러 차례의 재편을 겪었습니다. ChatGPT의 열풍에 힘입어 DeepSeek는 마치 메기처럼 전체 대규모 언어모델 시장을 뒤흔들고 있습니다. 같은 대규모 언어모델 스타트업 기업으로 업계의 새로운 거물로 여겨지는 "6대 거인" 기업들과 비교하면, 그들의 처지는 동쪽에서 해가 뜨는 것과 서쪽에서 비가 오는 것 같습니다.
DeepSeek는 새해 전에 저렴한 비용으로 성능이 GPT-4와 맞먹는 DeepSeek-V3를 출시해 업계를 놀라게 했습니다. 이어 1월 20일에 R1 모델을 발표했고, 출시 6일 만에 애플 앱스토어 전 세계 다운로드 순위 1위에 올랐으며, 1개월 만에 누적 다운로드 수가 1.1억 건을 넘어섰습니다. 이 기간 동안 주요 클라우드 기업들이 신속하게 오픈소스 버전의 V3와 R1을 출시했고, 바이두 검색, 위챗 등의 제품들도 DeepSeek를 적극적으로 도입했습니다.
한편 DeepSeek와 동시에 발표된 Kimi의 전 세계 강화학습 모델 k1.5와 Step R-mini 추론 모델은 모델 성능 면에서 DeepSeek에 많이 근접했지만, DeepSeek의 폭발적 인기에 묻혀 있습니다.
DeepSeek의 소란스러움에 비해 "6대 거인" 기업들도 연이어 소식을 내놓고 있습니다: 제로원이 더 분할되었고, 문의 어두운 면의 예산과 중재 사건이 해결되지 않았으며, MiniMax에서 또 다른 고위 임원이 퇴사했습니다...
그 이면에는 실망한 VC들도 있습니다: 그들이 진심으로 지원한 프로젝트 중 DeepSeek만큼 뜨거운 반응을 얻은 것은 없습니다. 현재 "6대 거인" 기업 중 이미 4곳은 반년 이상 투자 소식이 없습니다. 업계에서는 2024년에 "6대 거인" 중 2곳이 도태될 것이라고 하며, 2025년에는 누가 다음으로 도태될지 모르겠다고 합니다.
대규모 언어모델에 집중하는 기업은 3곳만 남을 것
DeepSeek의 폭발적 성장은 예고된 것이 아니었습니다. 2023년 11월 2일 첫 번째 모델 DeepSeek Coder를 출시한 이후 1년 만에 10개가 넘는 다양한 버전의 모델을 출시했습니다. 그중 지난해 5월 출시된 V2 모델은 GPT-4 Turbo와 견줄 만한 성능을 보이면서도 가격은 GPT-4의 1%에 불과해, DeepSeek는 "가격 도살자", "AI 분야의 핀테크"로 불리며 대규모 언어모델 업계 최초의 가격 전쟁을 일으켰습니다.
2025년 1월 27일 DeepSeek는 ChatGPT를 넘어서며 중국과 미국 애플 앱스토어 무료 앱 순위 1위에 올랐고, 전 세계의 관심을 끌었습니다. DeepSeek의 이러한 성과를 이끌어낸 것은 추론 대규모 언어모델 DeepSeek-R1입니다. DeepSeek에 따르면 R1은 여러 공인 테스트에서 GPT-3.5 정식 버전과 유사한 점수를 받았고, 일부 테스트에서는 GPT-3.5 정식 버전을 능가했습니다.
순위 평가 외에도 오픈소스화와 가성비가 DeepSeek의 열풍을 일으킨 중요한 요인입니다. DeepSeek의 영향을 받아 이전에는 폐쇄적이었던 바이두 창업자 이연홍도 오픈소스 진영에 합류했고, OpenAI 창업자 샘 알트먼도 회사의 오픈소스 전략이 "잘못된 방향"이었다고 반성했습니다.
대규모 언어모델 "6대 거인" 중 MiniMax는 1월 15일 첫 번째 오픈소스 모델을 발표했습니다. 창업자 연준걸은 《晚点》과의 인터뷰에서 "첫 번째 창업 때는 많은 경험이 부족했고, 다시 선택한다면 첫날부터 오픈소스로 해야 했다"고 말했습니다. 다른 5개 기업 중에서는 지혜가 가장 빨리 오픈소스와 폐쇄소스의 두 가지 길을 걸었습니다. 약 2년간의 시행착오 끝에 "6대 거인" 기업들의 발전 방향은 완전히 갈라졌습니다.
제로원은 첫 번째로 기반 대규모 언어모델 기업으로서 큰 변화를 공개적으로 발표했습니다. 먼저 사전 학습 알고리즘 팀과 인프라 팀을 해체했고, 일부 직원들은 알리바바로 이직했습니다. 이후 알리바바 클라우드, 소주 하이테크 구역과 각각 산업 대규모 언어모델 공동 실험실, 산업 대규모 언어모델 기지를 설립하겠다고 발표했습니다.
인력 면에서는 모델 학습 책임자 황문호, 대규모 언어모델 API 오픈 플랫폼 책임자 란우천, 생산성 제품 책임자 조대평 등이 차례로 퇴사했습니다. 판을 지키려 노력하는 제로원은 이번 대규모 언어모델 경쟁에서의 침체를 감추지 못하고 있습니다.
백천 지능은 2024년에 의료 분야로 명확히 방향을 잡았고, 최근 첫 "AI 소아과 의사"를 출시했습니다. 하지만 B2B 사업화 측면에서는 순조롭지 않은 것 같습니다. 백천 지능의 공동 창업자이자 사업화 책임자였던 홍도가 새해 전에 이미 퇴사했습니다. 한 직원에 따르면 "지금은 DeepSeek가 나온 후 올해 압박감이 더 커졌다"고 합니다.
B2B 사업화 책임자의 퇴사는 MiniMax의 위위에게서도 있었습니다. 이전에 위위는 인터뷰에서 많은 B2B 고객들이 대규모 언어모델 기업의 매출을 지원하기 위해 쉽게 돈을 내놓지 않고, 실제 현장 적용 효과에 기반해 협력해야 한다고 말했습니다. 이는 대규모 언어모델 사업화가 결코 쉽지 않음을 보여줍니다.
이렇게 볼 때 여전히 대규모 언어모델 기술 혁신과 AGI 추구에 전념하고 있는 기업은 문의 어두운 면, 지혜, 계단 별궁뿐입니다. DeepSeek의 영향으로 계단 별궁도 오픈소스 진영에 합류했는데, 다른 DeepSeek와 달리 최근 공개한 것은 두 개의 멀티모달 모델 Step-Video-T2V, Step-Audio입니다.
2월 23일 새벽, 문의 어두운 면은 최신 논문 《Muon is Scalable for LLM Training》을 발표하고 MoE 모델 Moonlight를 오픈소스로 공개했는데, 모델 활성화 매개변수가 3B에 불과합니다. 많은 업계 관계자들은 이를 "오픈소스 주간을 선점한 것"이라고 보고 있는데, 이는 DeepSeek가 연속 5일 동안 오픈소스 프로젝트를 발표하겠다고 밝힌 바 있기 때문입니다.
문의 어두운 면에게 화급한 것은 아마도 그들이 대규모 투자를 한 Kimi 제품일 것입니다.
돈을 태워가며 유입을 늘리기는 어려워
DeepSeek에도 동명의 C2C 제품이 있는데, 출시 첫 주에는 시장의 큰 관심을 끌지 못했습니다. QuestMobile가 미디어에 공개한 데이터에 따르면 2025년 1월 13일부터 1월 19일까지 DeepSeek 앱의 주간 다운로드 수는 28.5만 건에 불과했는데, 이는 두박(452만)과 Kimi(155.7만)에 크게 못 미치는 수치입니다.
그러나 2025년 1월 20일 R1 모델 출시 후 DeepSeek의 다운로드 수가 급격히 증가했습니다. Sensor Tower 연구에 따르면 DeepSeek는 발표 18일 만에 1,600만 건 이상 다운로드되어, OpenAI의 ChatGPT 최초 출시 때의 900만 건의 약 2배에 달했습니다.
방문자 수가 급증하면서 DeepSeek가 일시적으로 다운되기도 했지만, 성장 추세는 여전히 강력해 월간 다운로드 수가 1.1억 건을 넘어섰습니다. DeepSeek의 영향력은 더 이상 무시할 수 없게 되었고, 2월 13일 ByteDance 내부 전체 회의에서 CEO 량루보는 DeepSeek에 대해 언급하며 대응 속도가 부족했다고 반성하고 올해는 지능형 출시를 추구하겠다고 밝혔습니다.
텐센트의 WeChat은 DeepSeek의 AI 검색을 회색 테스트로 도입했고, 사용량이 예상을 초과하자 AI 애플리케이션 위안바오를 동원해 WeChat 검색을 지원했습니다. 2월 22일 텐센트의 위안바오가 ByteDance의 두박을 제치고 중국 애플 무료 앱 다운로드 순위 2위에 올랐고, DeepSeek는 계속 1위를 지켰습니다.
"1, 2위 대형 형제"가 불과 1개월 만에 바뀌면서, 돈을 태워가며 성장을 추구했던 두박과 Kimi의 우위가 더 이상 유효하지 않게 되었습니다. 두 기업의 차이는 전자가 "황금열쇠"를 가진 귀족이었던 반면, 후자는 "신흥 부자"라는 점입니다. 이전에 보도된 바에 따르면 iPhone 채널에서 Kimi의 일일 광고 투자 금액은 약 20만 달러, 두박은 248만 달러에 달했습니다.
DeepSeek의 영향으로 문의 어두운
후오비 토큰(HT), 베이직어텐션토큰(BAT), 옵티미즘(OP), 이더리움 네임서비스(ENS), Ronin(RON), 온톨로지가스(ONG), 트론(TRON)도 모두 자신만의 AI 애플리케이션 제품을 가지고 있지만, 2025년 1월 AI 애플리케이션 순위 상위 20위 안에는 이들 기업과 관련된 제품이 없는 것으로 나타났습니다. 이전에 한 내부인사는 "문 (Moon/가격 상승을 의미) 애플리케이션의 사용자 유지와 성장이 매우 좋지 않은 것은 놀랍지 않다. 우리는 기본적으로 광고 집행을 하지 않고, 다른 업체들이 먼저 사용자 교육을 완성하도록 하고 있다"고 말했습니다.
현재 DeepSeek, 텐센트 위안바오, 바이트댄스 두부가 애플 무료 앱 다운로드 순위 상위 3위를 차지하고 있습니다. 대규모 언어 모델 "육소룡"이 순위에 오르기 위해서는 경쟁이 더욱 치열해질 것으로 보이며, 현재 7위인 나노 검색은 주홍기가 직접 "판매"에 나서고 있습니다.
또 다른 무시할 수 없는 경쟁자는 알리바바입니다. AI 애플리케이션 통합 사업부가 최근 대규모 채용에 나섰으며, 주요 초점은 대규모 언어 모델 관련 제품과 기술 개발 분야입니다. 앞으로 치열한 경쟁이 예상됩니다.
기술 스토리가 더 이상 낭만적이지 않고, 상업화가 기대에 미치지 못하며, 제품의 월간 활성 사용자 증가와 투자가 비례하지 않는 상황에서, 대규모 언어 모델 "육소룡"의 이상과 현실의 괴리가 드러나고 있습니다.
다음 투자 유치 문턱 상승
대규모 언어 모델 사전 학습에는 많은 비용이 들어가는 것으로 알려져 있습니다. 이전에 이개복 박사는 한 번의 사전 학습 비용이 약 300-400만 달러 정도라고 밝혔으며, 비용이 더 저렴한 Yi-Lightning의 경우에도 2000대의 GPU를 1.5개월 동안 사용하여 300만 달러 이상을 지출했다고 합니다.
저비용을 내세운 DeepSeek도 초기 투자 규모가 막대한 것으로 추정됩니다. 제3자 기관 SemiAnalysis에 따르면 DeepSeek는 실제로 6만 대의 엔비디아 GPU 카드를 보유하고 있으며, 이 중 1만 대는 A100, 1만 대는 H100, 1만 대는 "특별 버전" H800, 3만 대는 "특별 버전" H20입니다.
"일반적인 대규모 언어 모델 학습 비용은 약 10억 달러 정도로 추정됩니다. 이는 단순히 컴퓨팅 파워 부분만의 비용이며, 데이터와 인력 비용은 별도로 고려해야 합니다. 현재 전 세계적으로 대규모 언어 모델 분야의 인재가 매우 부족한 상황입니다."라고 장문창투 창립 파트너이자 전 마이크로소프트 창업 투자 대중국 지역 책임자인 두봉 박사는 말했습니다.
이처럼 막대한 투자가 필요하다 보니, 업계에서는 "대규모 언어 모델 기업에 투자하려면 1억 달러 이상의 자금이 필요하다"는 말이 회자되고 있습니다. 이는 대규모 언어 모델 스타트업이 투자를 받지 못하면 생존하기 어렵다는 것을 의미합니다.
2023년 대규모 언어 모델 전쟁이 시작된 이후, 거의 매달 투자 소식이 발표되어 왔습니다. 그러나 AI 버블론이 확산되면서 2024년 9월 이후 수억 달러 규모의 자금이 "육소룡"에 유입되지 않았습니다. 직전 스마트 AI와 알약 스타는 최근 새로운 투자를 유치했습니다.
"육소룡" 중 나머지 4개 기업은 마지막 투자 소식 발표 이후 반년 이상 지났습니다. MiniMax는 지난해 3월 6억 달러 B라운드 투자를 발표했고, 백천 지능은 지난해 7월 50억 위안의 A라운드 투자를 받았으며, 영일만물은 지난해 8월 수억 달러 투자를 유치했고, 문의 암면은 지난해 8월 3억 달러 투자를 받았습니다.
설 연휴 기간 동안 DeepSeek가 전 세계적으로 화제가 되었고, 창업자 량문봉에 대한 찬사가 쏟아졌습니다. 투자계에서는 DeepSeek의 향후 투자 및 기업가치 등에 대한 소문이 끊이지 않고 있습니다.
이전에는 알리바바가 100억 달러 기업가치로 10억 달러를 투자해 10% 지분을 취득한다는 소식이 있었지만, 알리바바 부사장 옌차오는 이를 부인했습니다. 이후 외신은 "DeepSeek, 첫 외부 자금 조달 고려 중"이라고 보도했지만, DeepSeek 관계자는 이를 부인했습니다.
"많은 투자자들이 직접 또는 관계를 통해 량문봉을 만나려 하고 있습니다. 그의 기업가치는 현재 '육소룡'을 크게 웃돌 것으로 예상됩니다."라고 중금 자본 투자자는 말했습니다. "DeepSeek가 벤치마크가 되면서 '육소룡'이 새로운 투자를 받으려면 문턱이 더 높아졌습니다."
사실 대규모 언어 모델 창업 열풍 이후, 업계에서는 '육소룡' 모두가 독립 '대규모 언어 모델 기업'으로 살아남기는 어려울 것이라는 전망이 지배적입니다. '육소룡' 창업자 중 일부도 공개석상에서 이와 유사한 의견을 피력한 바 있습니다. MiniMax 창업자 옌준제는 향후 전 세계적으로 5개 대규모 언어 모델 기업만 살아남을 것이라고 말했습니다.
"중국에도 자체적인 ChatGPT가 등장할 것입니다. 검색 엔진과 마찬가지로 중국에도 자체적인 규제 요건이 있습니다. 하지만 중국판 ChatGPT는 BAT(바이두, 알리바바, 텐센트) 플러스 바이트댄스, 화웨이 등 5개 기업에서 나올 것입니다."라고 Xunlei 창업자이자 Yuanwang Capital의 프로그램 호 박사는 말했습니다.
지속적인 화제성 속에서 이미 분화의 길을 걷고 있는 "육소룡"은 더욱 가속화된 재편이 예상됩니다.





