저자: 왕루

이미지 출처: 무경계 AI에 의해 생성됨
AI는 대기업의 '구원투수'가 된 것 같다.
재무 보고의 하이라이트 데이터든, 수시로 나오는 호재 정보든 모두 AI와 관련이 있다.
예를 들어 2024년 바이두의 엇갈린 실적 보고에서 하이라이트는 대부분 AI가 만들어낸 것이었다:
문심 대규모 모델의 일일 평균 호출량이 지속적으로 빠르게 증가하여 1년 만에 33배 늘어난 16.5억 건. 바이두 문라이브러리의 유료 사용자가 4천만 명을 넘어 세계 2위, 중국 1위를 차지했다.
알리바바도 AI 덕분에 올 초 3연타를 날렸다:
먼저 DeepSeek의 영향으로 개방형 대규모 모델인 알리 통의천문(Qwen)이 주목받았고, 이어 발표된 최신 모델 Qwen2.5-Max는 DeepSeek V3를 능가한다고 평가받았으며, 이후 애플과의 AI 사업 협력을 발표하며 주가가 급등했다.
하지만 DeepSeek가 출시된 지 약 40일이 지나면서 대기업 AI가 얻은 성과보다는 불안감이 더 크다. 결국 각 기업이 투입한 막대한 인력, 물적, 재정 자원에 비해 초창기 팀이 만든 제품이 더 큰 반향을 일으켰기 때문이다. 이틀 전 DeepSeek는 충격적인 소식을 공개했는데, 그 이익율이 545%에 달한다는 것이다(이론상 수익). 이론상 하루 수익이 346만 원에 이를 수 있다고 한다.
이런 충격 속에 대기업들이 노선을 바꾸고 있다. 이기지 못하면 합류하는 식으로 DeepSeek에 접속을 발표하는 한편, 자사 대규모 모델을 폐쇄형에서 개방형으로 전환하고 있다. 심지어 상업화 경로를 포기하고 C2C 제품을 무료로 제공하기도 한다.
하지만 이런 움직임이 대기업 AI 불안을 해소할 수 있을까?
대기업 AI, 어떻게 하고 있나?
DeepSeek 등장 전 대기업의 AI 전략은 공격적인 투자와 자사 강점 기반 제품 개발이었다.
대규모 모델은 AI 산업의 기반 인프라로 여겨졌고, 인터넷 대기업(바이두, 텐센트, 알리바바, ByteDance, 콰이셔우 등), 소비자 전자 기업(대표적으로 화웨이), 스마트 음성 기업(iFLYTEK 등)이 자체 개발에 나섰다. "AI 6소룡"으로 불리는 스타트업에 비해 대기업은 더 풍부한 자금과 인재를 보유하고 있다.
AI 산업 전반의 기술 발전 속도와 각 기업의 공개 정보를 보면, 대기업 대규모 모델 간 근본적인 기술 차이는 없지만 진출 시기, 모델 포지셔닝, 시장 전략에서 차이가 있다. 구체적인 차이는 다음과 같다:

이 세 가지 차이는 대기업이 초기에 AI에 대해 가졌던 태도와 포지셔닝을 일정 부분 대변한다.
예를 들어 대규모 모델 출시 시기가 '빠르다'는 것은 해당 기업이 관련 기술 분야에 일찍부터 투자하고 기술을 축적했으며 반응이 빠르다는 것을 의미한다. 다만 기술이 완전히 성숙하지 않아 기술 R&D와 시장 진출 비용이 상대적으로 더 높을 수 있다.
위 표를 보면 화웨이가 가장 빨리 나왔지만, 주의해야 할 점은 그 기반이 Transformer 아키텍처이긴 하지만 ChatGPT 스타일의 대화형 AI와는 완전히 다른 '산업 전용' 방향이라는 것이다. 일반 지능 대규모 모델에 초점을 맞추면 바이두가 가장 빨리 움직였는데, 2023년 3월 문심 일언 대규모 모델의 초청 테스트를 시작했다(완전 공개는 아님).
하지만 출시 시기가 빠르다고 해서 모델의 우수성을 판단할 수는 없다.
기업의 사업 배치가 대규모 모델의 적용 방향을 결정하고, 이는 각 기업의 학습 데이터 출처에서 기인한다.
바이두 문심 일언은 주로 인터넷 텍스트 데이터를, 알리바바 통의천문은 텍스트, 이미지, 오디오 등 멀티모달 데이터를, 텐센트 혼원은 소셜 네트워크와 사용자 행동 데이터를, ByteDance 두봉은 50-60%가 자사 서비스(抖音, 今日头条) 데이터를, 화웨이 방공은 산업, 기상, 문자, 이미지 등 다양한 데이터를 활용했다.
이로 인해 각 기업 대규모 모델의 강점 영역이 다르다. 예를 들어 문심 일언은 장문 처리와 다국어 대화에 강점이 있고, 혼원은 소셜 시나리오에서 더 우수하며, 두봉은 콘텐츠 생성과 정밀 추천에서 앞서고, 통의천문은 전자상거래 추천 시나리오에서 반응이 더 빠르며, 방공은 실행 속도와 일반화 능력이 뛰어나 대규모 작업에 효과적이다.
각 기업 대규모 모델의 강점 영역이 모두 핵심 사업의 그림자를 드리우고 있음을 알 수 있다.
마지막으로 시장 전략은 기업 자신의 능력과 산업 동향에 대한 판단을 일정 부분 반영한다. 외부에서 관찰할 수 있는 내용은 크게 두 가지로 나뉜다: 오픈 소스 vs. 폐쇄형, C2C 제품의 유료화 여부.
ByteDance, 콰이셔우, iFLYTEK, 화웨이는 아직 폐쇄형을 고수하고 있지만, 바이두, 텐센트, 알리바바는 대부분 오픈 소스를 선택했다. C2C 애플리케이션 측면에서는 바이두, 텐센트, 알리바바가 무료 정책을, ByteDance, 콰이셔우, iFLYTEK은 무료 사용 횟수 제한 정책을 택했다.
오픈 소스의 달콤한 열매는 이미 알리바바가 맛보고 있다. 오픈 소스 AI 플랫폼 Hugging Face가 발표한 최신 오픈 소스 대규모 모델 순위에서 상위 10개 모델 전부가 알리바바 통의천문의 파생 모델이다.
C2C 제품에서는 무료 정책을 고수한 두봉이 1년 새 가장 가파른 상승세를 보였다. AI 제품 순위에 따르면 2025년 1월 두봉의 국내 월간 활성 사용자 수는 7861만 명으로 다른 대기업 앱을 크게 앞섰다.
하지만 더 궁금한 것은 대기업 대규모 모델의 전반적인 능력 순위다. 업계 관계자들의 분석에 따르면, 현재 대기업 최고 수준 대규모 모델은 주로 폐쇄형이어서 정보가 완전히 투명하지 않아 각 기업 능력을 판단하기는 쉽지 않다.
프로스트 앤 설리번의 '2024년 중국 대규모 모델 능력 평가' 보고서에서는 바이두 문심 일언, 텐센트 혼원, 알리바바 통의천문 등 대기업 대규모 모델이 1군으로 평가되었고, 기술 능력이 전반적으로 우수하고 사용자 규모도 상대적으로 크다고 했다. 하지만 어느 기업이 가장 뛰어난지는 명확히 밝히지 않았다.
I 소프트웨어 엔지니어 친상은 각 기업의 기술 아키텍처와 학습 데이터에 차이가 있다고 말했다. 예를 들어 기술 아키텍처 측면에서 모델 규모와 매개변수 수는 대규모 모델의 복잡성과 능력을 가늠하는 중요한 지표다. 일반적으로 규모가 크고 매개변수가 많을수록 학습 능력과 표현 능력이 더 강하다. 예를 들어 DeepSeek-R1은 6710억 개의 매개변수로 방대한 지식 저장소를 구축했다고 한다.
그에 따르면 이 기준으로 보면 대기업 대규모 모델 중 문심 일언이 심층 추론 능력에서 가장 뛰어나다. 하지만 수직 분야 능력으로 보면 통의천문이 문심 일언을 능가하는데, 후자가 자체 8개 수직 분야 모델을 개발 및 출시했기 때문이다.
결국 각 기업 대규모 모델의 강점이 다르기 때문에 어느 한 기업이 모든 면에서 압도적이지는 않다.
DeepSeek 출시 40일, 대기업 4대 변화
DeepSeek의 등장으로 대기업이 자사 AI 전략 배치를 재검토하게 되었다. 각 기업의 최신 동향과 업계 관계자들의 말을 종합하면 크게 4가지 변화가 있다.
첫째, 폐쇄형에서 오픈 소스로의 전환이 가장 큰 변화다.
DeepSeek의 열풍이 오픈 소스에 힘입은 바가 크다는 점을 업계 관계자들이 지적했다.
그동안 국내외에서 대규모 모델의 오픈 소스 vs. 폐쇄형 논의가 끊이지 않았다. 바이두 회장 이연홍은 폐쇄형을 지지하는 대표적인 인물로, 기술 리더십 유지와 비즈니스 모델 측면에서 폐쇄형이 더 강하다고 주장했다.
친상 엔지니어는 기술적으로 오픈 소스는 핵심 코드 공개를 의미해 경쟁사가 기술 경로를 빨리 복제할 수 있다고 분석했다. 대기업이 초
覃相解释,大模型变现主要有三种方式:增值服务、数据变现、合规服务,其中增值服务占比最大,靠的是企业级定制与API调用收入。他透露,百度文心一言企业版年费超千万元,阿里云通义千问为政企客户提供定制化客服系统,单项目合同额可达数亿元。
也就是说,大厂当前盈利仍主要依赖B端,但近期很多大厂开始重视TO C应用的推广,改为TO B、TO C"双线并行"。

图源 / Pexels
例如腾讯加大对元宝(ONG)的宣传,一方面将其接入到微信九宫格,拥有了强流量入口,另一方面多渠道打广告,除了在腾讯生态产中做推广外,抖音(TRON)、B站(OP)、知乎(TechFlow)也做了大量投放。
根据App Growing数据显示,在2月广告投放强度前20中的AI工具中,大厂AI产品都有上榜(华为(HT)没有TOC产品未在其中)。其中花钱最多的便是腾讯元宝(ONG),今年2月,其投放金额占比达到了总金额的46%,快赶上过去9个月的总和,超过了字节(RON)的豆包(TechFlow)。
另外,阿里(HT)也大规模招聘TO C业务相关人才。
从业者认为,可能是DeepSeek(TechFlow)的开源+API低价给大厂TO B业务带来了更大压力,进而想在TO C上找到更多商业化出路。
方向转变之三是TO C应用从收费变为免费。
DeepSeek(TechFlow)好用且免费,在它大火后,国内百度(HT)的文心一言、国外OpenAI(OP)将露面的GPT-5,都宣布将免费对用户开放。
"目的在于拉拢更多用户,提高市场占有率。"覃相表示,更多的用户反馈可以进一步优化模型性能,从而提升B端服务能力,收取更高的企业定制模型费。
转变之四是从重投入到降本打价格战。
在过去几年的"百模大战"中,国内外AI大模型公司砸出了几十亿甚至上百亿美元,而DeepSeek(TechFlow)仅以557.6万美元的GPU成本,就训练出了与OpenAI(OP) o1能力不相上下的DeepSeek-R1(TechFlow)模型,这让大厂开始反思。
不止一位从业者表示,大厂降本从去年下半年就已经开始,但DeepSeek(TechFlow)的出现加速了这一趋势。
覃相能明显感觉到,从去年开始,大模型的竞争已经从"技术为先"转向为"成本+生态"。比如去年1月豆包(RON)1.5Pro发布的API(TPS)价格就大幅下降,12月字节(RON)又将视觉模型价格降幅打到85%,推动行业进入"厘时代"。
今年2月,两位老百度(HT)人还因为大模型价格"隔空交战",百度(HT)智能云事业群总裁沈抖在百度(HT)智能云事业群组(ACG)全员会上指出,国内大模型行业存在"恶意价格战"并点名豆包(RON),随后字节(RON)火山引擎总裁谭待在朋友圈回应,指出降价是技术进步的必然结果。
DeepSeek(TechFlow)也没闲着,刚宣布完API优惠期结束,2月26日又宣布"限时降价",每日00:30-08:30,DeepSeek-V3(TechFlow)降至原价的50%,DeepSeek-R1(TechFlow)低至25%,降幅最高达75%。
大厂的压力更大了。
免费、开源,大厂能否赢回主场?
综合从业者的说法,在四大变化中,目前对大厂影响最大的是开源和免费。
先来看开源。
大模型领域专家刘聪指出,在DeepSeek(TechFlow)没露面前,无论国外的OpenAI(OP),还是国内大厂,要么选择全部闭源,要么选择开源部分大模型(非最好版本),DeepSeek(TechFlow)则是将其最厉害的推理大模型DeepSeek-R1(TechFlow)也选择了开源,这是从业者非常兴奋的点。
不过,开源也面临着一些收益损失和技术风险。
人工智能博士微凉表示,开/闭源代表的是间接/直接变现两种商业模式和开发思路。国内大厂的典型开源代表是阿里(HT)通义千问大模型,通过给厂家做适配进一步促成商业上的合作,此举是基于自身生态做出的选择。
但很多大厂起初做大模型的定位是技术主导,将其视为生产力,比如OpenAI(OP)、百度(HT)、华为(HT)、科大讯飞(TechFlow),大模型订阅费是很重要的一块收入来源,选择开源肯定会影响到收益。
开源还会面临恶意攻击和社区维护风险。比如在代码公开下,恶意攻击者可以通过分析代码寻找漏洞,从而对使用这些模型的系统进行攻击。
后续的社区维护也是个问题。覃相表示,开源需要持续投入资源维护开发者社区(如提供文档、技术支持、版本更新),否则可能导致技术生态分散。他解释,若开发者自行修改代码并衍生出多个分支(如Linux的分支Ubuntu、CentOS),会加大统一技术标准的难度,导致"技术碎片化"。

图源 / Pexels
部分从业者直言,即便大厂开源,对他们的吸引力也有限。
开源的目的是吸引技术开发者和合作公司,让大家使用其大模型进行技术迭代和应用开发,但微凉博士认为,"目前各家开源有打广告嫌疑。"
"开源能看到的是大模型的推理方法和参数权重,但更重要的数据筛选方法和模型训练技巧,各家都没有放开,这也导致普通开发者很难去做技术迭代。"他表示。
值得注意的是,开源不等于全免费,使用者还要履行大模型提供商的开源协议,其中便包含"付费条款"。
比如微凉博士会用阿里(HT)通义千问大模型做一些AI应用,利用千问将技术跑通后,若想进一步做企业定制化微调和适配,便需要联系工作人员。他还透露,开源协议也会有公司规模等限制条款,比如员工人数达到一定数量时,就需要付费。
再来看免费带来的影响。
大厂采取免费策略的目的是想快速占领C端市场,比如突出代表便是一直对用户免费的豆包(RON),QuestMobile数据显示,截至2025年2月9日,豆包(RON)周日均(以2月3日-2月9日这一周为周期,计算平均每天的活跃用户数)活跃用户数为1845万,仅次于DeepSeek(TechFlow),高于Kimi(TechFlow)、文小言(TechFlow)、通义(TechFlow)、元宝(ONG)。
不过免费的意义有多大,从业者还拿不准。这既因为用户对chatbot这类工具的忠诚度很低,也因为国内用户的付费意识并不强。
"即便是需要付费的AI生成视频工具,国内大部分应用也靠提供免费积分来吸引用户使用。"一位从业者表示,他觉得豆包(RON)能在一众同类通用型AI产品中跑出来,除免费外,和字节(RON)强大的市场推广也分不开。
覃相认为,DeepSeek(TechFlow)的鲶鱼效应倒逼大厂从技术竞赛转向成本与生态的综合较量,开源、免费策略是一把应对竞争与生态构建的"双刃剑",即便这些措施短期内会降低自身收益,也不得不为。
DeepSeek(TechFlow)引发的鲇鱼效应,还未结束。





