Tác giả: Vương Lộ

Nguồn ảnh: Được tạo bởi AI vô biên
AI dường như đã trở thành "cứu cánh" của các công ty lớn.
Không kể những điểm sáng trong báo cáo tài chính, hay những thông tin tích cực được đưa ra định kỳ, tất cả đều liên quan đến AI.
Ví dụ, trong báo cáo tài chính đầy tích cực và tiêu cực của Baidu năm 2024, những điểm nhấn chính đều đến từ AI:
Số lượng giao dịch trên mỗi giây (TPS) của mô hình lớn Wénxīn liên tục tăng trưởng nhanh chóng, tăng 33 lần trong một năm lên 1,65 tỷ. Số người dùng trả phí (付费用户) của Baidu Wenku vượt 40 triệu, đứng thứ hai toàn cầu và thứ nhất tại Trung Quốc.
Alibaba cũng nhờ AI mà đạt được ba chiến thắng liên tiếp trong đầu năm:
Trước tiên, chịu ảnh hưởng từ DeepSeek, mô hình lớn mã nguồn mở Qwen của Alibaba cũng nhận được sự quan tâm; sau đó, mô hình mới nhất Qwen2.5-Max được đánh giá là có hiệu suất vượt trội so với DeepSeek V3; sau đó, họ còn công bố hợp tác với Apple về việc kinh doanh AI, khiến giá cổ phiếu tăng vọt.
Tuy nhiên, kể từ khi DeepSeek nổi tiếng gần 40 ngày, các công ty lớn gánh chịu nhiều lo lắng hơn là thu hoạch, bởi lẽ mỗi công ty đều đầu tư rất nhiều nhân lực, vật lực và tài lực, nhưng cuối cùng lại là một nhóm khởi nghiệp tạo ra sản phẩm nổi bật. Trong những ngày gần đây, DeepSeek còn lần đầu tiên công bố một tin động trời - tỷ suất lợi nhuận của nó lên tới 545% (lợi nhuận lý thuyết), lợi nhuận lý thuyết có thể đạt 3,46 triệu đồng mỗi ngày.
Trước những tác động như vậy, các công ty lớn đã thay đổi hướng đi, một mặt không thể đánh bại DeepSeek nên tham gia, liên tục công bố việc tiếp nhận DeepSeek, mặt khác chuyển các mô hình lớn của mình từ đóng mã nguồn sang mã nguồn mở, thậm chí không ngại tự cắt đứt một con đường thương mại hóa, cung cấp miễn phí sản phẩm dành cho người dùng cuối.
Nhưng, những động thái này có thể chữa khỏi chứng lo lắng về AI của các công ty lớn không?
Các công ty lớn làm AI như thế nào?
Trước khi DeepSeek xuất hiện, con đường mà các công ty lớn đi trong lĩnh vực AI là đầu tư lớn, tập trung vào các sản phẩm dựa trên lợi thế của chính mình.
Mô hình lớn được coi là cơ sở hạ tầng của ngành công nghiệp AI, các tập đoàn Internet lớn (Baidu, Tencent, Alibaba, ByteDance, Kuaishou, v.v.), các nhà sản xuất thiết bị điện tử tiêu dùng (đại diện là Huawei), các nhà sản xuất giọng nói thông minh (ví dụ như iFLYTEK), đều đã tung ra các mô hình lớn do chính mình phát triển. So với các "6 con hổ nhỏ" trong lĩnh vực AI, ưu thế của các công ty lớn là có nguồn tài chính và nhân tài dồi dào hơn.
Xét từ tốc độ lặp lại công nghệ của toàn ngành AI, cũng như thông tin công khai của từng công ty, không có sự khác biệt cơ bản về mặt kỹ thuật nền tảng giữa các mô hình lớn của các công ty lớn, nhưng về thời điểm ra mắt, định vị mô hình và chiến lược thị trường thì có những điểm khác biệt cụ thể như sau:

Ba điểm khác biệt này phần nào thể hiện quan điểm và định vị sớm của các công ty lớn đối với AI.
Ví dụ, về thời điểm ra mắt mô hình lớn, "sớm" thể hiện công ty đó đã sớm triển khai và tích lũy công nghệ trong lĩnh vực liên quan, phản ứng nhanh, nhưng rủi ro là công nghệ vẫn chưa hoàn thiện, chi phí nghiên cứu phát triển và quảng bá thị trường tương đối cao.
Nhìn vào bảng trên, Huawei là công ty ra mắt sớm nhất, nhưng cần lưu ý rằng mặc dù nền tảng của họ cũng dựa trên kiến trúc Transformer, nhưng hoàn toàn khác với mô hình đối thoại kiểu ChatGPT, thuộc hướng "chuyên dụng trong ngành" (khác với mô hình thông minh đa năng kiểu ChatGPT). Nếu tập trung vào mô hình lớn thông minh đa năng, thì Baidu là công ty hành động sớm nhất, khởi động thử nghiệm mô hình Wénxīn Yīyán vào tháng 3/2023 (chưa phát hành toàn diện).
Tuy nhiên, thời điểm ra mắt sớm hay muộn không phải là yếu tố then chốt để đánh giá chất lượng mô hình.
Định hướng kinh doanh của các công ty lớn quyết định hướng ứng dụng của mô hình lớn, cũng tạo nên sự khác biệt về định vị các mô hình, điều này xuất phát từ nguồn dữ liệu huấn luyện của từng công ty.
Mô hình Wénxīn Yīyán của Baidu chủ yếu dựa trên dữ liệu văn bản trên Internet; Qwen của Alibaba là dữ liệu đa phương thức bao gồm văn bản, hình ảnh, âm thanh; Hùn Nguyên của Tencent là dữ liệu mạng xã hội và hành vi người dùng; Đậu Bao của ByteDance khoảng 50%-60% đến từ các dịch vụ nội bộ (Douyin, Toutiao); mô hình Bàng Cổ của Huawei sử dụng nhiều loại dữ liệu như công nghiệp, khí tượng, văn bản - hình ảnh, hình ảnh, v.v.
Điều này cũng khiến các mô hình lớn của từng công ty có ưu thế khác nhau, ví dụ Wénxīn Yīyán vượt trội trong xử lý văn bản dài và đối thoại đa ngôn ngữ; Hùn Nguyên thì ưu thế hơn trong các kịch bản mạng xã hội; Đậu Bao dẫn đầu trong tạo nội dung và đề xuất chính xác; Qwen phản hồi nhanh hơn trong các kịch bản thương mại điện tử; Bàng Cổ thì nổi trội về tốc độ thực thi và khả năng khái quát hóa, có thể xử lý hiệu quả các nhiệm vụ quy mô lớn.
Không khó nhận ra rằng, ưu thế của từng mô hình lớn đều có liên hệ với lĩnh vực kinh doanh cốt lõi của từng công ty.
Cuối cùng, về chiến lược thị trường, phần nào phản ánh sự đánh giá của các công ty lớn về năng lực của mình và xu hướng ngành, những điều quan sát bên ngoài có thể chia thành hai phần: mã nguồn mở/đóng và sản phẩm dành cho người dùng cuối (TO C) có miễn phí hay không.
ByteDance, Kuaishou, iFLYTEK, Huawei hiện vẫn kiên trì đóng mã nguồn, trong khi Baidu, Tencent, Alibaba lại chọn mở mã nguồn cho phần lớn. Về sản phẩm TO C, Baidu, Tencent, Alibaba chọn hướng miễn phí, còn ByteDance, Kuaishou, iFLYTEK thì chủ yếu cung cấp hạn mức sử dụng miễn phí.
Alibaba đã hưởng được "ngọt ngào" từ việc mở mã nguồn, bảng xếp hạng mô hình lớn mã nguồn mở mới nhất của nền tảng Hugging Face cho thấy, 10 mô hình lớn mã nguồn mở hàng đầu đều dựa trên phái sinh từ Qwen của Alibaba.
Trong sản phẩm TO C, Đậu Bao kiên trì miễn phí lại có đà tăng trưởng mạnh nhất trong một năm. Theo bảng xếp hạng sản phẩm AI, vào tháng 1/2025, Đậu Bao xếp hạng thứ nhất trong câu lạc bộ 10 triệu người dùng hoạt động hàng tháng tại Trung Quốc, với 78,61 triệu người, vượt xa các ứng dụng khác của các công ty lớn.
Tuy nhiên, điều mọi người quan tâm hơn là xếp hạng năng lực tổng thể của các mô hình lớn của các công ty lớn. Theo phân tích của một số người trong nghề, hiện các mô hình lớn hàng đầu của các công ty lớn chủ yếu là đóng mã nguồn, trong bối cảnh thông tin không hoàn toàn minh bạch, việc đánh giá năng lực của từng công ty không phải là chuyện dễ dàng.
Báo cáo "Đánh giá năng lực mô hình lớn Trung Quốc 2024" của Frost & Sullivan chỉ ra rằng, các mô hình lớn như Wénxīn Yīyán của Baidu, Hùn Nguyên của Tencent, Qwen của Alibaba đều nằm trong nhóm hàng đầu, cho rằng họ tương đối toàn diện về năng lực kỹ thuật và quy mô người dùng. Nhưng không xác định rõ ràng công ty nào có năng lực tổng thể vượt trội.
Kỹ sư phần mềm Qín Tương từ I Software Engineering cho biết, các công ty khác nhau về kiến trúc kỹ thuật và dữ liệu huấn luyện, ví dụ về kiến trúc kỹ thuật, quy mô mô hình và số lượng tham số là những chỉ số quan trọng để đánh giá độ phức tạp và năng lực của mô hình lớn. Nhìn chung, quy mô càng lớn, số lượng tham số càng nhiều, khả năng học tập và biểu đạt của mô hình càng mạnh. Chẳng hạn, DeepSeek-R1 được gọi là "quái vật" về tham số, với 6.710 tỷ tham số, tạo ra một kho kiến thức khổng lồ.
Ông Qín Tương cho rằng, xét về khía cạnh này, trong số các mô hình lớn của các công ty lớn, Wénxīn Yīyán có năng lực mạnh hơn về suy luận sâu. Nh
Dưới đây là bản dịch tiếng Việt của văn bản trên:Theo giải thích của ông Tăng Tương, có ba cách chính để thu lợi từ các mô hình lớn: cung cấp dịch vụ gia tăng giá trị, khai thác dữ liệu và cung cấp dịch vụ tuân thủ, trong đó dịch vụ gia tăng giá trị chiếm tỷ lệ lớn nhất, dựa trên doanh thu từ dịch vụ tùy chỉnh doanh nghiệp và gọi API. Ông tiết lộ rằng phí hàng năm cho phiên bản doanh nghiệp của Baidu Wenxin Yiyan vượt quá 10 triệu đô la, và Alibaba Cloud Tongyiqianwen cung cấp hệ thống dịch vụ khách hàng tùy chỉnh cho khách hàng chính phủ và doanh nghiệp, với giá trị hợp đồng có thể lên đến hàng tỷ đô la.
Điều này có nghĩa là hiện tại, các công ty lớn vẫn chủ yếu phụ thuộc vào doanh thu từ khách hàng doanh nghiệp, nhưng gần đây nhiều công ty lớn bắt đầu chú trọng đến việc quảng bá các ứng dụng hướng đến người dùng, chuyển sang mô hình "song song B2B và B2C".

Nguồn ảnh / Pexels
Ví dụ, Tencent đẩy mạnh quảng bá cho Yuanbao, một mặt tích hợp nó vào ô vuông 9 của WeChat để có kênh tiếp cận lưu lượng truy cập mạnh, mặt khác thực hiện quảng cáo đa kênh, ngoài việc quảng bá trong hệ sinh thái Tencent, còn đầu tư lớn trên Douyin, Bilibili, Zhihu.
Theo dữ liệu của App Growing, trong 20 công cụ AI có mức đầu tư quảng cáo cao nhất trong tháng 2, các sản phẩm AI của các công ty lớn đều có mặt (không bao gồm Huawei vì không có sản phẩm hướng đến người dùng). Trong đó, Yuanbao của Tencent là sản phẩm có mức đầu tư quảng cáo cao nhất, chiếm 46% tổng chi phí quảng cáo trong tháng 2, gần bằng tổng chi phí của 9 tháng trước đó, vượt qua Douban của ByteDance.
Ngoài ra, Alibaba cũng đang tuyển dụng số lượng lớn nhân tài liên quan đến kinh doanh hướng đến người dùng.
Một số người trong nghề cho rằng, việc DeepSeek cung cấp mã nguồn mở và API với giá thấp có thể đã gây ra áp lực lớn hơn đối với kinh doanh hướng doanh nghiệp của các công ty lớn, khiến họ muốn tìm kiếm nhiều cơ hội thương mại hóa hơn ở phân khúc người dùng.
Thứ ba, ứng dụng hướng đến người dùng chuyển từ có phí sang miễn phí.
DeepSeek rất hữu ích và miễn phí, sau khi nó trở nên nổi tiếng, Baidu Wenxin Yiyan trong nước và GPT-5 của OpenAI ở nước ngoài cũng đều tuyên bố sẽ miễn phí cho người dùng.
"Mục đích là để thu hút thêm nhiều người dùng, tăng thị phần. " Ông Tăng Tương cho biết, phản hồi từ nhiều người dùng hơn sẽ giúp tiếp tục cải thiện hiệu suất mô hình, từ đó nâng cao năng lực dịch vụ doanh nghiệp và thu phí dịch vụ tùy chỉnh mô hình cao hơn.
Thứ tư, từ tập trung đầu tư sang giảm chi phí và cạnh tranh về giá.
Trong "cuộc chiến mô hình lớn" những năm qua, các công ty AI mô hình lớn trong và ngoài nước đã đầu tư hàng chục tỷ đô la, trong khi DeepSeek chỉ với chi phí GPU 557.600 USD đã huấn luyện được mô hình DeepSeekR1 không thua kém gì mô hình o1 của OpenAI, điều này khiến các công ty lớn bắt đầu suy ngẫm lại.
Không chỉ một người trong nghề cho biết, việc giảm chi phí của các công ty lớn đã bắt đầu từ nửa cuối năm ngoái, nhưng sự xuất hiện của DeepSeek đã làm gia tăng xu hướng này.
Ông Tăng Tương cảm nhận rõ ràng rằng, từ năm ngoái, cuộc cạnh tranh về mô hình lớn đã chuyển từ "công nghệ trước tiên" sang "chi phí + sinh thái".
Ví dụ, giá API của Douban 1.5Pro được giảm đáng kể vào tháng 1 năm ngoái, và vào tháng 12, ByteDance lại giảm giá mô hình thị giác tới 85%, thúc đẩy ngành công nghiệp bước vào "kỷ nguyên của cent".
Vào tháng 2 năm nay, hai cựu nhân viên của Baidu còn "đấu khẩu" về giá mô hình lớn, Chủ tịch Shen Dou của Tập đoàn Dịch vụ Đám mây Thông minh Baidu đã chỉ ra trong cuộc họp toàn thể của Tập đoàn Dịch vụ Đám mây Thông minh Baidu (ACG) rằng ngành mô hình lớn trong nước đang có "cuộc chiến giá bất chính", và gọi tên Douban, sau đó Giám đốc Tập đoàn Lửa Núi của ByteDance Tán Đãi đã phản hồi trên Wechat, cho rằng việc giảm giá là kết quả tất yếu của tiến bộ công nghệ.
DeepSeek cũng không ngồi yên, vừa thông báo kết thúc ưu đãi API, ngày 26/2 lại thông báo "giảm giá có thời hạn", từ 00:30 đến 08:30 hàng ngày, DeepSeek-V3 giảm 50% so với giá gốc, DeepSeek-R1 giảm tới 25%, mức giảm cao nhất lên tới 75%.
Áp lực lên các công ty lớn càng lớn hơn.
Miễn phí, mã nguồn mở, liệu các công ty lớn có thể giành lại thế chủ động?
Tổng hợp từ những chia sẻ của những người trong nghề, trong bốn thay đổi lớn này, hiện tại ảnh hưởng lớn nhất đến các công ty lớn là mã nguồn mở và miễn phí.
Trước tiên hãy xem xét về mã nguồn mở.
Chuyên gia về lĩnh vực mô hình lớn Liu Cong chỉ ra rằng, trước khi DeepSeek xuất hiện, dù là OpenAI ở nước ngoài hay các công ty lớn trong nước, họ hoặc lựa chọn hoàn toàn đóng mã nguồn, hoặc chỉ mở một phần mô hình lớn (không phải phiên bản tốt nhất), nhưng DeepSeek lại chọn mở mã nguồn cho cả mô hình suy luận mạnh nhất của họ là DeepSeek-R1, điều này khiến những người trong nghề rất phấn khích.
Tuy nhiên, mã nguồn mở cũng đối mặt với một số rủi ro về thu nhập và kỹ thuật.
Tiến sĩ trí tuệ nhân tạo Vị Lương cho biết, mã nguồn mở và đóng mã nguồn tương ứng với hai mô hình kinh doanh và phương thức phát triển gián tiếp/trực tiếp. Đại diện điển hình của mã nguồn mở trong nước là mô hình Alibaba Tongyiqianwen, thông qua việc thích ứng cho các nhà sản xuất để thúc đẩy hợp tác kinh doanh, đây là lựa chọn dựa trên sinh thái của chính họ.
Nhưng nhiều công ty lớn ban đầu định vị mô hình lớn là dẫn đầu về công nghệ, coi nó như lực lượng sản xuất, chẳng hạn như OpenAI, Baidu, Huawei, iFLYTEK, phí đăng ký sử dụng mô hình lớn là một nguồn thu nhập rất quan trọng, lựa chọn mã nguồn mở chắc chắn sẽ ảnh hưởng đến lợi nhuận.
Mã nguồn mở cũng sẽ đối mặt với rủi ro tấn công độc hại và duy trì cộng đồng. Ông Tăng Tương cho biết, mã nguồn mở cần phải liên tục đầu tư nguồn lực để duy trì và phát triển cộng đồng nhà phát triển (như cung cấp tài liệu, hỗ trợ kỹ thuật, cập nhật phiên bản), nếu không có thể dẫn đến sự phân tán của hệ sinh thái kỹ thuật, gây ra "mảnh vỡ công nghệ".

Nguồn ảnh / Pexels
Một số người trong nghề thẳng thắn nói rằng, ngay cả khi các công ty lớn mở mã nguồn, sức hút của họ cũng có hạn.
Mục đích của mã nguồn mở là thu hút các nhà phát triển kỹ thuật và công ty hợp tác, để mọi người sử dụng mô hình lớn của họ để lặp lại công nghệ và phát triển ứng dụng, nhưng Tiến sĩ Vị Lương cho rằng, "hiện tại mỗi công ty mở mã nguồn đều có vẻ như đang quảng cáo."
"Mã nguồn mở chỉ cho thấy phương pháp suy luận và trọng số tham số của mô hình lớn, nhưng những kỹ thuật quan trọng hơn như lọc dữ liệu và kỹ thuật huấn luyện mô hình, các công ty đều không công khai, điều này khiến các nhà phát triển thông thường rất khó lặp lại công nghệ."
Đáng chú ý là, mã nguồn mở không có nghĩa là hoàn toàn miễn phí, người sử dụng vẫn phải tuân thủ các điều khoản giấy phép mã nguồn mở của nhà cung cấp mô hình, bao gồm cả "điều khoản phí".
Ví dụ, Tiến sĩ Vị Lương sẽ sử dụng mô hình Alibaba Tongyiqianwen để phát triển một số ứng dụng trí tuệ nhân tạo, sau khi đã chạy thành công công nghệ Tongyiqianwen, nếu muốn tiếp tục tùy chỉnh và thích ứng cho doanh nghiệp, sẽ cần liên hệ với nhân viên. Ông cũng tiết lộ rằng, giấy phép mã nguồn mở cũng có các điều khoản hạn chế về quy mô công ty, ví dụ khi số lượng nhân viên đạt đến một mức nhất định, sẽ phải trả phí.
Tiếp theo hãy xem xét về tác động của việc miễn phí.
Mục đích của các công ty lớn khi áp dụng chiến lược miễn phí là muốn nhanh chóng chiếm lĩnh thị trường người dùng, điển hình là Douban





