Giá cả đang tăng lên trên diện rộng; các mô hình quy mô lớn đang bắt đầu đòi hỏi bạn phải trả giá cao.

Bài viết này được dịch máy
Xem bản gốc
Việc DeepSeek giảm giá đã củng cố vị thế huyền thoại của họ, trong khi chính sách tính phí mới của Doubao lại vấp phải nhiều chỉ trích! Ngành mô hình hóa quy mô lớn đang chìm trong cuộc chiến giá cả.

Tác giả và nguồn bài viết: ZhiDongXi

Trong tháng vừa qua, việc thương mại hóa các mô hình quy mô lớn đã chứng kiến ​​giai đoạn kịch tính và gây tranh cãi nhất.

Một mặt, Doubao của ByteDance bắt đầu thử nghiệm mô hình trả phí , và hashtag " Doubao thật ngu ngốc khi thu phí " nhanh chóng trở thành chủ đề thịnh hành, gặp phải sự chỉ trích gay gắt từ người dùng; mặt khác, DeepSeek-V4-Pro trực tiếp giảm giá API xuống 25% , và sau đó giá truy cập bộ nhớ cache đầu vào cũng giảm xuống còn 1/10 so với giá ban đầu.

Vào ngày 22 tháng 5, DeepSeek thông báo rằng bắt đầu từ ngày 1 tháng 6, giá khuyến mãi hiện tại sẽ trở thành giá chính thức và sẽ không quay trở lại giá ban đầu . Vì vậy, Liang Wenfeng được cộng đồng nhà phát triển tôn vinh như " Thánh Liang" .

▲Một chủ đề đang thịnh hành trên Weibo (bên trái) và một bài đăng phổ biến trên Xiaohongshu (bên phải) về việc tăng giá các mô hình cỡ lớn.

Đồng thời, một vở kịch "vừa chỉ trích vừa tham nhũng" cũng đang diễn ra.

Luo Fuli, người đứng đầu mảng điện thoại cỡ lớn của Xiaomi MiMo, đã đăng tải một bài viết chỉ trích cuộc chiến giá cả trong ngành điện thoại cỡ lớn, và sau đó Xiaomi MiMo, dựa vào "kế hoạch tặng 100 nghìn tỷ token miễn phí", đã từng vươn lên dẫn đầu về khối lượng sử dụng Hermes toàn cầu.

▲Ảnh chụp màn hình một phần bài đăng của Luo Fuli trên X (Nguồn ảnh: X)

Hiện nay, đang có sự chênh lệch giá nghiêm trọng giữa thị trường trong nước và quốc tế : với cùng quy mô lệnh gọi, giá của phiên bản GPT-5.5 long context của một ông lớn nước ngoài đã cao hơn gấp 40 lần so với DeepSeek-V4-Pro trong nước .

Ở một mức độ nào đó, chúng ta có thể dự đoán được "sự lựa chọn khó khăn" của các nhà sản xuất mô hình trong nước: ai cũng biết rằng AI rất đắt đỏ, nhưng ở nút này, liệu họ nên tăng giá để bù đắp thua lỗ, hay tiếp tục giảm giá để chiếm lĩnh hệ sinh thái?

Để tính toán chính xác "chi phí AI" này, chúng tôi đã tiến hành phân tích và so sánh độ sâu các gói đăng ký, phí gọi API và giá tạo video từ hàng chục nhà cung cấp mô hình lớn hàng đầu trong nước và quốc tế .

Rõ ràng là các nhà sản xuất mô hình lớn đang đồng loạt từ bỏ các khoản trợ cấp hào phóng, và kỷ nguyên lợi dụng một cách mù quáng các nhà sản xuất mô hình lớn đang đi đến hồi kết.

01. Sự thay đổi lớn trong mô hình đăng ký: Nói lời tạm biệt với "Truy cập không giới hạn"

 Các hộp cơm trưa cỡ lớn không kèm bao bì đang được hủy niêm yết.

So với thời kỳ đầu năm 2024 khi "chỉ cần một gói thành viên ChatGPT Plus là đủ", hệ thống định giá cho các mô hình quy mô lớn tại Trung Quốc đã có sự thay đổi về chất lượng.

Thay đổi quan trọng nhất là các nhà sản xuất không còn chi trả cho mức tiêu thụ tỷ lệ băm không giới hạn, và các cuộc gọi "không giới hạn" thuần túy gần như đã biến mất hoàn toàn. Thay vào đó là một hệ thống đo lường phức tạp bao gồm Tín dụng, Mã thông báo và giá trị nhiên liệu của Đại lý.

▲So sánh giá gói đăng ký thuê bao các mô hình quy mô lớn tại Trung Quốc (Bảng do Zhidongxi biên soạn, số liệu tính đến ngày: 21/05/2026)

Chúng ta có thể thấy rõ ràng rằng hệ thống thành viên của các nền tảng nội địa phổ biến đã hình thành ba "mức giá" khác nhau:

Mức đầu tiên có thể được coi là " giá thu hút người dùng ", với hầu hết các nền tảng đều giữ mức phí gia nhập dưới 50 nhân dân tệ .

Các gói cước cơ bản của MiniMax, Xiaomi, Kimi, Zhipu, ByteDance và các nhà cung cấp khác chủ yếu có giá khoảng 40 nhân dân tệ. Tuy nhiên, gói Token Plan Standard Edition của Alibaba có giá khởi điểm từ 198 nhân dân tệ/tháng, cao hơn đáng kể, có lẽ do gói này hỗ trợ số lượng token lớn hơn và có nhiều tính năng đa phương thức.

Phân khúc thứ hai tập trung trong khoảng giá từ 80 đến 200 nhân dân tệ , đây cũng là phân khúc giá cạnh tranh nhất hiện nay.

Ít nhất tám nền tảng, bao gồm Alibaba, Baidu, Jieyue Xingchen, MiniMax, Xiaomi, Tencent, Zhipu và ByteDance, đã đưa ra nâng cấp cốt lõi trong phạm vi này.

Càng lên cao, bạn sẽ bước vào khu vực có năng suất cao.

Một số nền tảng đã vượt quá 500 nhân dân tệ/tháng cho các gói dịch vụ cao cấp của họ, với các gói cao cấp nhất của ByteDance và Alibaba đạt mức nghìn nhân dân tệ. Trong đó, gói Token Plan Premium Edition của Alibaba là đắt nhất, lên tới 1398 nhân dân tệ/tháng .

Khi sự chú ý chuyển ra nước ngoài, tình hình càng trở nên nghiêm trọng hơn.

▲So sánh giá gói đăng ký mô hình quy mô lớn ở nước ngoài (Bảng do Zhidongxi biên soạn, số liệu tính đến ngày: 21/05/2026)

Các sản phẩm có giá thấp nhất thường vào khoảng 8 đô la (khoảng 54,3 nhân dân tệ), trong khi các gói đăng ký phổ biến tập trung quanh mức 20 đô la (khoảng 136 nhân dân tệ).

Trong khi đó, ba nhà cung cấp dữ liệu quốc tế lớn cũng bắt đầu nhanh chóng mở rộng sang các gói thành viên cao cấp với giá 100 đô la hoặc thậm chí 250 đô la trở lên. Sau sự kiện Google I/O 2026 vào tháng 5 năm nay, Google đã chủ động giảm giá Gemini Ultra từ 249,99 đô la/tháng xuống còn 199,99 đô la/tháng (khoảng 1359,9 nhân dân tệ) và bổ sung thêm gói mới với giá 99,99 đô la .

So với hệ thống giá trong nước, phí hàng tháng của Gemini Ultra (phiên bản cao cấp) gần bằng mức phí hàng năm tại Trung Quốc. Trong khi đó, các gói Gemini Ultra (cơ bản) có giá trên 100 đô la, ChatGPT Pro và Claude Max có giá cao gấp ba đến năm lần so với các gói tầm trung đến cao cấp tại Trung Quốc .

02. Cuộc chiến giá cả giao diện bắt đầu: Các ông lớn nước ngoài giữ giá cao, các nhà sản xuất trong nước tranh giành thị phần.

Nếu mô hình đăng ký dành cho người dùng thông thường có yếu tố "thu hút người dùng", thì giá API dành cho nhà phát triển và hệ sinh thái Agent cho thấy sự khác biệt trong chiến lược kinh doanh giữa thị trường trong nước và quốc tế.

Sự chênh lệch giữa bảng giá API và giá thực tế là rất lớn.

Lấy DeepSeek-V4-Pro làm ví dụ, giá thành kết hợp của API đầu vào và đầu ra của nó đã được giảm xuống mức thấp nhất là khoảng 9 nhân dân tệ cho mỗi triệu token.

▲So sánh giá API của các dòng sản phẩm cao cấp mới nhất tại Trung Quốc (Bảng do Zhidongxi biên soạn, số liệu thống kê tính đến ngày 21 tháng 5 năm 2026. Lưu ý: Giá API của DeepSeek-V4-Pro đã được điều chỉnh chính thức theo giá khuyến mãi hiện tại và sẽ không được khôi phục về giá gốc.)

Ngược lại, ở nước ngoài: Gemini 3.1 Pro Preview có giá 149,6 nhân dân tệ trong các kịch bản dài hạn ; Claude Opus 4.7 có giá 204 nhân dân tệ ; và phiên bản dài hạn GPT-5.5 có giá lên tới 374 nhân dân tệ .

▲So sánh giá API của các mẫu máy bơm cỡ lớn hàng đầu mới nhất ở nước ngoài (Bảng do Zhidongxi biên soạn, số liệu tính đến ngày: 21/05/2026)

Đằng sau dữ liệu là một chiến lược hoàn toàn khác.

Các ông lớn nước ngoài như OpenAI, Google và Anthropic đang cố gắng duy trì tỷ suất lợi nhuận gộp cao và ARPU (thu nhập trung bình trên mỗi người dùng) cao, dựa vào khách hàng doanh nghiệp cao cấp để bù đắp chi phí tỷ lệ băm khổng lồ; trong khi đó, các nhà sản xuất trong nước đang giảm mạnh lợi nhuận và thậm chí trợ cấp lỗ vốn, với ý định giữ chặt hệ sinh thái Agent và thị trường nhà phát triển trong thời gian ngắn ngủi của cơ hội.

03. Giá của một video duy nhất đã tăng gần gấp tám lần: Ngay cả những khả năng trí tuệ nhân tạo đắt tiền nhất cũng không thể chịu nổi áp lực này.

Trong tất cả các khả năng của trí tuệ nhân tạo, tạo video là lĩnh vực tiêu tốn nhiều tài nguyên GPU nhất và tốn kém nhất , đồng thời cũng là lĩnh vực có mức tăng giá cao nhất.

Hiện nay, mô hình sản xuất video trong nước đã hình thành một số công ty hàng đầu, bao gồm ByteDance Seedance 2.0, Kuaishou Keling, MiniMax Conch và Alibaba HappyHorse. Tương tự, so với mô hình "tính phí theo thành viên" trước đây, hệ thống định giá hiện nay ngày càng giống với "logic cho thuê GPU đám mây".

▲So sánh giá các mẫu máy tạo video phổ biến tại Trung Quốc (Bảng do Zhidongxi biên soạn, số liệu tính đến ngày 21/05/2026)

Độ phân giải khác nhau, thời gian tạo ra khác nhau, có âm thanh hay không, có video tham khảo hay không, và liệu việc xếp hàng có được tăng tốc hay không đều ảnh hưởng trực tiếp đến giá cả.

Lấy Seedance 2.0, một mô hình thành công vang dội của ByteDance, làm ví dụ, sự biến động giá của nó có thể được mô tả như một "hình ảnh thu nhỏ của ngành": hóa đơn đã được điều chỉnh ba lần trong vòng chưa đầy một tháng . Chi phí sản xuất một video 15 giây đã tăng từ khoảng 0,65 nhân dân tệ lên khoảng 5 nhân dân tệ, tăng gần 6,7 lần .

Khi lưu lượng truy cập tăng đột biến vào giờ cao điểm buổi tối, người dùng buộc phải xếp hàng chờ đợi hoặc phải mua tỷ lệ băm ưu tiên bằng "điểm VIP" đắt đỏ.

04. USD giá mạnh: Tại sao Leung Man-Fung dám giảm giá xuống mức thấp nhất?

Trong toàn bộ cuộc chiến giá cả, DeepSeek vẫn là người chơi độc đáo nhất.

Trong bối cảnh ngành công nghiệp thắt chặt các chính sách khuyến khích, lần đợt giảm giá đáng kể của DeepSeek vào cuối tháng 4 nổi bật hẳn lên. Hiện tại, giá nhập liệu cho mỗi lần truy cập thành công vào bộ nhớ cache của DeepSeek-V4-Pro đã giảm xuống mức đáng kinh ngạc là 0,025 nhân dân tệ cho mỗi triệu token.

▲Nguồn ảnh: Chính thức DeepSeek

Tại sao DeepSeek lại dám tiếp tục "chia mình USD " khi mà nó vẫn chưa hoàn toàn đạt được khả năng tự chủ?

Một mặt, câu trả lời cho sự hồi hộp nằm ở việc bơm vốn : có tin đồn về việc mở ra một cửa ngõ tài chính khổng lồ lên tới 50 tỷ nhân dân tệ ; mặt khác, con át chủ bài quan trọng hơn đến từ việc tái cấu trúc độ sâu kiến ​​trúc phần cứng và tỷ lệ băm cơ bản.

DeepSeek-V4, công nghệ chủ lực mới nhất, không chỉ có những tối ưu hóa đột phá hơn nữa về hiệu quả xử lý dữ liệu trong thời gian dài , mà quan trọng hơn, nó còn được tích hợp để tương thích với các chip nội địa từ Huawei, Cambricon và các nhà sản xuất khác.

Sự kết hợp hiệu quả cao giữa phần cứng sản xuất trong nước và tối ưu hóa thuật toán đã giảm đáng kể chi phí tính toán của suy luận một token và mức sử dụng KV Cache trong các kịch bản với hàng triệu token ; so với DeepSeek-V3.2, chi phí suy luận với hàng triệu token đã giảm 73% .

Nói một cách đơn giản, DeepSeek đạt được " giảm chi phí và giảm giá thành " thông qua công nghệ nền tảng.

Nếu nút Ascend 950 của Huawei được triển khai rộng rãi hơn nữa và chi phí tỷ lệ băm trong nước tiếp tục giảm, thì chiến lược giá cực thấp này có thể tác động mạnh mẽ hơn nữa đến hệ thống giá của toàn bộ thị trường AI trong tương lai.

5. Lượng cuộc gọi tăng vọt, nhưng báo cáo tài chính vẫn thua lỗ: Các nhà cung cấp vẫn cần phải tập trung làm việc chăm chỉ.

Tuy nhiên, tình hình tài chính tổng thể của ngành công nghiệp mô hình cỡ lớn vẫn rất ảm đạm.

Chỉ dựa trên dữ liệu từ OpenRouter, nhu cầu của người dùng thực sự đang bùng nổ, và token đã hoàn toàn bước vào trạng thái "sôi sục".

Trong sáu tháng qua, sự hiện diện của các mẫu token sản xuất trong nước đang tăng lên nhanh chóng . Các mẫu token nội địa như DeepSeek, Tencent HY, Alibaba Qwen, Lunar Dark Side Kimi, MiniMax và Xiaomi Mimo đã bắt đầu xuất hiện đều đặn trong bảng xếp hạng thị phần token toàn cầu.

▲ Thị thị phần các mẫu sản phẩm quy mô lớn (Nguồn: OpenRouter)

Theo dữ liệu cuộc gọi hàng tuần mới nhất từ ​​OpenRouter, DeepSeek-V4-Flash và Hy3 preview đã lọt vào top đầu về khối lượng cuộc gọi, cả hai đều đạt 1,46 nghìn tỷ token mỗi tuần. Trong số mười mẫu thiết bị hàng đầu về khối lượng cuộc gọi toàn cầu, có năm mẫu là sản phẩm nội địa, trong đó các mẫu sê-ri DeepSeek V chiếm ba vị trí .

▲ Dữ liệu cuộc gọi hàng tuần mới nhất cho mô hình lớn (Nguồn: OpenRouter)

Tuy nhiên, nhu cầu tăng mạnh không ngay lập tức chuyển hóa thành dòng tiền khả quan.

Như người sáng lập Baidu, Robin Li, đã nói tại Hội nghị Nhà phát triển AI của Baidu vào tháng 5 năm nay: " Token không nhất thiết đại diện cho kết quả cuối cùng. Chúng đại diện cho chi phí, chứ không phải lợi nhuận ; chúng đo lường đầu vào, chứ không phải đầu ra."

Thực tế cũng đã chứng minh nhận định này: lấy Zhipu làm ví dụ, tổng thu nhập hoạt động năm 2025 đạt 724 triệu nhân dân tệ , tăng trưởng 131,9% so với năm trước, nhưng lỗ vốn ròng điều chỉnh trong cùng năm vẫn lên tới 3,182 tỷ nhân dân tệ ; doanh thu của MiniMax năm 2025 là 79,04 triệu đô la Mỹ (khoảng 537 triệu nhân dân tệ), nhưng lỗ vốn lên tới 250 triệu đô la Mỹ (khoảng 1,7 tỷ nhân dân tệ).

Ở một mức độ nào đó, ngành công nghiệp mô hình cỡ lớn hiện đang đối mặt với một vấn đề chung: cứ mỗi thu nhập kiếm được, có thể phải lỗ vốn từ ba đến bốn đô la.

Thậm chí còn tàn khốc hơn, bất chấp việc thị trường vốn sẵn sàng trả giá cao cho "các câu chuyện về AI", thị trường vẫn cực kỳ nhạy cảm với những thay đổi về khả năng của mô hình. Sau khi DeepSeek-V4 được phát hành, giá cổ phiếu của Zhipu và MiniMax, hai công ty niêm yết trên Sở giao dịch chứng khoán Hồng Kông, đã giảm mạnh hơn 9% trong hai ngày liên tiếp.

Nhưng những gã khổng lồ không thể dừng lại.

Có tin đồn rằng chi tiêu cho cơ sở hạ tầng AI của ByteDance trong năm 2026 sẽ lên tới gần 200 tỷ nhân dân tệ ; Lei Jun của Xiaomi đã tuyên bố vào tháng 3 năm nay rằng đầu tư vốn và nghiên cứu phát triển của Xiaomi trong lĩnh vực AI sẽ vượt quá 16 tỷ nhân dân tệ trong năm nay .

▲Nguồn ảnh: Weibo của Lei Jun

Trong trò chơi cuộc sống này, rủi ro bị Sự lật đổ do "không đầu tư vào AI" có lẽ tốt hơn nhiều so với nỗi đau khi "mất tiền trong lĩnh vực AI".

6. Người dùng có sẵn sàng trả tiền không? Trí tuệ nhân tạo, vốn quen với việc cung cấp các dịch vụ miễn phí, cuối cùng cũng đang nhắm đến ví tiền của người dùng.

Cuối cùng, và quan trọng nhất: khi các nhà sản xuất bắt đầu đưa ra "hóa đơn", liệu người dùng có sẵn lòng trả tiền không?

Trong năm qua, lượng lớn các sản phẩm AI đã nhanh chóng thu hút khách hàng thông qua trợ giá, hạn mức miễn phí và tiếp thị tần suất cao, và người dùng cũng đã hình thành thói quen mặc định: AI nên rẻ, tốt nhất là miễn phí.

Khi Doubao bắt đầu thu phí, phản ứng dữ dội từ dư luận đã phản ánh điều này một cách rõ nét. Sau khi Doubao ra mắt dịch vụ trả phí, các hashtag như "Doubao thật ngu ngốc mà vẫn thu phí", "Doubao khiến việc thu phí nghe có vẻ mới mẻ", và "Doubao đưa ra ba câu trả lời cho cùng một câu hỏi" đã trở thành xu hướng trên Weibo.

Một số người đã nói đùa: "DeepSeek thức dậy và phát hiện ra đối thủ của mình đã tự tử . "

Có người nói rằng: Nếu Doubao biến mất, thì có Qianwen; nếu Qianwen biến mất, thì có Yuanbao; nếu Yuanbao biến mất, thì có DeepSeek.

Những lời nhận xét có vẻ như đùa cợt này cũng phản ánh chi phí chuyển đổi người dùng hiện nay cực kỳ thấp — nếu bạn thấy Doubao đắt đỏ hôm nay, bạn có thể dễ dàng chuyển sang Qianwen, Kimi hoặc DeepSeek vào ngày mai.

Điều đáng lo ngại hơn nữa là bản thân mô hình này vẫn còn lượng lớn vấn đề khó kiểm soát.

▲Nguồn ảnh: Các bài đăng phổ biến trên Xiaohongshu (Sách Đỏ Nhỏ)

Khi miễn phí, ảo giác đó rất thú vị; khi phải trả phí, ảo giác đó trở thành một lỗi sản phẩm.

Đồng thời, các vấn đề về đạo đức, an ninh và bản quyền đang trở thành một lớp áp lực phức tạp hơn nữa.

Ai cũng biết trí tuệ nhân tạo (AI) sẽ thay đổi thế giới, nhưng vẫn còn nhiều trở ngại trong việc thuyết phục công chúng trả tiền cho "trí tuệ không ổn định" một cách đáng tin cậy như cách họ trả tiền cho nước, điện và khí đốt.

7. Kết luận: Tăng giá không phải là dấu chấm hết; tìm được mô hình kinh doanh lành mạnh không hề dễ dàng.

Dù là âm thầm giảm bớt các quyền lợi hay công khai tung ra các gói đăng ký trả phí, xu hướng các công ty AI quy mô lớn tính phí người dùng là không thể đảo ngược. Tuy nhiên, vấn đề là việc tăng giá đơn thuần không thể giải quyết triệt để những lo ngại về thương mại hóa của các công ty AI.

Đối diện chi phí tỷ lệ băm cao, lòng trung thành của người dùng dễ lung lay và những khiếm khuyết trong chính các mô hình chưa được khắc phục hoàn toàn, ngành công nghiệp AI hiện nay đang ráo riết huy động vốn trên thị trường vốn để tồn tại, đồng thời cân nhắc kỹ lưỡng từng đồng trong hóa đơn thanh toán.

Bức tranh toàn cảnh đã được hé lộ. Tuy nhiên, mô hình kinh doanh có thể ngăn chặn ngành công nghiệp này khỏi bị suy thoái và cho phép nó hoạt động lành mạnh vẫn còn là một bí ẩn.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận