Đã đến lúc các nhà sản xuất mô hình lớn nên chấm dứt cơn sốt mô phỏng.

Bài viết này được dịch máy
Xem bản gốc
Anthropic đã công bố các hạn chế đối với gói đăng ký Claude cho các công cụ như OpenClaw do chi phí tỷ lệ băm tăng cao gây ra bởi các công cụ của bên thứ ba, cho thấy bản chất không bền vững của các mô hình dựa trên đăng ký đối với các mô hình lớn trong kỷ nguyên tác nhân.

Bài viết bởi: Kai Kai

Nguồn bài viết: Bohu Finance (bohuFN)

“Việc bán token với giá thấp và mở cửa cho bên thứ ba tham gia có vẻ thân thiện, nhưng đó là một cái bẫy.”

Mới đây, Luo Fuli, người đứng đầu nền tảng MiMo của Tập đoàn Xiaomi, đã đăng tải một bài viết trên nền tảng X, so sánh cuộc chiến giá token với một "cái bẫy" và nhắc nhở các công ty mô hình lớn không nên tham gia một cách mù quáng vào cuộc chiến giá cả.

Vài ngày trước, Anthropic đột ngột thông báo sẽ cắt quyền truy cập của các công cụ bên thứ ba vào gói đăng ký Claude, điều này cũng tạo cơ hội cho Luo Fuli đăng tải một bài viết thảo luận về logic định giá token.

Trong cơn sốt "nuôi tôm hùm" trên toàn quốc, bức thư ngỏ của Luo Fuli và lệnh "cấm" của Anthropic đã trở thành những "tiếng nói phản đối" hiếm hoi trong ngành, dội gáo nước lạnh vào cơn sốt này.

Nhưng câu hỏi đặt ra là, liệu các nhà sản xuất mô hình lớn có thực sự không hiểu chi phí này? Hay đây chỉ là một trò chơi ngầm trong ngành, đổi một lượng lớn token lấy tấm vé đến tương lai, đặt cược vào tương lai của trí tuệ nhân tạo tổng quát (AGI)?

Nếu vậy, ai có thể đánh thức một người đang giả vờ ngủ?

01 Anthropic không thể cầm cự thêm được nữa.

Vài ngày trước, Anthropic đã gửi email cho tất cả người dùng thông báo rằng bắt đầu từ 3 giờ chiều giờ địa phương ngày 4 tháng 4, các gói đăng ký Claude Pro và Max sẽ không còn bao gồm việc sử dụng các công cụ của bên thứ ba như OpenClaw nữa.

Tình hình diễn ra đột ngột, và Anthropic đã trợ cấp một lần cho người dùng tương đương với phí đăng ký một tháng. Tuy nhiên, so với thời hoàng kim khi chỉ cần trả 200 đô la mỗi tháng là có thể truy cập Claude không giới hạn, khoản trợ cấp này rõ ràng chỉ là một giọt nước trong đại dương.

Tin tức này ngay lập tức gây ra làn sóng phẫn nộ trên mạng xã hội, với người dùng liên tục buông lời lăng mạ và chỉ trích động thái này như một hành động "vượt sông đốt cầu", xét đến mối thù lâu năm giữa người sáng lập OpenClaw, Peter Steinberg, và Anthropic.

Khi OpenClaw mới ra mắt, nó có tên là Clawdbot. Tuy nhiên, do tên gọi này quá giống với Claude, thuộc sở hữu của Anthropic, Anthropic đã gửi thư cho luật sư yêu cầu đổi tên, từ đó bắt đầu một cuộc tranh chấp.

Quan trọng hơn, sau khi OpenClaw xác nhận nhu cầu thị trường về các tác nhân thông minh mã nguồn mở, Anthropic đã cho ra mắt Claude Cowork. Bên cạnh những cân nhắc về bảo mật, điều này cũng được cho rằng là một nỗ lực nhằm thay thế OpenClaw bằng sản phẩm của riêng mình.

Tuy nhiên, không lời giải thích nào trong số này giải thích đầy đủ lý do cho "lệnh cấm". Điều thực sự thuyết phục Anthropic USD chính là vấn đề chi phí.

Trong thư gửi người dùng, Anthropic tuyên bố: "Các công cụ của bên thứ ba đã gây áp lực quá lớn lên hệ thống, và chúng tôi phải ưu tiên đảm bảo trải nghiệm người dùng cho đảm bảo sử dụng các sản phẩm cốt lõi của chúng tôi."

Các phương tiện truyền thông nước ngoài đưa tin rằng Cursor, một công ty kỳ lân nổi tiếng, đã ước tính vào năm ngoái rằng phí đăng ký Claude Code hàng tháng là 200 đô la có thể tiêu tốn tới 2.000 đô la tài nguyên máy tính, cho thấy Anthropic đã trợ cấp rất lớn. Các nhà phân tích khác cũng chỉ ra rằng chi phí tỷ lệ băm thực tế của mô hình đăng ký của Anthropic có thể lên tới 5.000 đô la.

Điều này có nghĩa là mô hình tính phí dựa trên thuê bao mà các mô hình lớn từng sử dụng có thể không còn khả thi trong kỷ nguyên của các đại lý.

Một mặt, theo mô hình Đại lý, việc sử dụng Token đang tăng trưởng với tốc độ theo cấp số nhân.

Khi mô hình lớn vẫn đang ở giai đoạn hội thoại, một vòng hội thoại tiêu tốn khoảng 1.000-3.000 token. Nền tảng chỉ cần tính toán giá trị sử dụng trung bình đại diện cho hầu hết người dùng để mô hình đăng ký hoạt động hiệu quả.

Tuy nhiên, trong kịch bản dựa trên tác nhân, một người dùng có thể có 10 hoặc thậm chí 100 tác nhân hoạt động đồng thời, mỗi tác nhân...

Nhiệm vụ được thực hiện 24/7, và lần nhiệm vụ kích hoạt lần suy luận mô hình. Khi số lượng tương tác tăng lên, hiệu ứng "quả cầu tuyết" về tiêu thụ token được tạo ra, và hệ thống đăng ký dựa vào "sử dụng ít" để trợ cấp cho "sử dụng nhiều" sẽ mất cân bằng.

Để tham khảo, một người dùng ChatGPT trung bình, ngay cả khi họ trò chuyện mỗi ngày, cũng chỉ tiêu thụ một triệu token mỗi tháng; trong khi người dùng "nuôi tôm" chuyên nghiệp sẽ tiêu thụ từ 30 triệu đến 100 triệu token mỗi ngày.

Mặt khác, chi phí đối với các nhà sản xuất mô hình quy mô lớn không giảm một cách tự nhiên cùng với sự gia tăng sử dụng; thay vào đó, chúng tiếp tục tăng lên.

Báo cáo"Chỉ số AI năm 2025" của Đại học Stanford chỉ ra rằng, nhờ các mô hình nhỏ hiệu quả, chi phí suy luận của các mô hình cấp GPT-3.5 đã giảm còn 1/280 so với chi phí ban đầu trong hai năm qua, và chi phí phần cứng giảm 30% mỗi năm.

Tuy nhiên, trong khi chi phí suy luận giảm, chi phí đào tạo vẫn còn rất lớn. Quan trọng hơn, tỷ lệ băm toàn cầu vẫn khan hiếm, và càng nhiều người dùng đổ xô sử dụng các tác nhân ảo, chi phí vận hành cho doanh nghiệp càng cao.

Ví dụ, OpenAI đã thông báo với các nhà đầu tư rằng họ dự kiến ​​chi tiêu cho tỷ lệ băm sẽ đạt 121 tỷ đô la vào năm 2028, và tại thời điểm đó, lỗ vốn có thể lên tới 85 tỷ đô la, có khả năng vượt qua kỷ lục lỗ vốn của bất kỳ công ty niêm yết nào.

Mặc dù chi phí đào tạo của Anthropic không quá cao, chỉ khoảng 40% so với OpenAI, nhưng hiện tại nó vẫn đang tiêu tốn khá nhiều tiền, và đương nhiên là họ không muốn bị các công cụ của bên thứ ba xén lông cừu.

(Hình ảnh: So sánh chi phí đào tạo giữa OpenAI và Anthropic)

02. Giá của token là một cái bẫy.

Nếu Anthropic không thể trụ vững thêm nữa, thì các nhà sản xuất mô hình quy mô lớn trong nước sẽ ra sao?

Luo Fuli có lẽ là người đồng nghiệp có thể thấu hiểu Anthropic nhất. Cô ấy đã đăng trên mạng xã hội rằng Claude Code có thể không có lợi nhuận và thậm chí có thể đang lỗ vốn vì để logic định giá của Claude Code hoạt động, người dùng phải sử dụng khung phần mềm của chính Anthropic, nếu không sẽ phát sinh vấn đề.

Cô ấy đã sử dụng OpenClaw làm ví dụ điển hình để chỉ ra những vấn đề tiềm ẩn có thể phát sinh từ việc tích hợp các framework của bên thứ ba:

“Tôi đã quan sát cách quản lý ngữ cảnh của OpenClaw, và nó rất tệ. Trong lần truy vấn của người dùng, nó kích hoạt nhiều vòng gọi công cụ có giá trị thấp, lần là một yêu cầu API độc lập với ngữ cảnh dài, thường vượt quá 100.000 token.”

Nói một cách đơn giản, OpenClaw sẽ thực hiện cùng một tác vụ nhiều lần hơn so với framework Claude Code gốc, dẫn đến chi phí thực tế có thể cao hơn hàng chục lần so với giá đăng ký. Về cấu trúc chi phí, ngay cả người dùng OpenClaw ít sử dụng cũng tương đương với người dùng sử dụng nhiều.

Do đó, việc bán token với giá thấp và mở chúng cho bên thứ ba, dù có vẻ thân thiện với người dùng, thực chất lại là một cái bẫy. Để kiểm soát chi phí, các công ty chỉ có thể giảm tỷ lệ băm hoặc sử dụng các mô hình rẻ hơn, có độ thông minh thấp; người dùng liên tục gặp vấn đề với các mô hình có độ thông minh thấp này, dẫn đến trải nghiệm người dùng kém.

Tuy nhiên, nhận xét của Luo Fuli chỉ đại diện cho "tiếng nói thiểu số" trong ngành công nghiệp mô hình quy mô lớn trong nước. Ít nhất là hiện tại, hầu hết các nhà sản xuất lớn và các công ty mô hình quy mô lớn vẫn coi sản lượng token là một chỉ báo quan trọng về sức mạnh của họ.

Dữ liệu OpenRouter, một nền tảng tổng hợp và định tuyến quy mô lớn toàn cầu, cho thấy khối lượng cuộc gọi hàng tuần của các mô hình quy mô lớn của Trung Quốc đã vượt qua các mô hình nước ngoài trong một tháng liên tiếp. Các mô hình có khối lượng cuộc gọi cao nhất đều là các mô hình nội địa, chẳng hạn như Xiaomi, Jieyue Xingchen và Minimax.

Các ông lớn công nghệ toàn cầu cũng đang thúc đẩy xu hướng này, ví dụ như bằng cách khuyến khích nhân viên sử dụng các công cụ AI thường xuyên hơn. Meta thậm chí đã tạo ra bảng xếp hạng mức tiêu thụ token, điều này đã trở thành một chỉ số KPI ngầm định đối với các ông lớn công nghệ.

Do đó, lý do khiến token đắt đỏ không chỉ là do chi phí cao mà còn vì đây là một cuộc chiến tiêu hao không có hồi kết. Khi mọi người đang tuyệt vọng tiêu thụ thêm token, tỷ lệ băm sẽ không bao giờ đáp ứng được nhu cầu ngày càng tăng.

Hơn nữa, so với câu hỏi liệu việc tiêu thụ token có phải là sự thịnh vượng giả tạo hay không, các doanh nghiệp quy mô lớn khó cưỡng lại được sức hút của tiền thật hơn—chỉ trong ba tháng, thu nhập hàng năm của Anthropic đã tăng vọt từ 9 tỷ đô la lên 30 tỷ đô la.

Giá của các token có thể là một "cái bẫy", nhưng với việc các nhà sản xuất toàn cầu lớn đang "cạnh tranh nhau", không ai sẵn lòng là người đầu tiên "hãm phanh".

Đối với các công ty công nghệ hàng đầu như Alibaba, ByteDance và Tencent, cuộc cạnh tranh giành vị trí cổng thông tin siêu việt dựa trên trí tuệ nhân tạo đã diễn ra từ lâu, nhưng họ vẫn chưa thể thoát khỏi chiến lược internet "đốt tiền để thu hút lưu lượng truy cập". Việc gửi lì xì và tăng cường đầu tư vào lưu lượng truy cập có thể kích hoạt người dùng hoạt động hàng ngày (DAU), nhưng một khi "sức mạnh tiền bạc" cạn kiệt, người dùng sẽ nhanh chóng rời đi.

"Lobster" đã trở thành một cơ hội mới. Sau khi người dùng hoàn tất triển khai, điều này tương đương với việc nhúng "trợ lý thông minh" của họ vào nền tảng đám mây. Không chỉ tạo ra sự tiêu thụ token liên tục, mà dữ liệu cá nhân cũng sẽ lắng đọng trong hệ sinh thái. Chi phí chuyển đổi sẽ ngày càng cao, và các công ty lớn đương nhiên sẽ không bỏ lỡ "điểm thâm nhập hệ sinh thái" mới này.

Đối với các nhà cung cấp hạng hai như Kimi và Zhipu, sự xuất hiện của "Lobster" đã thúc đẩy nhu cầu về tỷ lệ băm, cho phép các mô hình của họ được sử dụng và tạo ra một câu chuyện hấp dẫn cho tăng trưởng API. Điều này đủ để thúc đẩy họ bán API của mình một cách mạnh mẽ hơn.

Về mặt logic, đánh giá của Luo Fuli về token là chính xác; "sự đảo chiều giá" không thể tiếp diễn mãi mãi. Tuy nhiên, đối với các công ty lớn đã thành công tăng trưởng dựa trên "tôm hùm", họ có thể muốn "giả vờ ngủ" thêm một thời gian nữa.

03 Hiệu quả quan trọng hơn giá cả

Không ai có thể đánh thức người đang giả vờ ngủ, nhưng thực tế thì có thể - việc tiêu thụ token ngày càng tăng không mang lại sự tăng trưởng tương ứng về lợi nhuận, đây là vấn đề mà các doanh nghiệp quy mô lớn không thể tránh khỏi.

Lấy Zhipu, một công ty hoàn toàn tương đồng với Anthropic, làm ví dụ, báo cáo tài chính năm 2025 của công ty này cho thấy "tăng trưởng cao và lỗ vốn cao": tổng thu nhập đạt 724 triệu nhân dân tệ, tăng 131,9% so với năm trước; và lỗ vốn 4,718 tỷ nhân dân tệ, tăng 59,5% so với năm trước.

Zhang Peng, người sáng lập Zhipu, từng tuyên bố rằng Zhipu hướng đến mục tiêu trở thành một lựa chọn thay thế tương đương với Anthropic, thậm chí còn nói đùa rằng nếu Anthropic bán với giá 200 đô la, họ sẽ bán với giá 200 nhân dân tệ. Vào tháng 3 năm nay, Zhipu đã phát hành AutoClaw, một trình cài đặt chỉ với một cú nhấp chuột, với phiên bản cá nhân có giá 39 nhân dân tệ/tháng cho 35 triệu token và 99 nhân dân tệ/tháng cho 100 triệu token, khiến rào cản gia nhập thực sự khá thấp.

Tuy nhiên, gánh nặng tài chính đằng sau điều này cũng rất lớn. Năm 2025, chi phí nghiên cứu và phát triển của Zhipu đạt 3,18 tỷ nhân dân tệ, tăng trưởng 44,9% so với năm trước. Do không có cơ sở hạ tầng riêng, Zhipu cũng cần phải trả phí mua sắm cao cho các nhà cung cấp tỷ lệ băm bên thứ ba, con số này đã tăng vọt từ 14,63 triệu nhân dân tệ năm 2022 lên 1,145 tỷ nhân dân tệ trong nửa đầu năm 2025.

Đối diện với hai khoản chi phí cố định không thể tránh khỏi—đầu tư nghiên cứu và phát triển cùng chi phí tỷ lệ băm—kể từ năm 2026, các nhà cung cấp dịch vụ đám mây trong và ngoài nước đã liên tục điều chỉnh giá tỷ lệ băm AI, lưu trữ và các sản phẩm liên quan khác. Tuy nhiên, các mô hình trong nước vẫn rẻ hơn so với các mô hình nước ngoài.

Theo một báo cáo nghiên cứu do Công ty Chứng khoán Minsheng công bố vào tháng 12 năm 2025, giá trung bình của các API mô hình quy mô lớn trong nước vào khoảng 3,88 nhân dân tệ/triệu token, trong khi đó các API mô hình nước ngoài có giá khoảng 20,46 nhân dân tệ/triệu token, cao hơn gấp năm lần so với giá của các API mô hình trong nước.

Lợi thế về giá đã dẫn đến nhu cầu quy mô lớn, và trong bối cảnh đó, các nhà sản xuất xe máy cỡ lớn trong nước khó có thể tránh khỏi cuộc chiến giá cả trong thời gian ngắn. Tuy nhiên, với lượng tiêu thụ tượng trưng vượt quá nguồn cung, việc dần dần thắt chặt hạn ngạch miễn thuế và trợ cấp là một xu hướng tất yếu.

Luo Fuli cho rằng giải pháp cho ngành công nghiệp mô hình quy mô lớn không phải là giảm giá token, mà là "khung tác nhân với hiệu quả token cao hơn" kết hợp với "các mô hình mạnh mẽ và hiệu quả hơn". Kỷ nguyên tác nhân không thuộc về những người đốt nhiều tỷ lệ băm nhất, mà thuộc về những người sử dụng tỷ lệ băm một cách thông minh nhất.

Điều này sẽ thúc đẩy các nhà sản xuất mô hình lớn phát triển theo hai hướng:

Một mặt, cuộc cạnh tranh đang chuyển từ "quy mô tỷ lệ băm" sang "hiệu quả kỹ thuật". Các công ty chỉ đơn thuần bán API sẽ phải đối mặt với giới hạn ngày càng cao. Họ cần tích hợp độ sâu lớp mô hình với phần cứng thông minh, sản phẩm ứng dụng và các công nghệ khác để tạo ra nhiều khả năng hơn cho mô hình kinh doanh của mình.

Mặt khác, nó thúc đẩy việc định giá theo bậc thang cho phí token. Hiện nay, các mô hình thanh toán phổ biến chủ yếu bao gồm đăng ký, trả tiền theo mức sử dụng và các gói token, nghĩa là chỉ phải trả tiền sau khi vượt quá giới hạn.

Về lâu dài, ngoài việc đơn giản "phân cấp theo số lượng" để định giá token, một hệ thống thanh toán tinh vi hơn có thể được triển khai dựa trên các yếu tố như khả năng suy luận và số lượng nhiệm vụ. Điều này không chỉ giúp giảm áp lực lên tỷ lệ băm tối đa của nền tảng mà còn tăng thêm thu nhập.

Ví dụ, DeepSeek đã âm thầm ra mắt hai điểm truy cập mới, "Chế độ nhanh" và "Chế độ chuyên gia", được cho rằng một bước thử nghiệm mới về mô hình chia sẻ doanh thu; Tan Dai của Volcano Engine cho biết trong tương lai, họ có thể nuôi dưỡng các tác nhân thông minh trong các lĩnh vực chuyên ngành và tính phí dựa trên số lượng câu hỏi được trả lời.

Cơn sốt token có thể còn tiếp diễn trong một thời gian, nhưng đối với mô hình tổng thể, chi phí token đã trở thành một yếu tố chi phí mà mọi doanh nghiệp và người dùng không thể bỏ qua.

Xét cho cùng, kinh doanh quy mô lớn không bao giờ chỉ đơn thuần là kinh doanh kỹ thuật, mà là cuộc chơi của hiệu quả và giá trị. Các doanh nghiệp quy mô lớn muốn xây dựng một doanh nghiệp lâu dài đương nhiên cần phải học cách tính toán chi phí và lợi ích; chỉ khi vững vàng trên thực tế, họ mới thực sự có thể vươn tới những tầm cao mới.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
52
Thêm vào Yêu thích
12
Bình luận