Claude Fable tăng giá gấp đôi; trí tuệ nhân tạo hàng đầu đang trở thành một thứ xa xỉ.

Bài viết này được dịch máy
Xem bản gốc

Vào ngày 9 tháng 6 năm 2026, Anthropic đã phát hành Claude Fable 5, một mô hình mới tập trung vào việc lập kế hoạch và tạo mã phức tạp. Bản thân việc phát hành không gây bất ngờ, nhưng hai thông tin đi kèm đã nhanh chóng khơi dậy cuộc thảo luận trong cộng đồng lập trình viên: giá API của Fable 5 cao gấp đôi so với phiên bản tiền nhiệm, Opus 4.8; và sau ngày 22 tháng 6, Fable 5 sẽ bị xóa khỏi các gói đăng ký Pro, Max và các gói khác, chỉ có thể truy cập thông qua các lệnh gọi API hoặc tín dụng sử dụng.

Các nhà phát triển trên Reddit báo cáo rằng việc chạy Fable 5 trên gói Max 20x đã tiêu tốn 2% hạn mức tín dụng của họ mỗi phút. Một người dùng trên Hacker News đã ghi lại mức sử dụng hàng ngày của họ, cho thấy họ đã chi 82,92 đô la cho mã thông báo API của Fable 5 trong phạm vi hạn mức tín dụng của mình. Nó mạnh mẽ, nhưng lại ngốn tiền rất nhanh.

Đây không chỉ là vấn đề định giá một mô hình. Khi trí tuệ nhân tạo (AI) hàng đầu bắt đầu được định giá theo từng cấp độ dựa trên khả năng của nó, và cấp độ cao nhất bị loại bỏ khỏi gói đăng ký chung, một câu hỏi cấp bách hơn sẽ nảy sinh: ai đang sử dụng những mô hình tốt nhất?

Giá gấp đôi, và có cả bộ đếm ngược.

Theo thông báo chính thức của Anthropic, Claude Fable 5 là mẫu máy tính cấp Mythos đầu tiên được phát hành rộng rãi. Mythos là hệ thống xếp hạng nội bộ của Anthropic dành cho các mẫu máy tính có khả năng cao nhất, trước đây chỉ dành cho các đối tác của Project Glasswing. Về cơ bản, Fable 5 là phiên bản "phát hành rộng rãi" của Mythos 5, mang lại những cải tiến đáng kể về hiệu năng so với Claude Sonnet trong các trường hợp như xây dựng cấu trúc mã chính xác và hiểu sâu sắc nhu cầu của nhà phát triển.

Khả năng này đi kèm với một chi phí trực tiếp. Theo dữ liệu giá chính thức của Anthropic, giá đầu vào API của Fable 5 là 10 đô la cho mỗi triệu token, và giá đầu ra là 50 đô la. Để so sánh, Opus 4.8, cũng thuộc Anthropic, có giá lần lượt là 5 đô la và 25 đô la, trong khi Sonnet 4.6 là 3 đô la và 15 đô la. Giá đầu ra của Fable 5 cao gấp 3,3 lần so với Sonnet.

Quyền truy cập cũng bị hạn chế. Anthropic xác nhận rằng Fable 5 sẽ được bao gồm trong tất cả các gói đăng ký cho đến ngày 22 tháng 6; bắt đầu từ ngày 23 tháng 6, Fable 5 sẽ bị xóa khỏi các gói đăng ký và người dùng sẽ cần sử dụng tín dụng sử dụng để truy cập. Tuyên bố chính thức là "nó sẽ được khôi phục lại chức năng đăng ký tiêu chuẩn khi dung lượng cho phép", nhưng không có thời gian cụ thể nào được đưa ra.

Ethan Mollick, giáo sư tại Trường Wharton thuộc Đại học Pennsylvania, đã đăng tải một bài đánh giá độ sâu về Fable 5 trên blog oneusefulthing.org của mình. Ông viết: "Fable có giá gấp đôi Opus, và tốc độ tiêu thụ token cho thấy chi phí sản xuất sẽ 'rất cao'." Mollick từ lâu đã theo dõi sự phát triển khả năng của các mô hình AI, và nhận định này không đề cập đến chiến lược định giá mà là chi phí cơ sở hạ tầng để vận hành mô hình.

Tốc độ tiêu thụ token nhanh đến mức nào? Người dùng Reddit báo cáo rằng việc sử dụng Fable 5 với gói Claude Max 20x tiêu tốn khoảng 2% hạn mức tín dụng mỗi phút. Gói này có giá 200 đô la mỗi tháng; với tốc độ này, toàn bộ hạn mức tín dụng của tháng sẽ cạn kiệt trong chưa đầy một giờ sử dụng liên tục. Nhà phát triển Simon Willison trên Hacker News đã ghi lại mức sử dụng API hàng ngày của mình, tiêu tốn 82,92 đô la trong hạn mức tín dụng.

Chiến lược định giá và truy cập của Fable 5 gửi đi một tín hiệu rõ ràng: các khả năng được nâng cao của mô hình thế hệ tiếp theo được phản ánh trực tiếp vào hệ số giá. Thời gian "dùng thử miễn phí" của gói đăng ký chỉ đủ để người dùng hình thành thói quen sử dụng. Khi thời gian dùng thử kết thúc, người dùng có hai lựa chọn: trả phí API khó dự đoán hơn để tiếp tục sử dụng dịch vụ, hoặc quay lại gói dịch vụ trước đó.

Giá dao động từ 9 đến 120 đô la.

Mức giá của Fable 5 không phải là trường hợp cá biệt. Nhìn vào giá cả của các API mô hình phổ biến hiện có, có thể thấy rõ sự chênh lệch giá rất lớn.

Theo trang giá chính thức của Google, giá thành sản phẩm trả phí của Gemini 3.5 Flash là 9 đô la cho mỗi triệu token. Trang giá chính thức của OpenAI cho thấy giá sản phẩm của GPT-5.4 là 15 đô la, GPT-5.5 là 30 đô la và GPT-5.5 Pro là 120 đô la. Sản phẩm của Anthropic là Sonnet 4.6 là 15 đô la, Opus 4.8 là 25 đô la và Fable 5 là 50 đô la.

Từ 9 đô la cho Gemini 3.5 Flash đến 120 đô la cho GPT-5.5 Pro, chênh lệch giá vượt quá 13 lần. Đây không còn là sự phân biệt đơn giản giữa "cao cấp và giá rẻ" nữa. Các nhà sản xuất đang tích cực xây dựng cấu trúc ba tầng: tầng dưới cùng là mô hình cấp thấp với giá cực kỳ thấp, chịu trách nhiệm phổ biến và thu hút khách hàng; tầng giữa là mô hình hiệu năng cao với giá tầm trung, đáp ứng nhu cầu phát triển hàng ngày; và tầng trên cùng là mô hình suy luận mạnh mẽ nhưng đắt tiền nhất, nhắm đến người dùng trong các tình huống có tần suất sử dụng cao và giá trị cao.

Đằng sau hệ thống giá cả phân cấp là sự thể hiện rõ ràng các cấp độ năng lực. Anthropic sử dụng bốn cấp độ—Sonnet, Opus, Fable và Mythos—để phân loại khả năng của mô hình; OpenAI sử dụng các phiên bản Standard và Pro để phân biệt các thông số kỹ thuật khác nhau của sê-ri GPT-5; và Google sử dụng Flash và Pro để phân biệt vị trí của sê-ri Gemini 3. Những cấp độ này không còn chỉ là những định danh nội bộ mà được phản ánh trực tiếp trong giá cả.

Một thay đổi đáng chú ý hơn nữa liên quan đến quyền truy cập. Trên trang giá chính thức của Anthropic, Fable 5 được liệt kê là "đã bao gồm trong các gói đăng ký cho đến ngày 22 tháng 6", trong khi Opus 4.8 và Sonnet 4.6 không có các hạn chế về thời gian tương tự. Anthropic đang thử nghiệm một phương pháp phân cấp mới: thay vì gán các mô hình khác nhau cho các cấp độ đăng ký khác nhau dựa trên khả năng, họ đang tách trực tiếp các mô hình cấp cao nhất khỏi hệ thống đăng ký và thiết lập một kênh gọi API riêng biệt.

Lo lắng về những hóa đơn không thể kiểm soát.

Với giá 50 đô la cho mỗi triệu token, mức giá này không quá cao trong các kịch bản mua sắm của doanh nghiệp. Cửa sổ ngữ cảnh của Claude Fable chứa tối đa 1 triệu token, với đầu ra tối đa là 128.000 token; một nhiệm vụ phức tạp duy nhất có thể tiêu tốn hàng chục đến hàng trăm nghìn token. Là một mô hình suy luận, khả năng "suy nghĩ lâu hơn và tạo ra nhiều token hơn" của Fable 5 không phải là một lỗi thiết kế, mà là điểm mạnh của nó. Mô hình thực hiện nhiều bước suy luận trước khi đưa ra câu trả lời cuối cùng, mỗi bước đều phát sinh chi phí token.

Vấn đề là người dùng không thể kiểm soát mức tiêu thụ này. Một nhà phát triển sử dụng gói Max 20x đã tiêu tốn 2% hạn mức tín dụng mỗi phút, và Simon Willison đã tiêu thụ 82,92 đô la mỗi ngày. Những mức tiêu thụ này xảy ra trong "thời gian dùng thử" và nằm trong hạn mức tín dụng của gói. Sau ngày 22 tháng 6, việc sử dụng tương tự sẽ được chuyển đổi trực tiếp thành hóa đơn hoặc tín dụng API.

Xét về đơn vị tính toán, việc tiêu thụ token được xác định bởi những người thiết kế mô hình, và người dùng không có quyền kiểm soát "việc sử dụng". So sánh các truy vấn AI với mức tiêu thụ điện năng, mâu thuẫn cốt lõi nằm ở chỗ người dùng không thể chọn "chế độ tiết kiệm năng lượng" cũng như không thể dự đoán lượng "năng lượng" mà truy vấn tiếp theo sẽ tiêu thụ. Một bài viết thảo luận trong ngành được đăng trên LinkedIn đã tóm tắt hiện tượng này như đặc điểm cốt lõi của "thuế AI": "Thuế AI thực sự không chỉ là giá của mô hình, mà còn là tính không thể dự đoán được của nó."

Tính không thể dự đoán này ảnh hưởng đến các nhà phát triển cá nhân nhiều hơn so với các doanh nghiệp. Doanh nghiệp có thể ký kết các thỏa thuận số lượng lớn, đặt giới hạn ngân sách và chia sẻ chi phí trong đội ngũ. Đối với người dùng cá nhân đối diện API trả phí theo mức sử dụng, một phiên gỡ lỗi nghiêm túc duy nhất có thể tốn toàn bộ phí đăng ký hàng tháng. Một người dùng trên Hacker News nhận xét: "Định tuyến tiết kiệm chi phí đã từ một tính năng nên có trở thành một yêu cầu bắt buộc." "Định tuyến tiết kiệm chi phí" đề cập đến việc sử dụng mô hình rẻ hơn cho nhiệm vụ mặc định và chỉ gọi mô hình đắt hơn khi cần thiết. Trước Fable 5, đây là một chiến lược tối ưu hóa; giá cả và tỷ lệ tiêu thụ của Fable 5 đã biến chiến lược này thành một cấu hình cứng nhắc, nếu không sử dụng nó sẽ có nguy cơ chi tiêu quá mức.

Các API phổ biến cung cấp giao diện gọi cho các mô hình khác nhau, cho phép các nhà phát triển định nghĩa logic định tuyến riêng của họ. Tuy nhiên, điều này đòi hỏi người dùng phải có kỹ năng lập trình, hiểu sự khác biệt giữa các mô hình và sẵn sàng chấp nhận khả năng suy giảm chất lượng do sự xuống cấp của mô hình. Mỗi rào cản bổ sung sẽ khiến nhiều người bỏ cuộc.

Mức phí 200 đô la mỗi tháng không thể mua được vé trọn gói.

Hệ thống truy cập theo cấp bậc cũng đang thay đổi. Chiến lược của Claude Fable 5 là: trước ngày 22 tháng 6, tất cả người dùng trả phí đều có thể sử dụng; sau ngày 22 tháng 6, ngay cả người dùng Max 20x trả phí hàng tháng tối đa 200 đô la cũng không thể truy cập trực tiếp và cần phải gọi API thông qua tín dụng sử dụng.

Ngược lại, chiến lược quyền truy cập của OpenAI lại có cách tiếp cận khác. Theo trang giá chính thức của ChatGPT, ChatGPT Pro cung cấp hai gói: 100 đô la và 200 đô la, cả hai đều cho phép truy cập vào GPT-5 Pro. Khả năng của mô hình ở các gói cao hơn tương ứng với các cấp độ đăng ký cao hơn, nhưng bản thân gói đăng ký vẫn là một gói truy cập đầy đủ.

Sự khác biệt giữa hai chiến lược không chỉ nằm ở giá cả. Mô hình của OpenAI đặt ra rào cản về phí đăng ký: những người có khả năng chi trả 200 đô la mỗi tháng có thể sử dụng các mô hình tốt nhất. Chiến lược của Anthropic đối với Fable 5 đặt ra rào cản ở hai khía cạnh: chi phí (API trả theo mức sử dụng) và rào cản kỹ thuật (yêu cầu khả năng truy cập API). Trong các cuộc thảo luận của người dùng trên Hacker News, một số người gọi chiến lược này là "chiến lược dùng thử miễn phí, sau đó tăng giá khi bạn đã nghiện", trong khi những người khác cho rằng đó có nhiều khả năng là vấn đề thực sự với Chuỗi cung ứng tỷ lệ băm , khi Anthropic hiện không thể trang trải chi phí suy luận của Fable 5 với mô hình đăng ký giá cố định.

Bất kể động cơ là gì, hiệu quả rất rõ ràng: gói đăng ký đã trở thành "vé vào cửa", chứ không phải "thẻ trọn gói". Khả năng của các mô hình cao cấp không được bao gồm trong giá vé. TechCrunch, trong bài viết về sự ra mắt của Fable 5, đã lưu ý rằng Fable 5 là "mô hình cấp độ Mythos đầu tiên được phát hành rộng rãi". Trước Fable 5, các mô hình cấp độ Mythos chỉ dành riêng cho các đối tác của Project Glasswing. Giờ đây, rào cản gia nhập đã được hạ thấp, nhưng chưa biến mất hoàn toàn.

Người dùng đi đường vòng

Việc phân quyền truy cập theo cấp bậc đã dẫn đến những thay đổi đáng chú ý trong hành vi người dùng. Một số người dùng đã bắt đầu tìm cách để vượt qua các kênh chính thức.

Một cách tiếp cận liên quan đến việc sử dụng các dịch vụ tổng hợp của bên thứ ba để kích hoạt mô hình. Những "trung gian" này cung cấp token với giá thấp hơn giá niêm yết chính thức, thường được lấy từ hạn ngạch nhàn rỗi được các doanh nghiệp mua số lượng lớn, cơ hội kinh doanh chênh lệch giá giữa các khu vực khác nhau hoặc các kênh không được tiết lộ. Mặc dù giá thấp hơn, nhưng việc bảo vệ quyền riêng tư và tính ổn định không được đảm bảo. Các cuộc thảo luận liên quan tiếp tục leo thang trên các nền tảng như Zhihu, với mối quan tâm thực sự của người dùng không phải là liệu "token giá rẻ có sử dụng được hay không", mà là "ai sẽ xử lý dữ liệu".

Một cách tiếp cận khác là chuyển sang các giải pháp mã nguồn mở hoặc có chi phí thấp hơn. Một số nhà phát triển đã chia sẻ các hướng dẫn minh họa cách tích hợp các mô hình như DeepSeek vào các công cụ phát triển khác nhau, bỏ qua quy trình định giá và xác minh chính thức . Mặc dù điều này có thể dẫn đến một số mất mát về khả năng và tăng rủi ro quyền riêng tư, nhưng nó giúp kiểm soát chi phí tốt hơn đáng kể.

Trong các cuộc thảo luận của nhà phát triển trên Hacker News và Reddit, phương pháp kết hợp thường được đề cập: "Sử dụng mô hình rẻ hơn theo mặc định, chỉ chuyển sang Fable trong các bước quan trọng." Điều này nghe có vẻ là một cách tối ưu hóa tài nguyên hợp lý. Nhìn lại các cuộc thảo luận về "dân chủ hóa AI" hai hoặc ba năm trước, quan điểm chủ đạo là mọi người nên có quyền truy cập bình đẳng vào các mô hình tốt nhất. Giờ đây, "sử dụng các mô hình tốt nhất" đã trở thành một điều đòi hỏi sự tính toán cẩn thận.

Triển khai cục bộ mang đến một góc nhìn khác. Một GPU có khả năng chạy mượt mà các mô hình lớn rất đắt tiền, và một hệ thống hoàn chỉnh có khả năng chạy các mô hình 120-bit nằm ngoài khả năng của hầu hết các nhà phát triển cá nhân. Rào cản đối với triển khai cục bộ là một hình thức "tường phí" khác, chỉ khác là lần này nó sử dụng việc mua sắm phần cứng thay vì thanh toán theo từng lần sử dụng.

Những đường vòng này không phải là "mẹo tiết kiệm tiền thông minh cho người dùng". Khi lượng lớn người dùng chủ động tìm kiếm các lựa chọn thay thế, đó là vì các con đường ban đầu đang bị thu hẹp. Rủi ro quyền riêng tư tại các điểm trung chuyển, những lỗ hổng trong khả năng của các mô hình mã nguồn mở và đầu tư phần cứng cho việc triển khai cục bộ—mỗi đường vòng đều có cái giá của nó.

Những bậc thang đã ở ngay dưới chân tôi rồi.

Nếu so sánh trí tuệ nhân tạo (AI) với cơ sở hạ tầng tiện ích công cộng như nước và điện, thì nguyên tắc đầu tiên của các tiện ích công cộng là dịch vụ phổ cập và tiếp cận công bằng. Tuy nhiên, xu hướng định giá các mô hình AI lại đang đi ngược lại. Mô hình càng mạnh, giá càng cao; các mô hình hàng đầu đang dần loại bỏ hình thức đăng ký phổ cập, và việc lập hóa đơn dựa trên mã thông báo khiến chi phí trở nên khó dự đoán. Trong khi nguồn cung cấp điện không chỉ đơn giản là cung cấp "dòng điện mạnh hơn" cho người dùng trả nhiều tiền hơn, thì AI lại đang làm chính điều đó.

Đây không phải là cuộc tranh luận về giá cả "đắt hay rẻ". Khi các mô hình cao cấp như Claude Fable bị loại bỏ khỏi các gói đăng ký đại trà, khi giá thành sản phẩm của GPT-5.5 Pro cao gấp 13 lần so với các mô hình Flash, và khi một nhà phát triển cá nhân có thể tiêu hết 82 đô la mỗi ngày, thì "sự không đủ khả năng chi trả" đang chuyển từ vấn đề giá cả thành vấn đề cấu trúc.

Trong lĩnh vực sử dụng công cụ AI, một hệ thống phân cấp rõ ràng đang nổi lên. Ở vị trí cao nhất là người dùng doanh nghiệp, những người có khả năng chi trả cho các cuộc gọi API không giới hạn và phần cứng chuyên dụng; ở giữa là các nhà phát triển cá nhân sử dụng các mô hình cao cấp với ngân sách được tính toán kỹ lưỡng; và ở dưới cùng là người dùng thông thường, những người chỉ có thể sử dụng các mô hình miễn phí hoặc giá rẻ. Mỗi cấp bậc trong hệ thống phân cấp này không được xác định bởi kỹ năng kỹ thuật, mà bởi khả năng chi trả và khả năng tiếp cận công nghệ.

Hạn chót ngày 22 tháng 6 cho Anthropic chỉ là bước tiếp theo trên nấc thang này, chứ không phải bước đầu tiên, và cũng sẽ không phải là bước cuối cùng.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
61
Thêm vào Yêu thích
11
Bình luận