Làm thế nào các mô hình AI của Trung Quốc có thể "xuất khẩu" điện năng bằng cách sử dụng token?

avatar
Bitpush
02-26
Bài viết này được dịch máy
Xem bản gốc

Tác giả: Black Lobster, TechFlow TechFlow

Tựa gốc: Token mở rộng ra nước ngoài, bán điện Trung Quốc cho thế giới.


Mùa hè năm 1858, một sợi cáp lõi đồng đã vượt qua Đại Tây Dương, nối liền Luân Đôn và New York.

Ý nghĩa của sự kiện này không nằm ở tốc độ truyền tải, mà ở cấu trúc quyền lực. Bất cứ ai đặt cáp ngầm dưới biển đều có thể thu lợi từ dòng chảy thông tin. Đế quốc Anh, thông qua mạng lưới điện báo toàn cầu này, nắm giữ thông tin tình báo của các thuộc địa, giá cả bông vải và tin tức chiến tranh.

Sức mạnh của đế chế không chỉ nằm ở hạm đội mà còn ở sợi cáp đó.

Hơn 160 năm sau, logic này đang được lặp lại theo một cách không ngờ tới.

Năm 2026, các mô hình quy mô lớn của Trung Quốc đang âm thầm chiếm lĩnh thị trường nhà phát triển toàn cầu. Dữ liệu mới nhất từ ​​OpenRouter cho thấy các mô hình Trung Quốc chiếm 61% lượng tiêu thụ token của top 10 mô hình trên nền tảng này, với ba mô hình hàng đầu đều đến từ Trung Quốc. Các yêu cầu API được gửi hàng ngày bởi các nhà phát triển ở San Francisco, Berlin và Singapore đang được truyền qua Thái Bình Dương bằng cáp quang ngầm dưới biển đến các trung tâm dữ liệu ở Trung Quốc, nơi tỷ lệ băm được tiêu thụ, điện năng được truyền tải và kết quả được truyền trở lại.

Điện năng không bao giờ rời khỏi lưới điện Trung Quốc, nhưng giá trị của nó được chuyển giao xuyên biên giới thông qua các mã thông báo.

Cuộc di cư vĩ đại của các mô hình AI

Vào ngày 24 tháng 2 năm 2026, OpenRouter đã công bố dữ liệu hàng tuần: tổng lượng token tiêu thụ của mười mô hình hàng đầu trên nền tảng này đạt khoảng 8,7 nghìn tỷ, trong đó các mô hình của Trung Quốc chiếm 5,3 nghìn tỷ, chiếm tỷ lệ 61%. MiniMax M2.5 ra mắt ở vị trí dẫn đầu với 2,45 nghìn tỷ token, tiếp theo là Kimi K2.5 và Zhipu GLM-5. Cả ba mô hình dẫn đầu đều đến từ Trung Quốc.

Dữ liệu mới nhất tính đến ngày 26 tháng 2.

Đây không phải là sự trùng hợp ngẫu nhiên; chỉ một tia lửa nhỏ đã châm ngòi cho tất cả.

Đầu năm nay, OpenClaw xuất hiện, một công cụ mã nguồn mở thực sự cho phép trí tuệ nhân tạo "làm việc". Nó có thể điều khiển trực tiếp máy tính, thực thi các lệnh và hoàn thành các quy trình công việc phức tạp song song. Chỉ trong vài tuần, số lượt đánh dấu sao trên GitHub của nó đã vượt quá 210.000.

John, một người hành nghề tài chính, ngay lập tức cài đặt OpenClaw và kết nối với API của Anthropic để tự động theo dõi thông tin thị trường chứng khoán và cung cấp tín hiệu giao dịch kịp thời. Vài giờ sau, anh nhìn vào số dư tài khoản của mình trong vài giây và sững sờ: hàng chục đô la đã biến mất.

Đây là thực tế mới do OpenClaw mang lại. Trước đây, việc trò chuyện với AI tiêu tốn hàng nghìn token cho mỗi cuộc hội thoại, với chi phí không đáng kể. Sau khi tích hợp OpenClaw, AI chạy đồng thời hơn chục nhiệm vụ trong nền, liên tục gọi ngữ cảnh và lặp lại trong các vòng lặp. Mức tiêu thụ token không phải là tuyến tính mà là theo cấp số nhân. Hóa đơn giống như một chiếc xe đang tăng tốc mà không có nắp capo, kim xăng tụt xuống và nó cứ thế không ngừng lại.

Một thủ thuật thông minh nhanh chóng xuất hiện trong cộng đồng nhà phát triển: sử dụng mã thông báo OAuth để kết nối trực tiếp tài khoản đăng ký Anthropic hoặc Google với OpenClaw, biến số tiền "không giới hạn" hàng tháng thành nhiên liệu miễn phí cho AI Agent. Đây là phương pháp được nhiều nhà phát triển áp dụng.

Các biện pháp đối phó chính thức đã được thực hiện ngay lập tức.

Vào ngày 19 tháng 2, Anthropic đã cập nhật thỏa thuận của mình, nghiêm cấm việc sử dụng thông tin đăng nhập đăng ký Claude cho các công cụ của bên thứ ba như OpenClaw. Việc truy cập các tính năng của Claude giờ đây phải thông qua kênh thanh toán API. Google cũng đã giảm đáng kể số lượng tài khoản đăng ký truy cập Antigravity và Gemini AI Ultra thông qua OpenClaw.

"Người dân đã phải chịu khổ dưới thời nhà Tần quá lâu rồi," Jhon sau đó chuyển sang giới thiệu các mô hình quy mô lớn được sản xuất trong nước.

Trên OpenRouter, mô hình quy mô lớn do trong nước phát triển MiniMax M2.5 đạt 80,2% điểm trong nhiệm vụ kỹ thuật phần mềm, trong khi Claude Opus 4.6 đạt 80,8%, chênh lệch không đáng kể. Tuy nhiên, giá của chúng lại khác nhau rất nhiều: MiniMax M2.5 có giá 0,3 đô la cho mỗi triệu token đầu vào, trong khi Claude Opus 4.6 có giá 5 đô la, chênh lệch khoảng 17 lần.

John đã chuyển đổi, quy trình làm việc tiếp tục diễn ra và hóa đơn giảm đi một bậc. Sự chuyển đổi này đang diễn ra đồng thời trên toàn thế giới.

Chris Clark, Giám đốc điều hành của OpenRouter, đã nói thẳng thừng: lý do các mô hình mã nguồn mở của Trung Quốc có thể chiếm được thị thị phần lượng lớn là vì chúng chiếm tỷ lệ tỷ lệ rất cao trong các quy trình làm việc proxy được các nhà phát triển Mỹ sử dụng.

Điện năng mở rộng ra nước ngoài

Để hiểu được bản chất của việc token mở rộng ra nước ngoài, trước tiên người ta phải hiểu cấu trúc chi phí của token đó.

Thoạt nhìn có vẻ đơn giản; một token tương đương khoảng 0,75 từ tiếng Anh, và một cuộc hội thoại điển hình với AI chỉ tiêu tốn vài nghìn token. Nhưng khi số lượng token này lên đến hàng nghìn tỷ, thực tế vật lý ẩn chứa bên trong trở nên vô cùng phức tạp.

Phân tích chi phí của một token, chỉ có hai thành phần cốt lõi: tỷ lệ băm và điện năng.

Tỷ lệ băm là khấu hao và phân bổ chi phí của GPU. Nếu bạn mua một chiếc Nvidia H100 với giá khoảng 30.000 đô la, thì tuổi thọ của nó, được tính toán trên mỗi lần lặp suy luận, chính là chi phí khấu hao. Điện năng là nhiên liệu giúp các trung tâm dữ liệu hoạt động. Mỗi GPU tiêu thụ khoảng 700 watt ở công suất tối đa. Cộng thêm chi phí của hệ thống làm mát, hóa đơn tiền điện cho một trung tâm dữ liệu AI lớn có thể dễ dàng vượt quá hàng trăm triệu đô la mỗi năm.

Bây giờ, hãy vẽ quá trình vật lý này lên bản đồ.

Một nhà phát triển người Mỹ ở San Francisco gửi yêu cầu API. Dữ liệu được truyền từ California, thông qua cáp quang ngầm dưới biển Thái Bình Dương, đến một trung tâm dữ liệu ở Trung Quốc. Cụm GPU bắt đầu hoạt động, điện được truyền từ lưới điện Trung Quốc đến các chip, quá trình suy luận hoàn tất và kết quả được gửi trở lại. Toàn bộ quá trình có thể chỉ mất một hoặc hai giây.

Điện chưa bao giờ rời khỏi lưới điện của Trung Quốc, nhưng giá trị của điện năng đã được chuyển giao xuyên biên giới thông qua các mã thông báo.

Điều đáng chú ý mà thương mại thông thường không thể đạt được nằm ở chỗ: các mã thông báo không có hình thức vật lý, không phải qua hải quan, không chịu thuế quan và thậm chí không được đưa vào bất kỳ số liệu thống kê thương mại hiện hành nào. Trung Quốc xuất khẩu lượng lớn tỷ lệ băm và dịch vụ điện, nhưng chúng hầu như không xuất hiện trong dữ liệu thương mại hàng hóa chính thức .

Các token đã trở thành phái sinh của điện năng, và mở rộng ra nước ngoài về cơ bản chính là mở rộng ra nước ngoài.

Điều này cũng nhờ vào giá điện tương đối thấp ở Trung Quốc, thấp hơn khoảng 40% so với ở Hoa Kỳ. Đây là sự khác biệt về chi phí ở cấp độ vật chất mà các đối thủ cạnh tranh có thể dễ dàng sao chép.

Ngoài ra, các mô hình AI quy mô lớn của Trung Quốc cũng có ưu thế về thuật toán và "sự thoái hóa".

Kiến trúc MoE của DeepSeek V3 chỉ cho phép một tập hợp con các tham số được kích hoạt trong quá trình suy luận. Các thử nghiệm độc lập cho thấy chi phí suy luận của nó thấp hơn khoảng 36 lần so với GPT-40. MiniMax M2.5 cũng có tổng cộng 229 tỷ tham số, nhưng chỉ có 10 tỷ được kích hoạt.

Ở cấp độ cao nhất, thị trường đang dần suy thoái, với hơn chục công ty như Alibaba, ByteDance, Baidu, Tencent, Lunar Dark Side, Zhipu và MiniMax đang chen chúc nhau trên cùng một con đường. Giá cả từ lâu đã giảm xuống dưới mức lợi nhuận hợp lý, và việc thua lỗ để thu hút sự chú ý đã trở thành chuyện thường tình trong ngành.

Khi xem xét kỹ hơn, điều này tương tự như sáng kiến ​​"Sản xuất tại Trung Quốc" đang vươn ra mở rộng ra nước ngoài, tận dụng lợi thế Chuỗi cung ứng và cạnh tranh trong ngành để đẩy giá token xuống.

Từ Bitcoin đến Token

Trước khi có mã thông báo này, đã có một trường hợp khác về việc điện năng mở rộng ra nước ngoài.

Khoảng năm 2015, các nhà quản lý nhà máy điện ở Tứ Xuyên, Vân Nam và Tân Cương bắt đầu đón tiếp một nhóm khách lạ.

Những người này thuê các nhà máy bỏ hoang, chất đầy máy móc vào đó và cho chúng hoạt động 24 giờ một ngày. Máy móc không sản xuất ra bất cứ thứ gì; chúng chỉ liên tục thực hiện một phép toán, và thỉnh thoảng, từ phép toán bất tận này, chúng sẽ tính ra được một Bitcoin.

Đây là thế hệ mở rộng ra nước ngoài điện năng đầu tiên: thủy điện và điện gió giá rẻ được chuyển đổi thành tài sản kỹ thuật số lưu thông toàn cầu thông qua các phép tính băm của máy khai thác, sau đó được chuyển đổi thành đô la Mỹ trên sàn giao dịch.

Điện năng không vượt qua bất kỳ biên giới nào, nhưng giá trị của nó, được thể hiện bằng Bitcoin, lại lưu chuyển trên thị trường toàn cầu.

Trong những năm đó, tỷ lệ băm của Trung Quốc từng chiếm hơn 70% tổng tỷ lệ băm khai thác Bitcoin toàn cầu. Thủy điện và điện than của Trung Quốc, bằng cách gián tiếp như vậy, đã tham gia vào quá trình phân phối lại vốn toàn cầu.

Năm 2021, tất cả những điều này đã kết thúc đột ngột. Các biện pháp quản lý được áp dụng, thợ đào tản mát, và tỷ lệ băm chuyển sang Kazakhstan, Texas ở Hoa Kỳ và Canada.

Nhưng bản thân logic này chưa bao giờ biến mất; nó chỉ đang chờ một lớp vỏ mới. Cho đến khi ChatGPT xuất hiện, các mô hình quy mô lớn cạnh tranh khốc liệt, và các trang trại khai thác Bitcoin trước đây được chuyển đổi thành các trung tâm dữ liệu AI. Máy khai thác trở thành GPU tỷ lệ băm, và Bitcoin được tạo ra trở thành token. Thứ duy nhất không thay đổi là điện năng.

Mở rộng ra nước ngoài mở rộng ra nước ngoài thị trường quốc tế Bitcoin và của các token có logic cơ bản tương đồng, nhưng hiện tại các token có giá trị thương mại lớn hơn.

khai thác là một phép tính toán học thuần túy, và Bitcoin được tạo ra là một tài sản tài chính. Giá trị của nó đến từ sự khan hiếm và sự đồng thuận của thị trường, và không liên quan gì đến "những gì đang được tính toán". Bản thân tỷ lệ băm không mang tính sản xuất; nó giống như một sản phẩm phụ của cơ chế tin tưởng hơn.

Suy luận mô hình quy mô lớn thì khác. GPU tiêu thụ điện năng nhưng tạo ra các dịch vụ nhận thức thực sự: mã hóa, phân tích, dịch thuật và sáng tạo. Giá trị của một token đến trực tiếp từ tiện ích của nó đối với người dùng. Đây là một sự nhúng sâu hơn, và một khi quy trình làm việc của nhà phát triển phụ thuộc vào một mô hình cụ thể, chi phí chuyển đổi sẽ tăng lên theo thời gian.

Dĩ nhiên, còn một điểm khác biệt quan trọng nữa: khai thác Bitcoin bị đẩy ra khỏi Trung Quốc, trong khi mở rộng ra nước ngoài là một lựa chọn được thực hiện chủ động bởi các nhà phát triển toàn cầu.

Cuộc chiến token

Tuyến cáp ngầm được đặt vào năm 1858 tượng trưng cho chủ quyền của Đế quốc Anh đối với xa lộ thông tin; bất cứ ai sở hữu cơ sở hạ tầng đều có thể định đoạt luật chơi.

Mở rộng ra nước ngoài với token cũng là một cuộc chiến không lời, và nó phải đối mặt với vô số trở ngại.

Chủ quyền dữ liệu là rào cản đầu tiên. Một yêu cầu API từ nhà phát triển người Mỹ được xử lý thông qua trung tâm dữ liệu của Trung Quốc, có nghĩa là dữ liệu về mặt vật lý sẽ di chuyển qua Trung Quốc. Điều này không phải là vấn đề đối với các nhà phát triển cá nhân và các ứng dụng nhỏ, nhưng nó là một lỗ hổng lớn khi liên quan đến dữ liệu doanh nghiệp nhạy cảm, thông tin tài chính hoặc việc tuân thủ quy định của chính phủ. Đó là lý do tại sao mô hình Trung Quốc có tỷ lệ thâm nhập cao nhất trong các công cụ phát triển và ứng dụng cá nhân, nhưng hầu như không tồn tại trong các hệ thống doanh nghiệp cốt lõi.

Lệnh cấm chip là rào cản thứ hai. Sự phát triển trí tuệ nhân tạo của Trung Quốc đang phải đối mặt với các biện pháp kiểm soát xuất khẩu đối với GPU cao cấp của Nvidia. Việc tối ưu hóa kiến ​​trúc và thuật toán của Bộ Giáo dục chỉ có thể bù đắp một phần bất lợi này, và giới hạn vẫn còn tồn tại.

Nhưng những trở ngại hiện tại chỉ là sự khởi đầu; một chiến trường lớn hơn đang dần hình thành.

Các token và mô hình AI đã trở thành một khía cạnh mới của cuộc cạnh tranh chiến lược giữa Trung Quốc và Hoa Kỳ, không kém phần quan trọng so với các cuộc cạnh tranh về chất bán dẫn và internet của thế kỷ 20, và thậm chí còn gần gũi hơn với một phép ẩn dụ lâu đời hơn: cuộc chạy đua vào không gian.

Năm 1957, Liên Xô phóng vệ tinh Sputnik 1, gây chấn động Hoa Kỳ. Sau đó, Mỹ khởi động chương trình Apollo, đầu tư nguồn lực tương đương hàng trăm tỷ đô la ngày nay, quyết tâm không để thua trong cuộc đua vũ trụ.

Logic đằng sau cuộc chạy đua trí tuệ nhân tạo (AI) rất giống với cuộc chạy đua vũ trụ, nhưng cường độ của nó sẽ vượt xa cuộc chạy đua không gian. Không gian, xét cho cùng, là một không gian vật lý, vô hình đối với người bình thường; tuy nhiên, AI len lỏi vào mọi ngóc ngách của nền kinh tế. Đằng sau mỗi dòng mã, mỗi hợp đồng và mỗi hệ thống ra quyết định của chính phủ, có thể có một mô hình quy mô lớn đang hoạt động cho một quốc gia cụ thể. Mô hình nào trở thành lựa chọn cơ sở hạ tầng mặc định cho các nhà phát triển toàn cầu sẽ ngầm giành được ảnh hưởng mang tính cấu trúc đối với nền kinh tế kỹ thuật số toàn cầu.

Đây chính là điều khiến Washington thực sự lo ngại về mở rộng ra nước ngoài.

Khi mã nguồn của nhà phát triển, quy trình làm việc của nhân viên hỗ trợ và logic sản phẩm đều được xây dựng dựa trên API theo mô hình cụ thể của Trung Quốc, chi phí chuyển đổi sẽ tăng theo cấp số nhân theo thời gian. Đến lúc đó, ngay cả khi Mỹ ban hành luật hạn chế, các nhà phát triển cũng sẽ phản đối kịch liệt, giống như hiện nay không lập trình viên nào có thể từ bỏ GitHub.

Việc token này mở rộng ra nước ngoài ngày hôm nay có thể chỉ là khởi đầu của một cuộc chơi dài hơi. Các ông lớn Trung Quốc không tuyên bố đang làm Sự lật đổ bất cứ điều gì; họ chỉ đơn giản là cung cấp dịch vụ cho mọi nhà phát triển trên toàn thế giới với một Key API với giá thấp hơn.

Lần này, việc lắp đặt cáp được thực hiện bởi đội ngũ kỹ sư viết mã ở Hàng Châu, Bắc Kinh và Thượng Hải, cùng với một cụm GPU hoạt động ngày đêm tại một tỉnh phía nam.

Trận chiến này không có đồng hồ đếm ngược; nó diễn ra 24 giờ một ngày, đơn vị là các token, và chiến trường là thiết bị đầu cuối của mỗi nhà phát triển.


Twitter: https://twitter.com/BitpushNewsCN

Nhóm cộng đồng BitPush trên Telegram: https://t.me/BitPushCommunity

Đăng ký theo dõi Bitpush trên Telegram: https://t.me/bitpush

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận