Tác giả: Lạc Nhất Hàng

Vào tháng 1 năm 2009, một cá nhân nặc danh đã phát minh ra thứ gọi là "token". Bạn đóng góp tỷ lệ băm để nhận được token, chúng được lưu thông, định giá và giao dịch trong một mạng lưới đồng thuận. Toàn bộ nền kinh tế crypto ra đời từ điều này. Hơn một thập kỷ sau, người ta vẫn đang tranh luận liệu những token này thực sự có giá trị hay không.
Tháng 3 năm 2025, một người đàn ông mặc áo khoác da đã định nghĩa lại khái niệm gọi là token. Bạn đầu tư tỷ lệ băm, tạo ra token, và những token đó ngay lập tức được sử dụng trong quá trình suy luận và lý luận của trí tuệ nhân tạo: suy nghĩ, lý luận, viết mã, đưa ra quyết định. Toàn bộ nền kinh tế AI do đó được đẩy nhanh. Không ai tranh cãi về giá trị của những token này, bởi vì bạn vừa sử dụng hàng triệu token sáng nay.
Hai token, cùng tên, cùng cấu trúc cơ bản: tỷ lệ băm được đưa vào, và kết quả là những thứ có giá trị.

Tháng 3 năm 2026, tôi ngồi tại địa điểm tổ chức NVIDIA GTC và lắng nghe bài phát biểu quan trọng của Jensen Huang, bài phát biểu hầu như không hề đề cập đến việc quảng bá sản phẩm. Đúng vậy, ông ấy đã công bố Vera Rubin, một sản phẩm kết hợp CPU và GPU. Nhưng lần , ông ấy không nói về thông số kỹ thuật của chip hay quy trình sản xuất; ông ấy nói về toàn bộ nền kinh tế của việc sản xuất, định giá và tiêu thụ token:
Mẫu nào tương ứng với tốc độ token nào? Tốc độ token nào tương ứng với mức giá nào? Và mức giá nào yêu cầu phần cứng cấp độ nào để hỗ trợ?
Ông thậm chí còn giúp các CEO và những người ra quyết định trong khán giả, những người nắm giữ ngân sách của công ty, lập kế hoạch phân bổ tỷ lệ băm cho trung tâm dữ liệu : 25% cho gói miễn phí, 25% cho gói tầm trung, 25% cho gói cao cấp và 25% cho gói siêu cao cấp.
Đúng vậy, lần ông ấy không bán cụ thể dòng GPU nào, giống như cách ông ấy đã làm với Blackwell hai năm trước. Nhưng lần, ông ấy đang bán một thứ lớn hơn. Sau hai giờ, tôi nghĩ điều duy nhất ông ấy thực sự muốn nói là: "Chào mừng bạn đến với việc sử dụng token, và chỉ có nhà máy của Nvidia mới có thể sản xuất chúng."
Vào lúc đó, tôi nhận ra rằng người đàn ông này và người nặc danh đã khai thác token đầu tiên cách đây 17 năm đang làm chính xác cùng một việc về mặt cấu trúc.
Cùng một bộ quy tắc chuyển đổi
Tác giả nặc danh , sử dụng bút danh " Satoshi Nakamoto ", đã viết một Sách trắng chín trang vào năm 2008, nêu ra một bộ quy tắc: đầu tư tỷ lệ băm, hoàn thành bằng chứng toán học (Proof of Work), và nhận token tiền điện tử làm phần thưởng.
Sự tài tình của quy tắc này nằm ở chỗ nó không yêu cầu bất cứ ai phải tin tưởng ai khác—miễn là bạn chấp nhận những quy tắc này, bạn tự động trở thành một người tham gia vào nền kinh tế này. Quy tắc này đúng đắn, xét cho cùng, nó tập hợp rất nhiều kẻ phản bội lại với nhau.
Trên sân khấu GTC 2026, Jensen Huang đã làm điều tương tự về mặt cấu trúc.
Ông trình bày một biểu đồ minh họa mối quan hệ và sự căng thẳng giữa hiệu quả suy luận và mức tiêu thụ token: trục Y biểu thị thông lượng (số lượng token được tạo ra trên mỗi megawatt điện năng tiêu thụ), và trục X biểu thị khả năng tương tác (tốc độ token mà mỗi người dùng cảm nhận được). Sau đó, ông ghi nhãn năm mức giá bên dưới trục X: Miễn phí sử dụng Qwen 3, 0 đô la/triệu token; Trung bình sử dụng Kimi K2.5, 3 đô la/triệu token; Cao cấp sử dụng GPT MoE, 6 đô la/triệu token; Cao cấp nhất sử dụng GPT MoE 400K ngữ cảnh, 45 đô la/triệu token; và Siêu cao cấp, 150 đô la/triệu token.
Hình ảnh này gần như có thể được dùng làm ảnh bìa cho Sách trắng của Jensen Huang về "kinh tế học token".

Satoshi Nakamoto đã định nghĩa "điều gì tạo nên tính toán có giá trị" - việc đạt được sự xung đột hàm băm SHA-256 là có giá trị. Jensen Huang đã định nghĩa "điều gì tạo nên suy luận có giá trị" - việc tạo ra các token với tốc độ cụ thể cho một kịch bản cụ thể, có tính đến các ràng buộc về mức tiêu thụ năng lượng, là có giá trị.
Cả Satoshi Nakamoto lẫn Jensen Huang đều không trực tiếp sản xuất token; họ chỉ định ra các quy tắc sản xuất token và cơ chế định giá.
Một câu mà Lão Hoàng nói trên sân khấu gần như có thể được viết trực tiếp vào phần tóm tắt của Sách trắng về kinh tế token—
Token là loại hàng hóa mới, và giống như tất cả các loại hàng hóa khác, một khi đạt đến điểm uốn, một khi trở nên trưởng thành, nó sẽ phân chia thành nhiều phần khác nhau.
Token là loại hàng hóa mới. Hàng hóa sẽ tự nhiên phân tầng khi chúng trưởng thành. Ông ấy không mô tả tình hình hiện tại; ông ấy đang dự đoán cấu trúc thị trường và sau đó định vị chính xác dòng sản phẩm phần cứng của mình trên từng tầng của cấu trúc đó.
Quá trình sản xuất của hai loại token này thậm chí còn có sự đối xứng về mặt ngữ nghĩa: khai thác được gọi là khai thác, và suy luận được gọi là suy diễn.
Bản chất của cả khai thác và suy luận đều là biến điện năng thành tiền. Thợ đào sử dụng điện để khai thác tiền điện tử rồi bán chúng; các mô hình suy luận và tác nhân AI sử dụng điện để tạo ra các token AI rồi bán cho các nhà phát triển với giá hàng triệu đô la. Các khâu trung gian khác nhau, nhưng hai đầu ra thì giống nhau: bên trái là đồng hồ điện, và bên phải là thu nhập.
Hai cách viết về sự khan hiếm
Quyết định thiết kế quan trọng nhất của Satoshi Nakamoto không phải là cơ chế Proof of Work, mà là giới hạn 21 triệu Bitcoin. Ông đã tạo ra sự khan hiếm nhân tạo thông qua mã lập trình—cho dù có bao nhiêu máy khai thác đổ vào đi chăng nữa, tổng số Bitcoin sẽ không bao giờ vượt quá 21 triệu. Sự khan hiếm này chính là giá trị cốt lõi của toàn bộ nền kinh tế crypto.
Tuy nhiên, Huang Renxun đã sử dụng các định luật vật lý để tạo ra sự khan hiếm tự nhiên. Ông nói:
"Bạn vẫn phải xây dựng một trung tâm dữ liệu công suất gigawatt. Bạn vẫn phải xây dựng một nhà máy công suất gigawatt, và nhà máy gigawatt đó, nếu khấu hao trong 15 năm... sẽ có giá khoảng 40 tỷ đô la ngay cả khi bạn không đưa gì vào đó. Là 40 tỷ đô la. Bạn tốt hơn hết nên chắc chắn rằng mình lắp đặt hệ thống máy tính tốt nhất vào đó để có được chi phí token thấp nhất."
Một trung tâm dữ liệu 1GW sẽ không bao giờ trở thành 2GW. Đây không phải là giới hạn của phần mềm; mà là một định luật vật lý.
Đất đai, điện năng, khả năng tản nhiệt—mỗi thứ đều có giới hạn vật lý. Số lượng token mà nhà máy bạn xây dựng với chi phí 40 tỷ đô la có thể sản xuất trong suốt vòng đời 15 năm phụ thuộc hoàn toàn vào kiến trúc máy tính bạn trang bị bên trong.

Khái niệm khan hiếm của Satoshi Nakamoto có thể được phân nhánh. Nếu bạn không thích giới hạn 21 triệu coin, hãy phân nhánh một Chuỗi mới, thay đổi giới hạn thành 200 triệu coin, đặt tên là ETH hoặc bất cứ tên nào bạn muốn, và phát hành Sách trắng) cùng lúc. Và thực tế đã có người làm điều này, và họ rất thích thú với nó.
Sự khan hiếm do Lão Hoàng tạo ra không thể chia nhỏ. Xét cho cùng, bạn không thể chia nhỏ định luật thứ hai của nhiệt động lực học, bạn không thể chia nhỏ công suất lưới điện của một thành phố, và bạn cũng không thể chia nhỏ diện tích vật lý của một mảnh đất.
Nhưng dù là Satoshi Nakamoto hay Jensen Huang, sự khan hiếm mà họ tạo ra đều dẫn đến cùng một kết quả: một cuộc chạy đua vũ trang phần cứng.
Lịch sử khai thác là: CPU → GPU → FPGA → ASIC. Mỗi thế hệ phần cứng chuyên dụng đều làm cho thế hệ trước trở nên lỗi thời. Lịch sử huấn luyện và suy luận AI cũng đang lặp lại: Hopper → Blackwell → Vera Rubin → Groq LPU. Phần cứng đa năng ra đời, sau đó phần cứng chuyên dụng trở thành tiêu chuẩn. Nvidia đã giới thiệu Groq LPU tại GTC năm nay, một bộ xử lý dữ liệu xác định được phát hành sau khi mua lại Groq. Biên dịch tĩnh, lập lịch trình biên dịch, không có lập lịch trình động, 500MB SRAM trên chip—triết lý kiến trúc của nó giống như một ASIC dành cho suy luận. Nó chỉ làm một việc duy nhất, nhưng làm đến mức tối đa.
Điều thú vị là, GPU đóng nhân vật quan trọng trong cả hai làn sóng.
Khoảng năm 2013, thợ đào phát hiện ra rằng GPU phù hợp hơn CPU để khai thác token, dẫn đến việc các card đồ họa Nvidia bán hết sạch. Mười năm sau, các nhà nghiên cứu nhận thấy rằng GPU là công cụ tốt nhất để huấn luyện và suy luận các mô hình AI, một lần nữa khiến các card đồ họa Nvidia dành cho trung tâm dữ liệu bán hết sạch. Là một loại bộ xử lý, GPU đã phục vụ hai thế hệ của nền kinh tế token.
Sự khác biệt nằm ở chỗ lần đầu tiên, Nvidia chỉ hưởng lợi một cách thụ động, và mọi chuyện kết thúc ở đó. Nhưng lần thứ hai, khi chiến trường chính về mức tiêu thụ tỷ lệ băm AI chuyển từ giai đoạn huấn luyện trước sang giai đoạn suy luận, Nvidia đã nhanh chóng nắm bắt cơ hội để chủ động thiết kế toàn bộ cuộc chơi, trở thành người viết ra luật chơi AI.
Chiếc xẻng sinh lời nhất thế giới
Những công ty sinh lời nhất trong thời kỳ sốt vàng không phải là những người tìm vàng, mà là Levi Strauss, người bán xẻng. Tương tự, những công ty sinh lời nhất trong thời kỳ bùng nổ khai thác không phải là thợ đào, mà là Bitmain và Jihan Wu, những người bán thiết bị khai thác. Và trong làn sóng huấn luyện và suy luận AI, những công ty sinh lời nhất không phải là các mô hình và tác nhân cơ bản, mà là Nvidia, công ty bán GPU.
Nhưng thành thật mà nói, Bitmain và Nvidia không còn là hai nhân vật giống nhau trong các ngành công nghiệp tương ứng của họ nữa.
Bitmain chỉ bán máy đào; Nvidia từng là nhà cung cấp cho Bitmain. Loại tiền điện tử bạn đào, nhóm đào bạn sử dụng và giá bán đều không liên quan đến Bitmain. Họ chỉ là nhà cung cấp phần cứng, thu lợi nhuận một lần từ thiết bị.
Nvidia thì khác. Họ không chỉ bán phần cứng. Giờ đây, đặc biệt là kể từ khi AI xử lý suy luận bùng nổ vào năm 2025, họ đã định nghĩa độ sâu nên khai thác loại dữ liệu nào với GPU này, định giá token ra sao, bán token cho ai và các trung tâm dữ liệu nên phân bổ tỷ lệ băm như thế nào... Tất cả những điều này đều có trong các slide thuyết trình của Nvidia: họ chia thị trường thành năm cấp độ, mỗi cấp độ tương ứng với mô hình, độ dài ngữ cảnh, tốc độ tương tác và giá cả... Nvidia đã chuẩn hóa và định hình thị trường tương lai, nơi AI xử lý suy luận sẽ chi phối mọi thứ.
Khoảng năm 2018, tỷ lệ băm toàn cầu tập trung vào một vài nhóm khai thác lớn—F2Pool, Antpool và BTC.com—cạnh tranh nhau để thị phần tỷ lệ băm , nhưng nguồn cung cấp máy khai thác lại tập trung cao độ ở Bitmain.
Giống như Nvidia hiện nay, 60% thu nhập đến từ các "nhà cung cấp dịch vụ điện toán đám mây quy mô lớn" cạnh tranh như AWS, Azure, GCP, Oracle và CoreWeave, trong khi 40% đến từ các dự án AI phi tập trung, các dự án AI độc lập và khách hàng doanh nghiệp. Các "nhóm khai thác" lớn đóng góp phần lớn doanh thu, trong khi các "thợ đào" nhỏ cung cấp sự ổn định và đa dạng hóa.
Hai hệ sinh thái này có cấu trúc giống hệt nhau. Tuy nhiên, Bitmain sau đó đã gặp phải các đối thủ cạnh tranh—Whatsminer, Innosilicon và Canaan Creative đều đang làm giảm thị thị phần của họ. Máy khai thác có thiết kế ASIC tương đối đơn giản, tạo cơ hội cho những kẻ theo đuổi. Nhưng việc lung lay vị thế thống trị của Nvidia dường như ngày càng khó khăn: 20 năm kinh nghiệm trong hệ sinh thái CUDA, hàng trăm triệu GPU được cài đặt, công nghệ kết nối NVLink thế hệ thứ sáu và kiến trúc suy luận tách rời được tích hợp với Groq—sự phức tạp về công nghệ và rào cản hệ sinh thái của Nvidia khiến hầu hết các công cụ cạnh tranh trở nên kém hiệu quả.
Việc này có thể mất đến 20 năm.
Sự fork cơ bản của hai token
Điều cơ bản phân biệt crypto với các token dùng để huấn luyện và suy luận AI chính là động cơ và tâm lý của người dùng khi sử dụng chúng.
Phía cầu của các token tiền điện tử là sự đầu cơ. Không ai "cần"Bitcoin để hoàn thành công việc của mình. Tất cả Sách trắng tuyên bố rằng token blockchain có thể giải quyết vấn đề của bạn đều là lừa đảo. Bạn nắm giữ tiền điện tử vì bạn tin rằng ai đó sẽ mua nó từ bạn với giá cao hơn trong tương lai. Giá trị của Bitcoin đến từ một lời tiên tri tự ứng nghiệm: nó có giá trị nếu đủ người tin vào nó. Đây là một nền kinh tế dựa trên niềm tin.
Nhu cầu sử dụng token AI đến từ năng suất. Nestlé cần token để đưa ra các quyết định Chuỗi cung ứng – tần suất cập nhật dữ liệu Chuỗi cung ứng của họ đã giảm từ 15 phút xuống còn 3 phút, giảm chi phí 83%, một giá trị có thể được phản ánh trực tiếp vào lợi nhuận (Sản xuất và Cho vay). Các kỹ sư của Nvidia đã cần token để viết mã thay vì viết thủ công; đội ngũ nghiên cứu của họ cần token cho nghiên cứu khoa học. Bạn không cần phải tin rằng token có giá trị; bạn chỉ cần sử dụng chúng, và giá trị của chúng sẽ được chứng minh thông qua việc sử dụng.
Đây là sự khác biệt cơ bản nhất giữa hai loại token này. Token tiền điện tử được tạo ra để nắm giữ và giao dịch – giá trị của chúng nằm ở việc không sử dụng chúng. Token trí tuệ nhân tạo (AI) được tạo ra để sử dụng ngay lập tức – giá trị của chúng nằm ở thời điểm được sử dụng.
Một là vàng kỹ thuật số, càng tích trữ lâu càng có giá trị; loại kia là điện kỹ thuật số, bị tiêu hao ngay khi vừa được sản xuất.
Sự khác biệt này quyết định rằng nền kinh tế token AI sẽ không trải qua bong bóng tương tự như nền kinh tế token tiền điện tử. Sự tăng giảm mạnh mẽ Bitcoin bắt nguồn từ thực tế là giá của các mặt hàng đầu cơ được thúc đẩy bởi tâm lý. Tuy nhiên, giá token lại được thúc đẩy bởi mức độ sử dụng và chi phí sản xuất. Chừng nào AI vẫn còn hữu ích—chừng nào mọi người vẫn tiếp tục sử dụng Claude Code để viết mã, ChatGPT để viết báo cáo và các tác nhân để vận hành các quy trình việc kinh doanh —thì nhu cầu về token sẽ không sụp đổ. Nó không dựa trên niềm tin; nó dựa trên tính không thể thiếu.
Năm 2008, Sách trắng Bitcoin cần phải được chứng minh nhiều lần về giá trị của hệ thống tiền điện tử phi tập trung. Mười bảy năm sau, cuộc tranh luận vẫn tiếp diễn.
Năm 2026, kinh tế học token không gây ra bất kỳ tranh cãi nào; nó trở thành một sự đồng thuận mà thậm chí không cần bằng chứng. Khi CEO của Nvidia, Jensen Huang, đứng trên sân khấu GTC và nói, "Token là loại hàng hóa mới," không ai đặt câu hỏi. Bởi vì tất cả mọi người trong khán giả đều đã chi hàng triệu token vào sáng hôm đó bằng cách sử dụng Claude Code hoặc ChatGPT. Họ không cần phải được thuyết phục rằng token có giá trị - sao kê thẻ tín dụng của họ đã chứng minh điều đó.
Theo nghĩa này, Huang thực sự là một bản sao của Satoshi Nakamoto , người đã để lại độc quyền trong sản xuất máy khai thác, định nghĩa các trường hợp sử dụng và tiêu chuẩn sử dụng cho token, và tổ chức một buổi triển lãm thường niên tại Trung tâm SAP ở San Jose để cho mọi người thấy thế hệ "máy khai thác" tiếp theo hỗ trợ đào tạo và suy luận AI mạnh mẽ đến mức nào.
Satoshi Nakamoto sở hữu một sức hút quyến rũ, đầy chủ ý. Ông thiết kế các quy tắc, giao chúng cho mã lập trình, rồi biến mất. Đó chính là sự lãng mạn của giới cypherpunk. Ngược lại, Huang lại giống một doanh nhân hơn là một nhà khoa học. Ông thiết kế các quy tắc, tự mình duy trì chúng, và liên tục bổ sung thêm, xây dựng hệ thống bảo vệ xung quanh doanh nghiệp của mình.
Biểu tượng mà bạn từng thấy trước đây vì niềm tin, giờ đây bạn có thể thấy mà không cần tin tưởng. Nó là bước tiếp theo sau Watt, Ampere và Bit.





