Sự phát triển phần cứng của máy tính hiện đại phần lớn được định hình bởi sự trỗi dậy của GPU.
Văn bản gốc: Vượt ra ngoài GPU: Tại sao TPU là động cơ tiềm ẩn cho chuỗi khối hậu lượng tử (x)
Tác giả: Eli5DeFi
Biên soạn bởi: Tim, PANews
Ghi chú của biên tập viên PANews: Vào ngày 25 tháng 11, tổng giá trị vốn hóa thị trường của Google đã đạt Cao nhất mọi thời đại (ATH) 3,96 nghìn tỷ đô la. Các yếu tố góp phần vào sự tăng vọt giá cổ phiếu này bao gồm chip AI mạnh mẽ nhất mới được ra mắt, Gemini 3, và chip TPU do chính Google phát triển. Ngoài AI, TPU cũng sẽ đóng vai trò quan trọng trong blockchain.
Sự phát triển phần cứng của máy tính hiện đại phần lớn được định hình bởi sự trỗi dậy của GPU.
Từ chơi game đến học độ sâu, kiến trúc song song của NVIDIA đã trở thành một tiêu chuẩn được công nhận trong ngành, khiến CPU dần chuyển sang nhân vật quản lý chung.
Tuy nhiên, khi các mô hình AI gặp phải những trở ngại về khả năng mở rộng và công nghệ blockchain hướng tới các ứng dụng mã hóa phức tạp, một đối thủ cạnh tranh mới, bộ xử lý Tensor (TPU), đã xuất hiện.
Mặc dù TPU thường được thảo luận trong khuôn khổ chiến lược AI của Google, kiến trúc của chúng lại bất ngờ phù hợp với các nhu cầu cốt lõi của mật mã hậu lượng tử, cột mốc tiếp theo trong công nghệ blockchain.
Bài viết này giải thích, bằng cách xem xét sự phát triển của phần cứng và so sánh các đặc điểm kiến trúc, tại sao TPU (thay vì GPU) lại phù hợp hơn để xử lý các phép toán phức tạp cần thiết cho mật mã hậu lượng tử khi xây dựng các mạng phi tập trung có khả năng chống lại các cuộc tấn công lượng tử.

Sự tiến hóa của phần cứng: Từ xử lý nối tiếp đến kiến trúc xung nhịp
Để hiểu được tầm quan trọng của TPU, trước tiên bạn cần hiểu những vấn đề mà nó giải quyết.
- Bộ xử lý trung tâm (CPU): Là một bộ xử lý đa năng, nó hoạt động xuất sắc trong xử lý tuần tự và các phép toán rẽ nhánh logic, nhưng vai trò của nó bị hạn chế khi cần thực hiện đồng thời nhiều phép toán phức tạp.
- Bộ xử lý đồ họa (GPU): Là chuyên gia về xử lý song song, GPU ban đầu được thiết kế để hiển thị điểm ảnh, do đó nó vượt trội trong việc thực hiện lượng lớn nhiệm vụ giống hệt nhau cùng một lúc (SIMD: Single Instruction Multiple dữ liệu đa lệnh đơn). Đặc điểm này đã khiến nó trở thành trụ cột trong giai đoạn bùng nổ ban đầu của trí tuệ nhân tạo.
- Bộ xử lý Tensor (TPU): Một chip chuyên dụng được Google thiết kế riêng cho nhiệm vụ tính toán mạng thần kinh.

Ưu điểm của kiến trúc xung nhịp
Sự khác biệt cơ bản giữa GPU và TPU nằm ở phương pháp xử lý dữ liệu của chúng.
GPU yêu cầu truy cập bộ nhớ (thanh ghi, bộ nhớ đệm) liên tục để thực hiện tính toán, trong khi TPU sử dụng kiến trúc xung nhịp. Kiến trúc này, giống như một trái tim bơm máu, khiến dữ liệu chảy qua một lưới tính toán quy mô lớn một cách đều đặn, theo nhịp điệu.

https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025
Kết quả tính toán được truyền trực tiếp đến đơn vị tính toán tiếp theo mà không cần phải ghi lại vào bộ nhớ. Thiết kế này giúp giảm thiểu đáng kể nút thắt cổ chai von Neumann, tức là độ trễ gây ra bởi việc di chuyển dữ liệu lặp đi lặp lại giữa bộ nhớ và bộ xử lý, nhờ đó đạt được hiệu suất tăng lên gấp nhiều lần đối với các phép toán cụ thể.
Bí quyết của mật mã hậu lượng tử: Tại sao blockchain cần TPU?
Ứng dụng quan trọng nhất của TPU trong lĩnh vực blockchain không phải là khai thác, mà là bảo mật mật mã.

Các hệ thống blockchain hiện nay dựa trên mật mã đường cong elliptic hoặc crypto RSA, vốn có một điểm yếu chí mạng khi xử lý thuật toán Shor. Điều này có nghĩa là một khi máy tính lượng tử đủ mạnh xuất hiện, kẻ tấn công có thể suy ra private key từ khóa công khai, đủ để xóa sạch hoàn toàn tất cả tài sản crypto trên Bitcoin hoặc Ethereum .
Giải pháp nằm ở mật mã hậu lượng tử. Hiện nay, các thuật toán tiêu chuẩn PQC phổ biến (như Kyber và Dilithium) đều được xây dựng trên mật mã mạng lưới.
Sự phù hợp toán học của TPU
Đây chính xác là lợi thế của TPU so với GPU. Mật mã mạng lưới phụ thuộc rất nhiều vào các phép toán chuyên sâu trên các ma trận và vectơ lớn, chủ yếu bao gồm:
- Phép nhân ma trận-vectơ: As + e ( trong đó A là ma trận, và s và e là các vectơ).
- Các phép toán đa thức: các phép toán đại số dựa trên vành, thường được thực hiện bằng cách sử dụng các phép biến đổi lý thuyết số.
Các GPU truyền thống xử lý các phép tính này như nhiệm vụ song song đa năng, trong khi TPU đạt được khả năng tăng tốc chuyên dụng thông qua các đơn vị tính toán ma trận cố định ở cấp độ phần cứng. Cấu trúc toán học của mật mã Lattice và cấu trúc vật lý của mảng xung nhịp của TPU tạo thành một sự ánh xạ tôpô gần như liền mạch.
Cuộc chiến công nghệ giữa TPU và GPU
Mặc dù GPU vẫn là "ông vua" của ngành công nghiệp này về mọi mặt, nhưng TPU lại có ưu thế rõ rệt khi xử lý nhiệm vụ đòi hỏi nhiều phép toán cụ thể.

Kết luận: GPU vượt trội về tính linh hoạt và hệ sinh thái, trong khi TPU có ưu thế về hiệu quả tính toán đại số tuyến tính chuyên sâu, vốn là phép toán cốt lõi mà trí tuệ nhân tạo và mật mã học tiên tiến hiện đại dựa vào.
TPU mở rộng câu chuyện: Bằng chứng không tri thức và trí tuệ nhân tạo phi tập trung
Bên cạnh mật mã hậu lượng tử, TPU cũng đã cho thấy tiềm năng ứng dụng trong hai lĩnh vực quan trọng khác của Web3.
Bằng chứng không tri thức
ZK- Rollups(như Starknet hoặc zkSync), với vai trò là giải pháp mở rộng quy mô cho Ethereum, đòi hỏi khối lượng tính toán khổng lồ trong quá trình tạo bằng chứng, chủ yếu bao gồm:
- Biến đổi Fourier nhanh: Cho phép chuyển đổi nhanh chóng các định dạng biểu diễn dữ liệu.
- Phép nhân đa vô hướng: Thực hiện các phép toán điểm trên đường cong elip.
- Giao thức FRI: Hệ thống chứng minh mật mã để xác minh đa thức
Các loại phép toán này không phải là phép tính băm, lĩnh vực mà ASIC thực hiện rất tốt, mà là toán học đa thức. So với CPU đa năng, TPU có thể tăng tốc đáng kể các phép toán FFT và phép toán cam kết đa thức; và vì các thuật toán này có đặc điểm luồng dữ liệu có thể dự đoán được, TPU thường có thể đạt được khả năng tăng tốc hiệu quả cao hơn so với GPU.
Với sự trỗi dậy của các mạng lưới AI phi tập trung như Bittensor, nút mạng cần có khả năng chạy suy luận mô hình AI. Việc chạy một mô hình ngôn ngữ đa năng quy mô lớn về cơ bản là thực hiện các phép nhân ma trận khổng lồ.
So với các cụm GPU, TPU cho phép nút phi tập trung xử lý các yêu cầu suy luận AI với mức tiêu thụ năng lượng thấp hơn, từ đó cải thiện tính khả thi thương mại của AI phi tập trung.

Tổng quan hệ sinh thái TPU
Mặc dù hầu hết các dự án vẫn dựa vào GPU do sự phổ biến rộng rãi của CUDA, nhưng các lĩnh vực sau đây đang có tiềm năng tích hợp TPU, đặc biệt là trong khuôn khổ lý thuyết về mật mã hậu lượng tử và Bằng chứng không tri thức.

Bằng chứng không tri thức và các giải pháp mở rộng quy mô
Tại sao nên chọn TPU? Bởi vì việc tạo bằng chứng ZK đòi hỏi xử lý song song quy mô lớn các phép toán đa thức, và trong một số cấu hình kiến trúc nhất định, TPU hiệu quả hơn nhiều so với GPU đa năng trong việc xử lý nhiệm vụ như vậy.
- Starknet (sơ đồ mở rộng hai lớp): Các bằng chứng STARK phụ thuộc rất nhiều vào phép biến đổi Fourier nhanh và các bằng chứng oracle tương tác Reed-Solomon nhanh, và các thao tác tính toán chuyên sâu này rất tương thích với logic tính toán của TPU.
- zksync (giải pháp mở rộng hai lớp): Prover Airbender của nó cần xử lý các phép toán FFT và đa thức quy mô lớn, đây là nút thắt cổ chai cốt lõi mà TPU có thể giải quyết.
- Scroll(phương án mở rộng hai lớp): Nó sử dụng hệ thống chứng minh Halo2 và Plonk, và hoạt động cốt lõi của nó là xác minh cam kết KZG và phép nhân đa vô hướng, hoàn toàn phù hợp với kiến trúc xung của TPU.
- Aleo (Chuỗi công khai bảo vệ quyền riêng tư): Tập trung vào việc tạo Bằng chứng không tri thức zk-SNARK, và các hoạt động cốt lõi của nó dựa trên các đặc tính toán học đa thức, có khả năng tương thích cao với thông lượng tính toán chuyên dụng của TPU.
- Mina(chuỗi công khai hạng nhẹ): Nó sử dụng công nghệ SNARK đệ quy. Cơ chế liên tục tái tạo bằng chứng của nó yêu cầu thực hiện lặp đi lặp lại các phép toán đa thức. Đặc điểm này làm nổi bật giá trị tính toán cao của TPU.
- Zcash(Đồng tiền bảo mật): Hệ thống chứng minh Groth16 cổ điển dựa trên các phép toán đa thức. Mặc dù là một công nghệ mới nổi, phần cứng có thông lượng cao vẫn có thể mang lại lợi ích đáng kể cho nó.
- Filecoin (DePIN, lưu trữ): Cơ chế chứng minh sao chép của nó xác minh tính hợp lệ của dữ liệu được lưu trữ thông qua Bằng chứng không tri thức và kỹ thuật mã hóa đa thức.
Trí tuệ nhân tạo phi tập trung và điện toán tác nhân
Tại sao nên chọn TPU? Đây chính xác là kịch bản ứng dụng lý tưởng cho TPU, được thiết kế đặc biệt để tăng tốc nhiệm vụ học máy mạng nơ-ron.
- Kiến trúc cốt lõi của Bittensor là suy luận AI phi tập trung, hoàn toàn phù hợp với khả năng tính toán tensor của TPU.
- Tìm nạp (AI Agent): AI Agent tự động dựa vào suy luận mạng nơ-ron liên tục để đưa ra quyết định, và TPU có thể chạy các mô hình này với độ trễ thấp hơn.
- Singularity (Nền tảng dịch vụ AI): Là một thị trường giao dịch dịch vụ trí tuệ nhân tạo, Singularity cải thiện đáng kể tốc độ và hiệu quả chi phí của việc thực thi mô hình cơ bản bằng cách tích hợp TPU.
- NEAR (Chuỗi công khai, Chuyển đổi chiến lược AI): Quá trình chuyển đổi hướng tới AI Chuỗi và hoàn cảnh thực thi đáng tin cậy, các phép toán tensor mà nó dựa vào đòi hỏi khả năng tăng tốc TPU.
Mạng mật mã hậu lượng tử
Tại sao nên chọn TPU? Các hoạt động cốt lõi của mật mã hậu lượng tử thường liên quan đến bài toán tìm vectơ ngắn nhất trong một mạng lưới. Nhiệm vụ này, đòi hỏi các phép toán ma trận và vectơ phức tạp, rất giống với khối lượng công việc của AI về kiến trúc tính toán.
- Algorand(chuỗi công khai): Nó áp dụng lược đồ băm và phép toán vectơ an toàn lượng tử, có khả năng tương thích cao với khả năng tính toán song song của TPU.
- QAN (Quantum Resistant Chuỗi Công Khai): Sử dụng mật mã Lattice, với các phép toán đa thức và vectơ cơ bản có tính tương đồng cao với lĩnh vực tối ưu hóa toán học mà TPU chuyên về.
- Nexus (nền tảng điện toán, ZkVM): Quá trình chuẩn bị tính toán chống lượng tử của nó bao gồm các thuật toán đa thức và cơ sở mạng lưới có thể được ánh xạ hiệu quả lên kiến trúc TPU.
- Cellframe (Chuỗi công khai chống lượng tử): Công nghệ mã hóa Lattice và crypto băm mà nó sử dụng liên quan đến các phép toán giống như tensor, khiến nó trở thành ứng cử viên lý tưởng cho việc tăng tốc TPU.
- Abelian (token bảo mật): Tập trung vào các phép toán mạng lưới mật mã hậu lượng tử. Tương tự như QAN, kiến trúc kỹ thuật của nó tận dụng tối đa hiệu năng cao của bộ xử lý vector TPU.
- Quantus (chuỗi công khai): Chữ ký mật mã hậu lượng tử dựa trên các phép toán vectơ quy mô lớn, và TPU có khả năng xử lý song song các phép toán này cao hơn nhiều so với CPU tiêu chuẩn.
- Pauli (Nền tảng điện toán): Điện toán lượng tử an toàn liên quan đến lượng lớn các phép toán ma trận, đây chính là lợi thế cốt lõi của kiến trúc TPU.
Điểm nghẽn trong quá trình phát triển: Tại sao TPU vẫn chưa được sử dụng rộng rãi?
Nếu TPU hiệu quả đến vậy trong mật mã hậu lượng tử và Bằng chứng không tri thức, tại sao ngành công nghiệp vẫn đang tranh giành mua chip H100?
- Hệ thống bảo vệ của CUDA: Thư viện phần mềm CUDA của NVIDIA đã trở thành tiêu chuẩn ngành, và phần lớn các kỹ sư mật mã lập trình bằng CUDA. Việc chuyển đổi mã sang các khung JAX hoặc XLA mà TPU yêu cầu không chỉ khó khăn về mặt kỹ thuật mà còn đòi hỏi lượng lớn về nguồn lực.
- Rào cản gia nhập nền tảng đám mây: Các TPU cao cấp hầu như bị độc quyền bởi Google Cloud. Các mạng phi tập trung phụ thuộc quá nhiều vào một nhà cung cấp dịch vụ đám mây tập trung duy nhất sẽ phải đối mặt rủi ro kiểm duyệt và điểm yếu duy nhất.
- Kiến trúc cứng nhắc: Nếu các thuật toán mã hóa yêu cầu tinh chỉnh (chẳng hạn như đưa vào logic phân nhánh), hiệu năng của TPU sẽ giảm mạnh. Mặt khác, GPU vượt trội hơn nhiều so với TPU trong việc xử lý các logic bất thường như vậy.
- Hạn chế của các phép toán băm: TPU không thể thay thế máy khai thác Bitcoin . Thuật toán SHA-256 liên quan đến các phép toán ở cấp độ bit chứ không phải phép toán ma trận, khiến TPU trở nên vô dụng trong lĩnh vực này.
Kết luận: Kiến trúc nhiều lớp là tương lai.
Tương lai của phần cứng Web3 không phải là một cuộc cạnh tranh "kẻ thắng cuộc giành tất cả", mà là sự tiến hóa hướng tới một kiến trúc phân lớp.
GPU sẽ tiếp tục đóng nhân vật hàng đầu trong điện toán tổng quát, kết xuất đồ họa và nhiệm vụ đòi hỏi logic phân nhánh phức tạp.
TPU (và accelerator dựa trên ASIC tương tự) sẽ dần trở thành cấu hình tiêu chuẩn cho "lớp toán học" của Web3, được thiết kế đặc biệt để tạo ra Bằng chứng không tri thức và chữ ký mật mã lượng tử đã được xác minh.
Khi blockchain chuyển sang các tiêu chuẩn bảo mật hậu lượng tử, các phép toán ma trận khổng lồ cần thiết cho việc ký và xác minh giao dịch sẽ khiến kiến trúc xung của TPU không còn là một lựa chọn mà trở thành cơ sở hạ tầng thiết yếu để xây dựng các mạng phi tập trung mở rộng và an toàn trước lượng tử.
Tuyên bố miễn trừ trách nhiệm: Là blockchain, các bài viết được đăng tải trên trang web này chỉ thể hiện quan điểm cá nhân của tác giả và khách mời và không phản ánh lập trường của Web3Caff. Thông tin trong các bài viết chỉ mang tham khảo và không cấu thành bất kỳ lời khuyên hoặc đề nghị đầu tư nào. Vui lòng tuân thủ các luật và quy định hiện hành của quốc gia hoặc khu vực của bạn.
Chào mừng bạn đến với cộng đồng chính thức của Web3Caff : Tài khoản Twitter | Tài khoản Twitter nghiên cứu của Web3Caff | Nhóm độc giả WeChat | Tài khoản chính thức WeChat






