Bài viết này được dịch máy
Xem bản gốc
Liệu TPU của Google có thể thách thức vị thế thống trị của Nvidia?
Tôi đã nghe một cuộc phỏng vấn với một kỹ sư TPU của Google trên chương trình Silicon Valley 101 trong lúc tập thể dục cuối tuần, và tôi thấy nó rất thú vị.
Sau khi nghe xong, tôi đã có thêm một số hiểu biết và suy ngẫm mới, tóm tắt được quan điểm cốt lõi của văn bản gốc và ghi lại những suy nghĩ của riêng mình.
1️⃣ Kết luận từ podcast (Phiên bản tóm tắt chi tiết bằng văn bản AI cũng có sẵn; xem Hình 2 để có phiên bản dài hơn).
1) Gemini có một đặc điểm rất trái ngược với trực giác: càng nhiều người sử dụng nó, nó càng trở nên nhanh hơn.
Điều này được quyết định bởi kiến trúc TPU. Tính toán song song kết hợp với cơ chế bộ nhớ đệm tái sử dụng đạt được hiệu quả tối đa khi tỷ lệ băm được tận dụng tối đa.
Dĩ nhiên, mặt trái của con dao hai lưỡi cũng xuất hiện.
Năm ngoái, với sự ra mắt của Gemini 3, một lượng lớn người dùng GPT đã đổ dồn vào, gây ra tình trạng sập dịch vụ thường xuyên... Nguyên nhân cốt lõi là do năng lực sản xuất TPU không đáp ứng kịp nhu cầu, và việc mở rộng năng lực không theo kịp tốc độ tăng trưởng người dùng.
2) GPU của Nvidia so với TPU của Google: mỗi bên đều có hệ thống bảo vệ riêng.
Lợi thế của Nvidia nằm ở phần mềm: hệ sinh thái CUDA quá hoàn thiện, cực kỳ linh hoạt và khó sửa đổi.
TPU của Google có ưu điểm là kết hợp cả phần cứng và phần mềm: khi chạy các thuật toán mô hình quy mô lớn cụ thể, hiệu năng của nó có thể vượt trội trực tiếp so với Nvidia.
Apple đã trở thành nhà mua TPU lớn nhất, và Anthropic cũng đang mua chúng lượng lớn.
Lý do rất đơn giản: họ không muốn đặt tất cả trứng vào một giỏ với Nvidia.
3) Hệ thống bảo vệ của TSMC sâu rộng hơn nhiều so với tưởng tượng.
Dù là Nvidia, Google hay Apple... tất cả các chip đều phải do TSMC sản xuất. Không có công ty nào khác có thể thay thế TSMC về công nghệ sản xuất và tỷ lệ sản phẩm đạt chất lượng.
Điều đáng phẫn nộ hơn nữa là năng lực sản xuất của TSMC đơn giản là không đủ, và các nhà sản xuất lớn đang xếp hàng để cạnh tranh giành lấy nó.
Bán xẻng là một lựa chọn an toàn, và tôi sẽ tiếp tục lạc quan và nắm giữ cổ phiếu TSMC.
4) TPU tương tự như việc đưa các thuật toán vào phần cứng, phần nào giống như khai thác bằng ASIC.
GPU là bộ xử lý đa năng, trong khi TPU là bộ xử lý được thiết kế riêng theo yêu cầu.
Đội ngũ triển chip của Google cần đặt đặt lệnh với TSMC trước từ một đến hai năm, điều đó có nghĩa là những con chip họ đang sản xuất hiện nay được thiết kế cho các thuật toán AI của hai năm tới.
Do đó, đội ngũ AI và đội ngũ chip của Google phải phối hợp độ sâu. Hướng đi thuật toán mà họ lựa chọn ngày hôm nay sẽ quyết định liệu những con chip này có còn sử dụng được sau hai năm nữa hay không.
Nếu bạn đặt cược đúng, đó sẽ là bước ngoặt; nếu bạn đặt cược sai, hai năm thua lỗ sẽ trở nên vô ích.
Đây không phải là hạn chế mà Nvidia cần phải đối diện.
2️⃣ Một vài suy nghĩ cá nhân: Cái gọi là tích hợp phần cứng và phần mềm đơn giản chỉ có nghĩa là khả năng thiết kế phần cứng đa năng không đủ hoặc chi phí quá cao.
Chúng ta hoàn toàn có thể thiết kế phần cứng trực tiếp cho một loại thuật toán cụ thể.
Về mặt thiết kế phần cứng, nó không thể so sánh với phần cứng đa năng.
Tại sao Nvidia không sản xuất NPU/TPU?
Vì họ không thể mở rộng lợi thế của chính mình. Quá nhiều nhà sản xuất có thể làm được điều đó, và nếu ai cũng làm vậy, nó sẽ giống như các nhà sản xuất điện thoại di động.
Ví dụ 🌰:
Về cơ bản, tất cả điện thoại Android đều có chức năng điều khiển từ xa hồng ngoại, đây là một tính năng điều khiển từ xa phổ biến.
Tại sao Apple không làm vậy?
Tính năng này có khó sử dụng không? Không, không khó chút nào.
Khách hàng có nhu cầu không? Có.
Vậy tại sao Apple không làm vậy?
Tôi nghĩ rằng hình thức của một sản phẩm không nhất thiết phải "hoàn toàn được quyết định bởi nhu cầu".
Nếu hai tập hợp có chiếm tỷ lệ các phần tử giống hệt nhau cao hơn, thì chúng khó phân biệt hơn.
Hãy nghĩ về ấn tượng của chúng ta về điện thoại di động: Apple/không phải Apple.
Nếu bạn đang dùng Android, hầu hết mọi người không quan tâm đến Xiaomi, OPPO, Vivo hay Huawei.
Do quá đồng nhất, tỷ lệ giữ chân người dùng tương đối thấp.
Để so sánh giữa máy tính bỏ túi và máy tính cầm tay, máy tính cầm tay dùng để thực hiện các phép tính tổng quát, trong khi máy tính bỏ túi dùng để thực hiện các phép tính cụ thể.
Máy tính này tiêu thụ ít điện năng và chỉ có thể thực hiện một số phép tính nhất định.
TPU không gặp phải những rào cản về thiết kế phần cứng giống như GPU của Nvidia.
Chúng tôi chỉ đang cố gắng tìm cách giảm chi phí.
Đồng thời, rất ít công ty làm giàu bằng cách giảm chi phí. Chỉ những công ty đưa ra những ý tưởng mới và mở ra những hướng đi mới mới có thể thành công, và họ cũng dễ bị thổi phồng giá trị.
Tính toán mạng nơ-ron hiện nay chủ yếu liên quan đến tính toán tensor.
Đối với Nvidia, giảm chi phí là biện pháp cuối cùng.
Do đó, người ta không thể chỉ nhìn vào những tuyên bố về ưu điểm của TPU.
Chỉ xét từ góc độ của Google, việc tự sản xuất TPU là lựa chọn tốt nhất.
Tuy nhiên, từ góc nhìn của Nvidia, tham gia vào cuộc chiến giá cả là một chiến lược tồi.
Bởi vì Nvidia đã có được lợi thế tiên phong, hệ sinh thái CUDA của Nvidia và khả năng thiết kế GPU hàng đầu của Nvidia.
Google không thể tự sản xuất GPU sao?
Chắc chắn là không.
Nếu Moore làm được, thì sao Google lại không thể? Với thêm một chút tiền, liệu họ có lo lắng về việc không thể chiêu mộ nhân tài không?
Chi phí đầu tư ban đầu vào chip quá lớn. Nếu Google sản xuất GPU mà không ai sử dụng, họ sẽ đối mặt với tình trạng không thể thu hồi vốn.
Ở cùng quy mô, Google có thể sản xuất TPU với chi phí thấp hơn GPU, đồng thời cũng có thể đóng gói và bán riêng Gemini của mình.
Đây là phương án hành động tốt nhất.


Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan


