谷歌 TPU 能撼動英偉達嗎?
週末健身時聽了硅谷 101 關於谷歌 TPU 工程師的採訪揭秘,感覺很有意思。
聽完後有了一些新的認識和思考,總結原文核心觀點,並記錄自己的想法。
1️⃣ 播客中的結論
(另有詳細 AI 文字版本總結,較長見圖 2)
1) Gemini 有個很反直覺的特性:用的人越多,速度越快。
這是 TPU 架構決定的。並行計算 + 複用緩存機制,剛好把算力打滿的時候效率最高。
當然,雙刃劍的另一面也出現了。
去年 Gemini 3 發佈,GPT 大批用戶湧入,服務頻繁崩潰…… 本質原因就是 TPU 產能跟不上,擴容沒追上用戶增速。
2)英偉達 GPU vs 谷歌 TPU,各有各的護城河。
英偉達的優勢在軟件:CUDA 生態太成熟,通用性強,改不動。
谷歌 TPU 的優勢在軟硬件結合:跑特定大模型算法時,性能可以直接碾壓英偉達。
蘋果已經成為 TPU 第一大買家,Anthropic 也在大量採購。
理由很簡單:不想把雞蛋全放在英偉達一個籃子裡。
3) 臺積電的護城河比想象的還要深。
不管是英偉達、谷歌、蘋果……所有芯片全得靠臺積電做,臺積電的工藝和良品率水平沒有第二家可以替代。
更離譜的是臺積電產能根本不夠用,各大廠商都在排隊搶。
賣鏟子是穩,我也會堅定看好和持有臺積電。
4)TPU 類似於是把算法放進硬件,有點像用 ASIC 挖礦的感覺。
GPU 是通用的,TPU 是定製的。
谷歌芯片團隊需要提前一兩年向臺積電下單,這意味著他們現在做的芯片,是為兩年後的 AI 算法設計的。
所以谷歌的 AI 團隊和芯片團隊必須深度綁定,今天押注的算法方向,決定了兩年後芯片能不能用上。
押對了是降維打擊,押錯了兩年全打水漂。
而這層約束對於英偉達來說無需面對。
2️⃣ 說點個人想法
所謂軟硬件結合,就是通用硬件設計能力不夠,或者成本過高,
乾脆直接為某一類算法設計硬件。
就硬件設計水平來講是比不上通用硬件的。
英偉達為什麼不做 NPU/TPU?
因為沒法擴大自己的優勢。太多廠商能做了,大家都做就和手機廠商一樣。
舉個栗子🌰:
基本上安卓機都有了紅外遙控,也就是萬能遙控功能,
蘋果為什麼不做?
這個功能難嗎?不難;
客戶有需求嗎,有。
那為什麼蘋果為什麼不做呢?
我想商品形態可能真不一定是「完全由需求」決定的。
如果兩個集合,相同元素佔比越大,越沒有辨識度。
想想我們對手機的印象:蘋果/ 非蘋果。
如果用安卓,大部分人是不在乎小米,oppo,vivo,華為的,
因為他們同質化太高了,用戶粘性相對低。
類比計算器和計算機的區別,計算機是通用計算,計算器就是特定計算。
計算器的功耗當然低了,只能做特定計算。
TPU 相對於英偉達的 GPU 沒有硬件設計壁壘。
只是在想辦法降本。
同時,通過降本賺的盆滿缽滿的公司是很少的,提出新概念,開闢新方向的才能起飛,也容易炒概念。
目前的神經網絡計算主要就是張量計算,
捲成本對於英偉達來講是下下策。
因此不能單獨地看 TPU 是怎麼說自己的優勢的。
單從 Google 的角度來看,做 TPU 是最好的選擇。
但是從英偉達的角度來看,打成本戰是下下策。
因為英偉達已經掌握了先發優勢,英偉達的 cuda 生態,以及英偉達的頂尖 gpu 設計能力。
Google 做不了 GPU ?
肯定不是。
摩爾都能做,谷歌怎麼可能做不了,多出點錢還怕挖不到人嗎?
芯片的前期投入太大了,如果 Google 一開始做 GPU 沒人用,就會面臨本都收不回來的情況。
同規模下,Google 做 TPU 成本比 GPU 低,還能打包出售自己的 Gemini,
屬於上策。


來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享
