avatar
最爱吃兽奶的兔🐰
408個推特粉絲
關注
2018 年入场的小韭菜一枚|ETH holder|纳斯达贷还款者 | @theNextDAO 🦊|DCA 重度爱好者|ENTJ|大厂后端资深研发工程师|跆拳道黑带 & 古典舞十级选手 ❀
動態
avatar
最爱吃兽奶的兔🐰
03-30
主題貼
谷歌 TPU 能撼動英偉達嗎? 週末健身時聽了硅谷 101 關於谷歌 TPU 工程師的採訪揭秘,感覺很有意思。 聽完後有了一些新的認識和思考,總結原文核心觀點,並記錄自己的想法。 1️⃣ 播客中的結論 (另有詳細 AI 文字版本總結,較長見圖 2) 1) Gemini 有個很反直覺的特性:用的人越多,速度越快。 這是 TPU 架構決定的。並行計算 + 複用緩存機制,剛好把算力打滿的時候效率最高。 當然,雙刃劍的另一面也出現了。 去年 Gemini 3 發佈,GPT 大批用戶湧入,服務頻繁崩潰…… 本質原因就是 TPU 產能跟不上,擴容沒追上用戶增速。 2)英偉達 GPU vs 谷歌 TPU,各有各的護城河。 英偉達的優勢在軟件:CUDA 生態太成熟,通用性強,改不動。 谷歌 TPU 的優勢在軟硬件結合:跑特定大模型算法時,性能可以直接碾壓英偉達。 蘋果已經成為 TPU 第一大買家,Anthropic 也在大量採購。 理由很簡單:不想把雞蛋全放在英偉達一個籃子裡。 3) 臺積電的護城河比想象的還要深。 不管是英偉達、谷歌、蘋果……所有芯片全得靠臺積電做,臺積電的工藝和良品率水平沒有第二家可以替代。 更離譜的是臺積電產能根本不夠用,各大廠商都在排隊搶。 賣鏟子是穩,我也會堅定看好和持有臺積電。 4)TPU 類似於是把算法放進硬件,有點像用 ASIC 挖礦的感覺。 GPU 是通用的,TPU 是定製的。 谷歌芯片團隊需要提前一兩年向臺積電下單,這意味著他們現在做的芯片,是為兩年後的 AI 算法設計的。 所以谷歌的 AI 團隊和芯片團隊必須深度綁定,今天押注的算法方向,決定了兩年後芯片能不能用上。 押對了是降維打擊,押錯了兩年全打水漂。 而這層約束對於英偉達來說無需面對。 2️⃣ 說點個人想法 所謂軟硬件結合,就是通用硬件設計能力不夠,或者成本過高, 乾脆直接為某一類算法設計硬件。 就硬件設計水平來講是比不上通用硬件的。 英偉達為什麼不做 NPU/TPU? 因為沒法擴大自己的優勢。太多廠商能做了,大家都做就和手機廠商一樣。 舉個栗子🌰: 基本上安卓機都有了紅外遙控,也就是萬能遙控功能, 蘋果為什麼不做? 這個功能難嗎?不難; 客戶有需求嗎,有。 那為什麼蘋果為什麼不做呢? 我想商品形態可能真不一定是「完全由需求」決定的。 如果兩個集合,相同元素佔比越大,越沒有辨識度。 想想我們對手機的印象:蘋果/ 非蘋果。 如果用安卓,大部分人是不在乎小米,oppo,vivo,華為的, 因為他們同質化太高了,用戶粘性相對低。 類比計算器和計算機的區別,計算機是通用計算,計算器就是特定計算。 計算器的功耗當然低了,只能做特定計算。 TPU 相對於英偉達的 GPU 沒有硬件設計壁壘。 只是在想辦法降本。 同時,通過降本賺的盆滿缽滿的公司是很少的,提出新概念,開闢新方向的才能起飛,也容易炒概念。 目前的神經網絡計算主要就是張量計算, 捲成本對於英偉達來講是下下策。 因此不能單獨地看 TPU 是怎麼說自己的優勢的。 單從 Google 的角度來看,做 TPU 是最好的選擇。 但是從英偉達的角度來看,打成本戰是下下策。 因為英偉達已經掌握了先發優勢,英偉達的 cuda 生態,以及英偉達的頂尖 gpu 設計能力。 Google 做不了 GPU ? 肯定不是。 摩爾都能做,谷歌怎麼可能做不了,多出點錢還怕挖不到人嗎? 芯片的前期投入太大了,如果 Google 一開始做 GPU 沒人用,就會面臨本都收不回來的情況。 同規模下,Google 做 TPU 成本比 GPU 低,還能打包出售自己的 Gemini, 屬於上策。
TPU
0%
avatar
最爱吃兽奶的兔🐰
03-13
主題貼
字節因為 AI 裁員武漢所有人? 別再造謠了… AI 背鍋背成這樣了 AI 自己都沒想到🤣 核心原因:字節最近在治理孤島問題。 什麼是孤島問題? 字節現在 base 地比較分散,全球各地。 有時一個團隊 10 個人,可能分散在 10 個國家,導致溝通成本極高。 雖說現在能遠程,但是真正多部門合作過的小夥伴應該知道,跨地多部門溝通有多費勁…… 簡直就是薛定諤的對齊🤡 據字節小夥伴內部消息透露 本次武漢這波動作和 AI 沒任何關係, 去年 12 月初內部就通知了今年 3 月份,武漢字節要全部去一線城市, 跟上孤島治理大方向。 我有一個朋友就是當時面試的時候崗位在北京,但是他不想去, 要求要麼一定 base 在杭州,要麼他就不接 offer。 字節也為了招他,給我這個朋友在杭州專門放了一個崗位。 治理也不是裁員,要麼轉 base 地,要麼活水,沒人要才會給大禮包。 和謠言裡武漢這個部門一樣,小夥伴之前在杭州的團隊也是這個流程。 字節內部人認為這是好事, 因為 base 太散導致字節溝通太低效了,不像拼多多。 PDD 所有研發都在上海,一棟樓裡,溝通很高效。 因此字節最近就在治理因為 base 太散導致溝通困難的孤島問題, 屬於內部早就安排的組織優化… 別動不動讓 AI 背鍋了🤡 twitter.com/0xMilkRabbit/statu...
avatar
最爱吃兽奶的兔🐰
03-13
主題貼
鹹魚 Gemini Pro 賬戶直衝,便宜大碗 這次依舊是兩杯奶茶就可以搞定的必擼毛! 上一篇 50rmb 可以享受一年的 Gemini 3.1 Pro 帖,受到了很多小夥伴的喜歡🥰,也有小夥伴擔心安全問題,比如被封短期失效。 這裡統一做說明 谷歌 one 唯一的風險就是賣家的號被谷歌封掉了。 他不知道是通過什麼途徑開的,可能是學生優惠或者是套信用卡。 但是邀請的成員沒有什麼風險,要封也只會封主號,封完主號之後,家庭解散嘛很簡單😆,隱私問題不用擔心。 蘋果也有很多家庭成員共享的 iCloud 存儲我都經常買的,用五六年都沒問題。 不過我買的這家售後還不錯,正常使用不擔心用不回本,我和同事幾個人都已經用了兩個月了,香迷糊🤤 並且有小夥伴評論反饋這種失效了,靠譜商家會重新邀請接著使用。 如果你依然擔心,群友 @MMMusol 推薦了一種直衝方式, 極度追求長期穩定,擔心頻繁失效的小夥伴可以考慮 🙌🏻。 36rmb 可以使用 3 個月的官方訂閱直衝, 比起上一篇 50rmb 使用一年貴一點,但勝在穩定 不過和官網 140rmb 一個月就很划算了! 到賬方式:直充到自己的 Google 賬號,全程 5-10 分鐘極就搞定了 操作流程∶ 1)閒魚搜索 Gemini3.1 Pro 直衝/禮品卡 2)價格選擇在 6u 到 7u,時長為 3 個月(禮品卡直衝) (商家最好選擇 L3 或者是 L4) 3)拍下商品鏈接後,商家發送禮品卡鏈接 4)將商家提供的銀行卡及地址綁定在自己賬戶上 操作中有報錯告知商家即可, 他們會及時處理(信譽好的售後好的商家服務會很 nice ) 5)綁定禮品卡在自己賬戶就完成啦 一個是 50rmb 可以使用一年的家庭邀請方式,便宜大碗但有不足一年被封可能性 一個是 35rmb 可以使用 3 個月的賬號直衝方式,價格高於前者但是相對穩定 無廣純分享,具體使用哪種方式,小夥伴們可以考慮後自主選擇☺️, 都很香 twitter.com/0xMilkRabbit/statu...
L3
0%
loading indicator
Loading..