巨頭“火拼”AI晶片,AMD力抗英偉達

avatar
36氪
06-12

人工智慧浪潮席捲近半年,也讓英偉達一把推開了美股萬億俱樂部的大門。

當初只是想在遊戲影象計算上分一杯羹的英偉達,沒想到在二十多年後成為AI計算的領軍者,幾乎壟斷了整個AI伺服器晶片市場。

上一個摧枯拉朽般佔領伺服器市場的是英特爾,但它的CPU在高效能運算上敗給了英偉達的GPU。同時,英特爾在晶片製程技術上也落後於臺積電,其產品戰略一直處於被動狀態。相比之下,領先的英偉達已經一騎絕塵,而AMD也在後面緊追不捨,直抄英特爾的老窩。

隨著英偉達的成功,下一代晶片研發方向更聚焦在如何深度結合AI模型上來,選擇不僅僅只有GPU,因為提高算力的高昂代價絕大部分要歸功於AI晶片,所以英偉達在模型訓練晶片端的領先地位無疑會遭受挑戰,英特爾、AMD、高通等企業開始摩拳擦掌,做好準備。

那麼,在AI晶片,會有下一個英偉達嗎?

01 AI晶片必須先過一道檻

按照部署位置,AI晶片可以分為雲端、終端和邊緣側;按照任務劃分又可以分為訓練晶片和推理晶片。雲端就是在資料中心進行模型訓練,晶片需要支撐大量的資料運算,終端和邊緣側對算力要求稍弱一些,但要求快速響應的能力和低功耗,英偉達霸佔了訓練晶片這一領域,不過推理方面不乏比GPU更合適的晶片。

效能各異的專用AI晶片包括GPU、ASIC、FPGA、NPU等,可以簡稱為XPU,名稱的不同反映了各自架構層面上的差異。專用AI晶片在所擅長的領域裡有匹配GPU的能力,雖然少了可擴充套件性,但在效能和算力上領先更通用的GPU,儘管後者能做更多的事情。

這就回到了當初CPU在機器學習領域被棄用的邏輯,將來是否會有一款新的晶片可以對GPU發起衝擊?

目前全球大廠們都尤愛造芯,不過通用晶片人家沒必要自己做,只會切合自己重要的業務方向來佈局。

比如谷歌的TPU採用了ASIC,只針對卷積神經網路的加速器,特斯拉的Dojo是專門用於FSD的機器視覺分析晶片,以及國內百度、阿里也花費大量精力在自研晶片上。

一直以來,專用處理器並未真正給GPU帶來過威脅,這主要與市場容量,資金投入,摩爾定律形成的正向迴圈有關。

根據IDC資料,21年中國AI晶片市場裡,GPU佔據89%的份額;NPU處理速度比GPU快上10倍,佔據9.6%的份額,ASIC和FPGA佔比較小,市場份額分別1%和0.4%。

過去三十年,臺積電、三星等晶圓代工廠的崛起塑造了分工專業化的趨勢,裝置和先進製程的技術進步允許像英偉達、高通等晶片設計企業一展身手,也讓蘋果、谷歌等科技大廠開始用晶片定義產品和服務,專用晶片設計的土壤是肥沃的,大家都是受益者。

在競爭對手看來,GPU並非專門為機器學習而設計的晶片,之所以能成功,主要在於結合框架軟體層形成的複雜生態,提高了晶片的通用性。

實際上,自2012年以來,每年頭部訓練模型算力需求按10倍在增長,一直在逼近摩爾定律下的算力極限。

而從11年Tesla M2090開始,資料中心產品GPU一直在更新迭代,先後推出Volta、Ampere、Hopper等針對高效能訓練計算和AI訓練的架構,保持每兩年推出一代新產品的速度,浮點算力也從7.8 TFLOPS增至30 TFLOPS,漲幅接近4倍。

最新的H100,甚至已經把大模型訓練的時間從一週縮短至一天。

基於英偉達在AI晶片領域的高份額,可以說,過去AI模型訓練的算力增長主要由英偉達的GPU系列所支撐,這形成了一個正向反饋,隨著晶片出貨規模的增長,攤平了英偉達晶片的開發成本。

相比較未來的算力需求,一款通用晶片的技術迭代最終也會逐漸放緩,專用處理器只有跑通這個正向迴圈,才有可能在成本上與通用晶片們並駕齊驅。

不過難度在於,專用處理器僅僅著力在細分市場,市場規模根本比不上通用市場,相對於通用晶片的每單位效能提升,往往需要花上更長的時間,或者更大的出貨量來攤薄成本,可是隨著AI在應用場景中加速滲透,未來AI晶片的開支也會大幅增長,專用AI晶片、 CPU、GPU有望成為三條並行的線。

根據Precedence Research,2022年全球AI晶片市場規模為168.6億美元,將以每年約30%的速度增長,預計到2032年達到約2274.8億美元。

02 三家分晉,如何分庭抗禮?

英偉達對算力的壟斷地位在如今大模型戰爭下加速強化,矛盾日益加劇,GPU採購需求超出臺積電和英偉達的預料,供應不足,價格便水漲船高,繼續迴圈。

國內外科技大廠們在選擇自研晶片上保持一致的態度,又或者,幫助其他晶片廠和英偉達競爭,刺激新的供給同時降低晶片成本。

上月初AMD盤中大漲12%,原因來自一則訊息指出,微軟正在與AMD合作,資助後者向AI晶片擴張,並與這家晶片製造商合作一款代號為Athena(雅典娜)的晶片,但之後微軟官方否認了這一訊息。

這讓人聯想到上世紀九十年代的“WINTEL”聯盟,互相成就了微軟在PC作業系統,以及英特爾在CPU的地位。此時的AMD,已經成為了英特爾市場份額最強有力的威脅。

去年計算機市場經受重創,企業伺服器和消費電子兩端的疲弱對CPU出貨量造成不小拖累,英特爾與AMD兩家公司均出現了30多年來最大的下滑,分別降低21%和19%。

雖然主業俱顯疲態,但行業的競爭格局卻再次發生了巨大變化。

據Passmark資料監測,在資料中心市場,去年AMD的份額猛增至20%,搶走了英特爾(2022年,70.77%)接近1成的份額,而截止今年1月2日,AMD重新逼近40%,回到了2004年的水平。

AMD之所以得以窮追不捨,一方面是藉助臺積電的力量,讓其產品組合不斷優化,用於資料中心的EPYC Milan處理器採用率提高,去年這項業務營收增長64%。

另一方面則與競爭對手糟糕的戰略決策有關。過去十年,一直保持領先地位的英特爾在CPU上的創新乏善可陳,產品力相對競爭對手一路下滑。

當初蘋果想要英特爾為初代iPhone開發手機CPU,CEO保羅·歐德寧因為報價太低迴絕,這位x86領頭羊錯估了移動端的機會。

除了戰略眼光不足,還有不斷跳票的產品推新計劃,英特爾是舊IDM時代的老頭,如今臺積電、三星領導著先進製程的迭代,是CPU這類通用晶片繼續升級的基座,英特爾本身工藝技術的掉隊反噬著產品的更新節奏,更多的是“擠牙膏”式的添頭。從2021年高點至今,其市值削去了一半不止。

反觀AMD,則一路拓寬產品品類,追逐高價效比的策略,先後收購了ATI,Xilinx,成為第一家同時拿下CPU+GPU+FPGA的晶片廠商。2018年AMD在PC端的CPU製程首次彎道超車,市場份額開始加速提升,2019年聯手臺積電率先躍入7nm,在伺服器端也實現製程超越,去年市值超過了英特爾。

前不久,AMD推出結合CPU+GPU雙架構的Instinct MI 300正式進軍AI訓練端,這款晶片在規格和效能直接對標了英偉達的Grace Hopper。

這是AMD管理層強調AI作為戰略重點後的重棋,與英偉達同時出租自家算力不同,AMD著力於構建具有競爭力的晶片矩陣,與其正面交鋒,或將從雲廠商的資料中心開始突破,預計今年四季度開始放量。

實際上,並不是這兩CPU巨頭打架,把英偉達晾在一邊,結果趕不上趟兒。

英特爾從2015年開始花巨資收購了一大批人工智慧公司,如Altera、Mobileye、Nervana等,結果並沒有給業務帶來多少幫助,更像是養著這些公司等著刮彩票。

英特爾也一直計劃推出一款能媲美英偉達的GPU,只是計劃一直跳票。

2021年,英特爾曾宣佈一款代號為“Ponte Vecchio”的旗艦GPU,用於資料中心,結果卻在交付上不斷拖延。作為繼任者,Falcon Shores GPU結合了x86 CPU和Xe GPU,也跳票到了2025年。

誠然,英偉達的成功並不只是硬體做得好,有別於英特爾過去硬體第一的路徑,英偉達GPU架構保持了兩年一代的速度演進,憑藉著通用的計算框架構築起了軟體生態壁壘。

晶片發展歷程中,定義標準的贏家往往強者恆強,要與英偉達分庭抗禮,價效比是必需砝碼,生態圈同樣關鍵。算力發展推動AI進步,還要倚仗這些廠商的競爭和互相超越。

在這些方面,無論是AMD、英特爾,還是其他的後來者大廠,都還有很長的路要走。

格隆匯宣告:文中觀點均來自原作者,不代表格隆匯觀點及立場。特別提醒,投資決策需建立在獨立思考之上,本文內容僅供參考,不作為任何實際操作建議,交易風險自擔。

本文來自微信公眾號“格隆匯APP”(ID:hkguruclub),作者:弗雷迪,36氪經授權釋出。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論