記憶力:簡介。為什麼現在要講?

本文為機器翻譯
展示原文

感覺內存股每天都在上漲。美光科技(Micron)是最大的內存廠商之一,僅去年一年股價就上漲了近三倍。許多投資者眼睜睜地看著類似的股票日復一日地上漲,等待回調的到來。然而,他們卻未能真正瞭解這些產品究竟是什麼。

在這篇文章中,我和尼古拉斯將用通俗易懂的方式,為大家解讀眼前的機遇。讓我們開始吧。

引言

那麼,記憶是什麼?它為什麼如此重要?

內存使計算機或設備能夠在執行臨時計算時存儲信息。這主要通過讀寫操作來實現。內存的​​每一層在讀寫速度、成本和容量方面都有不同的特性。

在人工智能領域,內存變得更加重要,因為模型需要同時處理海量數據。當我們使用聊天機器人、圖像生成器或推薦算法等工具時,內存會不斷地以高帶寬進出龐大的數據集。

人工智能模型越智能、功能越強大,就需要越多的內存才能有效運行。如果沒有強大的內存系統,大型語言模型和機器學習應用領域的進步就會停滯不前。

內存層次結構(存儲層與工作層)

為了更好地理解記憶,我們首先需要分解記憶的各個層次。

計算機將內存分為工作內存(系統執行計算時使用)和存儲內存(用於長期保存數據,但讀寫速度較慢)。這種劃分的原因是,高帶寬(讀寫速度快)的內存價格昂貴,而價格低廉的長期存儲內存帶寬較低(讀寫速度快)。

許多與內存相關的概念都可以歸結為芯片與處理單元之間的距離。距離越遠,吞吐量越慢。


1. 處理器寄存器和 CPU 高速緩存(SRAM):

它是什麼:這通常是整個系統中吞吐量最高的內存,因為它位於 XPU(XPU 指 CPU 或 GPU)內部或緊鄰其旁。它存儲處理器當前所需的少量數據。

它由以下部分組成: SRAM(直接構建在邏輯硅上的靜態存儲器)。

成本和尺寸:每比特成本極高,容量極小。

製造地點:與 CPU 在同一芯片上。

主要廠商:英特爾、AMD、蘋果


2. 物理內存(DRAM/RAM)

指定隨機存取存儲器/隨機存取存儲器

這是什麼:這是計算機的主工作內存,是運行程序所在的區域。這裡需要很高的吞吐量,因為任何延遲都會導致計算隊列的建立。

它由以下部分組成: DRAM 單元(每個比特一個晶體管 + 一個電容器)。

成本和大小:價格略貴,中等容量(GB)。

產地:主要產自韓國、臺灣和美國

主要製造商: SK海力士、三星電子、美光科技


3. 高帶寬內存(HBM)

專用DRAM

簡單來說,它是一種超高速的垂直堆疊式DRAM,放置在AI芯片旁邊。由於HBM的垂直堆疊特性,它具有更高的吞吐量,但同時也增加了製造工藝的複雜性。

它由以下部分組成:堆疊有硅通孔 (TSV) 的 DRAM 芯片。

成本和尺寸:非常昂貴,容量比 DRAM 小,但速度比 DRAM 快得多。

產地:臺灣和韓國,因為對包裝技術有較高要求(實物垂直整合)。

主要製造商: SK海力士、三星、美光

4. 固態存儲(NAND/SSD)

NAND 是一種非易失性閃存,無需電源即可存儲數據,用於 SSD、U盤和存儲卡等高密度存儲設備。

它是什麼(簡單來說):斷電時對文件、應用程序和數據進行長期存儲。

它由什麼構成:存儲電荷的 NAND 閃存單元。

成本和尺寸:每 GB 價格低廉,容量大(數百 GB 到 TB),吞吐量低於 HBM 和 DRAM,但通常足以滿足對延遲要求不高的計算工作負載。

產地:主要在亞洲(韓國、中國、日本)。

主要製造商:三星、SK海力士、閃迪、美光、鎧俠


5. 硬盤驅動器 (HDD)

它是什麼(簡單來說):用於廉價大容量存儲的傳統旋轉磁盤。

它由以下部分組成:磁性轉盤和機械部件。

成本和尺寸:非常便宜,體積龐大,吞吐量慢。

產地:亞洲

主要廠商:希捷、西部數據、東芝

內存距離處理器越近,速度就越快,體積就越小,價格也就越貴。人工智能將需求推向了金字塔頂端。這是因為GPU具有極強的並行計算能力,每秒可執行數萬億次計算

HBM 和 NAND

HBM 是最關鍵的內存層,因為它直接位於 AI GPU 旁邊,而 NAND 是“倉庫”存儲,用於保存數據集、模型檢查點和日誌。

在人工智能數據中心,基於NAND閃存的固態硬盤(SSD)將數據傳輸到DRAM/HBM,然後HBM再以足夠快的速度將數據提供給GPU,以確保計算的持續進行。LLM模型利用這種分層內存架構來確保所有存儲層得到最有效的利用。然而,最佳方案始終是儘可能地將計算任務放在靠近GPU的位置。

在過去幾年人工智能建設中,兩者都面臨著前所未有的需求。由於帶寬​​成為瓶頸,HBM 的需求呈爆炸式增長;而 SSD 的需求也在上升,因為數據輸入和輸出(訓練數據、檢索、推理日誌)持續增長。關於內存需求,一個常被忽視的事實是,智能體工作流具有遞歸特性,它們在調用其他智能體的過程中會消耗計算資源,而這些智能體又會調用更多智能體。因此,智能體活動可能導致需求規模超出人類預期的情況。

從歷史上看,DRAM 和 NAND 一直被投資者和整個市場視為大宗商品。這意味著供應受到嚴格監控,並根據需求進行調整。產能過剩會帶來嚴重後果,因為半導體晶圓廠的啟動成本高昂,持續運營成本也很高。正因如此,市場供應會逐步增加,以避免產能過剩。然而,隨著人工智能需求的爆炸式增長,各種形式的存儲器突然成為關鍵瓶頸,賦予存儲器廠商對客戶巨大的定價優勢。這種定價優勢使他們能夠獲得鉅額利潤,因為他們是人工智能供應鏈中的關鍵瓶頸。沒有內存的 GPU 將無法使用。沒有內存,任何計算都無法進行。為了理解他們為何以及如何保持定價優勢,下一節將探討他們所擁有的技術護城河。

記憶的辯護能力

存儲器廠商之所以能從商品供應商躍升為人工智能領域的霸主,關鍵在於它們在半導體制造工藝方面的先進技術。這些工藝可以分解為三個關鍵要素:

護城河在於如何在極小的利潤空間內,以極高的可靠性大規模生產數十億個微型單元。具體到HBM,則需要先進的DRAM技術和複雜的3D堆疊/封裝工藝(包括TSV、散熱片和中介層),而只有少數廠商能夠以高良率完成這些工藝,並且客戶必須在漫長的週期內對產品進行驗證。

正因如此,只有三家公司有資格參與這場競爭。當一家供應商率先推出下一代堆棧時,領導地位的轉變至關重要,因為這會使其在完善下一代產品的製造工藝方面獲得顯著優勢。此外,由於HBM與處理器共同封裝,且不像前幾代DRAM(屬於“商品”)那樣是同質化的,因此其價格也高於標準DRAM。

要打造一家能夠與現有廠商規模相匹敵的存儲器公司,需要超過二十年的專業經驗和超過500億美元的投資。中國的長江存儲(YMTC)在傳統DRAM製造工藝方面已經迎頭趕上,但在缺乏政府支持的情況下,難以實現高良率。此外,由於美國對材料和技術出口的限制,長江存儲也無法獲得更先進的半導體制造能力。而且,儘管存儲器屬於“硬件”,但其內部仍然包含芯片固件形式的軟件鏈,需要深度集成。中國或其他任何國有企業除了要應對其他挑戰外,還必須克服軟件深度鎖定問題。正因如此,存儲器公司在其生命週期的這個階段比其他任何階段都更具防禦優勢。

結束

原始計算能力的增長速度已經超過了內存傳輸數據的速度,這就是所謂的“內存牆”。芯片的運算速度可以快得驚人,但如果數據無法及時到達,它們就會停滯不前。

大量的時間和精力都花在了在內存和計算之間傳輸模型權重和激活值上,而不是數學運算本身,因此帶寬成為了限制因素。

HBM 是目前最好的解決方案,因為它將寬而快的內存直接放置在 GPU 旁邊,但它的容量和供應受到限制,因此內存最終決定了 AI 系統擴展的速度。

我們現在所看到的,是隻有不到 10 家公司擁有製造專業技術,可以開發為人工智能未來提供動力的存儲芯片。這不僅關乎生產力,而且隨著這些芯片能夠使下一代戰爭得以進行,國家安全也正逐漸成為問題。

如果你相信:
a) 人工智能已成為我們生活的一部分,並將長期存在。

b) 隨著時間的推移,人工智能的需求只會不斷增加。

那麼,未來就屬於那些已有四五十年曆史、生產“大宗商品”的公司,而這些大宗商品如今卻成了人工智能構建的核心瓶頸。它們強大的定價權已經使它們能夠開始敲詐供應鏈下游的許多公司,我們相信這種趨勢還會繼續下去,最終影響到客戶的利潤率。

世界正處於結構性變革的時期,而記憶很可能是這種新世界秩序最早的標誌之一。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
71
收藏
11
評論