整理:有新
在今天上午開幕的 CES 2025 上,英偉達創始人兼 CEO 黃仁勳帶來了一場里程碑式的主題演講,揭示 AI 與計算的未來。從生成 AI 的核心 Token 概念,到全新 Blackwell 架構 GPU 的發佈,再到 AI 驅動的數字化未來,這場演講將以跨領域的視角深刻影響整個行業。
1)從生成式 AI 到 Agentic AI:全新時代的序幕
Token 的誕生:作為生成 AI 的核心驅動力,token 將文字轉化為知識,為圖像注入生命,開啟了全新的數字表達方式。
AI 進化路徑:從感知 AI、生成 AI 到能夠推理、規劃、行動的 Agentic AI,AI 技術不斷跨越新高度。
Transformer 的革命:自 2018 年推出以來,這一技術重新定義了計算方式,徹底顛覆了傳統技術棧。
2)Blackwell GPU:突破性能極限
新一代 GeForce RTX 50 系列:基於 Blackwell 架構,擁有 920 億晶體管、4000 TOPS AI 性能和 4 PetaFLOPS 算力,是前代性能的三倍。
AI 與圖形的融合:首次實現可編程著色器與神經網絡的結合,推出神經紋理壓縮和材質著色技術,帶來驚豔的渲染效果。
普惠高性能:RTX 5070 筆記本以 $1299 的價格實現 RTX 4090 性能,推動高性能計算的普及。
3)AI 應用的多領域拓展
企業級 AI Agent:NVIDIA 提供工具如 Nemo 和 Llama Nemotron,幫助企業構建自主推理的數字員工,實現智能化管理與服務。
Physic AI:通過 Omniverse 和 Cosmos 平臺,AI 融入工業、自動駕駛和機器人領域,重新定義全球製造和物流。
未來計算場景:NVIDIA 正將 AI 從雲端帶到個人設備和企業內部,覆蓋從開發者到普通用戶的所有計算需求。
以下為黃仁勳本次演講的主要內容:
這是智慧的誕生之地,一種全新的工廠——生成 token 的發電機。它是 AI 的構建模塊,開啟了一個新領域,也邁出了進入非凡世界的第一步。token 將文字轉化為知識,為圖像注入生命;它們將創意變成視頻,幫助我們安全地導航任何環境;教會機器人像大師一樣移動,並激發我們用全新方式慶祝勝利。在我們最需要的時候, token 還能帶來內心的平靜。它們賦予數字意義,幫助我們更好地理解世界,預測潛在的危險,並尋找治療內在威脅的辦法。它可以讓我們的願景成真,修復我們失去的一切。
AI 的這一切開始於 1993 年,英偉達推出了第一款產品——NV1。我們想要創造出能夠實現普通計算機無法完成之事的電腦,這讓在 PC 中擁有遊戲機成為可能。隨後,1999 年,英偉達發明了可編程 GPU,開啟了超過 20 年的技術進步,現代計算機圖形學由此成為可能。六年後,我們推出 CUDA,通過豐富的算法表達 GPU 的可編程性。這項技術最初難以解釋,但到 2012 年, AlexNet 的成功驗證了 CUDA 的潛力,推動了 AI 的突破性發展。
自那時起, AI 以驚人的速度發展。從感知 AI 到生成式 AI,再到能夠感知、推理、規劃和行動的 Agentic AI, AI 的能力不斷提升。2018 年,谷歌推出 Transformer, AI 的世界真正起飛。Transformer 不僅徹底改變了 AI 的格局,也重新定義了整個計算領域。我們意識到,機器學習不僅僅是一個新的應用或商業機會,而是對計算方式的根本性革新。從手動編寫指令到用機器學習優化神經網絡,技術棧的每一層都發生了巨大的變化。
如今, AI 的應用已無處不在。無論是理解文字、圖像、聲音,還是翻譯氨基酸和物理學,它都能完成。幾乎所有的 AI 應用都可以歸結為三個問題:它學習了什麼模態的信息?翻譯成了什麼模態的信息?生成了什麼模態的信息?這種基本概念推動了 AI 驅動的每一個應用。
所有這些成就離不開 GeForce 的支持。GeForce 讓 AI 走向大眾,而現在, AI 正迴歸 GeForce。藉助實時光線追蹤技術,我們能夠以令人驚歎的效果渲染圖形。通過 DLSS, AI 甚至可以超越幀的生成,預測未來的畫面。3300 萬像素中僅有 200 萬像素是計算得出的,其餘的由 AI 預測生成。這種奇蹟般的技術,展現了 AI 的強大能力,讓計算更加高效,也讓我們看到了未來的無限可能。
這是為什麼現在發生瞭如此多令人驚歎的事情。我們利用 GeForce 推動了 AI 的發展,而現在, AI 正在徹底革新 GeForce。今天,我們宣佈下一代產品——RTX Blackwell 家族。讓我們一起來看看。
這是全新的 GeForce RTX 50 系列,基於 Blackwell 架構。這款 GPU 是一臺性能怪獸,擁有 920 億晶體管、4000 TOPS 的 AI 性能和 4 PetaFLOPS 的 AI 算力,比上一代 Ada 架構高出三倍。這一切都為了生成我剛才展示的那些令人驚歎的像素。它還具備 380 光線追蹤 Teraflops,為需要計算的像素提供儘可能美麗的畫質,同時還有 125 著色 Teraflops。這款顯卡採用了 Micron 的 G7 顯存,速度達到 每秒 1.8TB,是上一代的兩倍性能。
我們現在可以將 AI 工作負載與計算機圖形工作負載結合起來,這一代產品的一個非凡特性是可編程著色器也可以處理神經網絡。這使得我們發明了 神經紋理壓縮 和 神經材質著色。這些技術通過 AI 學習紋理和壓縮算法,最終生成了只有 AI 才能實現的驚豔圖像效果。
即使在機械設計方面,這款顯卡也是一個奇蹟。它採用了雙風扇設計,整個顯卡就像一個巨大的風扇,內部的電壓調節模塊是最先進的。如此卓越的設計完全歸功於工程團隊的努力。
接下來是性能對比。大家熟悉的 RTX 4090,售價 $1599,是家用 PC 娛樂中心的核心投資。而現在,RTX 50 系列提供更高性能的同時,起價僅為 $549,從 RTX 5070 到 RTX 5090,性能是 RTX 4090 的兩倍。
更令人驚歎的是,我們將這種高性能 GPU 放進了筆記本中。RTX 5070 筆記本售價 $1299,卻具備 RTX 4090 的性能。這種設計結合了 AI 和計算機圖形技術,讓高能效和高性能得以實現。
未來的計算機圖形學將是 神經渲染—— AI 與計算機圖形的融合。Blackwell 系列甚至可以在厚度僅 14.9 毫米的筆記本中實現,從 RTX 5070 到 RTX 5090 的全系列產品都可以適配超薄筆記本。
GeForce 推動了 AI 的普及,而現在 AI 反過來徹底變革了 GeForce。這是技術與智能的相互促進,我們正在邁向更高的境界。
AI 的三種 Scalling Law
接下來,讓我們談談 AI 的發展方向。
1)預訓練 Scalling Law
AI 行業正在加速擴展,推動這一進程的是一種被稱為「Scalling Law」的強大模型。這一經驗法則由研究人員和產業界反覆驗證,表明訓練數據的規模越大、模型的規模越大、計算能力投入越多,模型的能力也會越強。
數據的增長速度正在以指數級加快。據估計,在未來幾年,人類每年生產的數據量將超過此前人類歷史上生產的總和。這些數據正變得多模態化,包括視頻、圖像和聲音等形式。這些海量數據可以用來訓練 AI 的基礎知識體系,為 AI 奠定堅實的知識基礎。
2)後訓練 Scalling Law
除此之外,還有另外兩種 Scalling Law 正在興起。
第二種 Scalling Law 是「後訓練 Scalling Law」,它涉及技術如強化學習和人類反饋。通過這種方式,AI 根據人類的查詢生成答案,並從人類的反饋中不斷改進。這種強化學習系統通過高質量的提示,幫助 AI 精進特定領域的技能,例如更擅長解決數學問題或進行復雜推理。
AI 的未來,不僅僅是感知與生成,而是一個不斷自我完善、突破邊界的過程。它就像擁有一位導師或教練,在你完成任務後提供反饋。通過測試、反饋和自我改進,AI 也可以通過類似的強化學習和反饋機制進步。這種後訓練階段的強化學習與合成數據生成技術相結合,類似於自我練習的過程。AI 可以面對複雜且具有驗證性的難題,例如證明定理或解決幾何問題,通過強化學習不斷優化自己的答案。這種後訓練雖然需要龐大的計算能力,但最終能夠創造出非凡的模型。
3)測試時間 Scalling Law
測試時間 Scalling Law 也逐漸浮現。這一法則在 AI 實際被使用時展現出獨特的潛力。AI 可以在推理時動態分配資源,不再侷限於參數優化,而是專注於計算分配,以產生所需的高質量答案。
這個過程類似於推理思考,而非直接推斷或一次性回答。AI 可以將問題拆解為多個步驟,生成多個解決方案並進行評估,最終選擇最優方案。這種長時間推理在提升模型能力方面效果顯著。
我們已經看到這種技術的演變,從 ChatGPT 到 GPT-4,再到如今的 Gemini Pro,所有這些系統都在經歷預訓練、後訓練和測試時間擴展的逐步發展。實現這些突破需要巨大的計算能力,而這正是 英偉達 Blackwell 架構的核心價值。
Blackwell 架構最新介紹
Blackwell 系統正在全面生產中,其性能令人驚歎。如今,每家雲服務提供商都在部署這些系統,它們由全球 45 家工廠生產製造,支持多達 200 種配置,包括液冷、風冷、x86 架構以及 英偉達 Grace CPU 版本等。
其核心組件 NVLink 系統本身重量高達 1.5 噸,擁有 60 萬個零件,相當於 20 輛汽車的複雜程度,背後連接了 2 英里的銅線與 5000 根電纜。整個製造過程極其複雜,但目標是為了滿足對計算需求不斷擴大的需求。
相比上一代架構,Blackwell 在每瓦性能上提高了 4 倍,在 每美元性能 上提高了 3 倍。這意味著,在相同成本下,訓練模型的規模可以增加 3 倍,而這些改進背後的關鍵是生成 AI token 。這些 token 被廣泛應用於 ChatGPT、Gemini 和各種 AI 服務中,是未來計算的基礎。
在此基礎上,英偉達推動了全新的計算模式:神經渲染,將 AI 與計算機圖形學完美融合。Blackwell 架構下的 72 塊 GPU 組成了全球最大的單芯片系統,提供了高達 1.4 ExaFLOPS 的 AI 浮點性能,其內存帶寬達到驚人的 1.2 PB/s,相當於全球所有互聯網流量的總和。這種超級計算能力,使得 AI 能夠處理更復雜的推理任務,同時顯著降低成本,為更高效的計算奠定了基礎。
AI Agent 系統與生態
展望未來,AI 的推理過程不再是簡單的單步響應,而是更接近於「內部對話」。未來的 AI 不僅會生成答案,還會進行反思、推理並不斷優化。隨著 AI token 生成速率的提高和成本的降低,AI 的服務質量將顯著提升,滿足更廣泛的應用需求。
為幫助企業構建具有自主推理能力的 AI 系統,英偉達提供了三個關鍵工具:英偉達 NeMo、AI 微服務 和 加速庫。通過將複雜的 CUDA 軟件和深度學習模型打包成容器化服務,企業可以在任意雲平臺部署這些 AI 模型,快速開發面向特定領域的 AI Agent ,例如支持企業管理的服務工具或用戶交互的數字員工。
這些模型為企業開闢了新的可能性,不僅降低了 AI 應用的開發門檻,還推動了整個行業在 Agentic AI(自主 AI)的方向上邁出堅實的一步。未來的 AI 將成為數字員工,可以輕鬆集成到 SAP、ServiceNow 等企業工具中,在不同環境中為客戶提供智能服務。這是 AI 擴展的下一個里程碑,也是 英偉達技術生態系統的核心願景。
訓練評估系統。未來,這些 AI Agent 人本質上是與員工並肩工作、為您完成任務的數字化勞動力。因此,引入這些專業化的 Agent 人到您的公司,就像為新員工辦理入職一樣。我們提供不同的工具庫,幫助這些 AI Agent 人學習公司獨特的語言、詞彙、業務流程以及工作方式。您需要向他們提供工作成果的示例,他們會嘗試生成,然後您可以提供反饋、進行評估等等。同時,您也會設置限制,比如明確他們不能執行哪些操作、不能說什麼,並控制他們可以訪問的信息。這整個數字員工流程被稱為 Nemo。某種程度上,每個公司的 IT 部門將成為 AI Agent 人的 HR 部門。
如今,IT 部門管理並維護大量軟件;未來,他們將管理、培養、入職並改進大量數字 Agent 人,為公司提供服務。因此,IT 部門將逐漸演變為 AI Agent 人的 HR 部門。
此外,我們提供許多開源的藍圖供生態系統使用。用戶可以自由修改這些藍圖。我們為各種不同類型的 Agent 人提供了藍圖。今天,我們也宣佈了一件非常酷且聰明的事情:我們推出了一個基於 Llama 的全新模型家族,即 英偉達 Llama Nemo Tron 語言基礎模型系列。
Llama 3.1 是一個現象級的模型。Meta 的 Llama 3.1 下載量達到約 350,650,000 次,並衍生出了大約 60,000 種其他模型。這是推動幾乎所有企業和行業開始研究 AI 的核心原因之一。我們意識到 Llama 模型可以為企業用例進行更好的微調。利用我們的專業知識和能力,我們將其微調為 Llama Nemotron 開放模型套件。
這些模型分為不同大小:小型模型響應快速;主流的超級模型 Super Llama Nemotron 是常規用途模型;而超大型模型 Ultra Model 則可作為教師模型,用於評估其他模型、生成答案並決定其質量,或用作知識蒸餾模型。所有這些模型現已上線。
這些模型表現卓越,在對話、指令和信息檢索等領域的排行榜上名列前茅,非常適合全球範圍內的 AI Agent 功能。
我們與生態系統的合作也十分緊密,例如與 ServiceNow、SAP、Siemens 在工業 AI 方面的合作。Cadence 和 Perplexity 等公司也在開展出色的項目。Perplexity 顛覆了搜索領域,Codium 則服務於全球 3,000 萬軟件工程師。AI 助手將極大提高軟件開發人員的生產力,這是 AI 服務的下一個巨大應用領域。全球有 10 億知識工作者,AI Agent 可能是下一個機器人行業,潛力達到數萬億美元。
AI Agent 藍圖
接下來展示一些與合作伙伴共同完成的 AI Agent 藍圖。
AI Agent 是新的數字勞動力,能夠協助或代替人類完成任務。英偉達的 Agentic AI 構建模塊、NEM 預訓練模型和 Nemo 框架,幫助組織輕鬆開發並部署 AI Agent 。這些 Agent 可被訓練為領域特定的任務專家。
以下是四個示例:
研究助理 Agent :能夠閱讀複雜文件,如講座、期刊、財務報告等,並生成交互式播客,便於學習;
軟件安全 AI Agent :幫助開發者持續掃描軟件漏洞,並提示採取相應措施;
虛擬實驗室 AI Agent :加速化合物設計與篩選,快速找到潛在藥物候選者;
視頻分析 AI Agent :基於 英偉達 Metropolis 藍圖,分析來自數十億攝像頭的數據,生成交互式搜索、摘要和報告。例如,監控交通流量、設施流程,提供改進建議等;
物理 AI 時代的到來
我們希望將 AI 從雲端帶到每個角落,包括公司內部和個人 PC。英偉達正努力將 Windows WSL 2(Windows 子系統)轉變為支持 AI 的首選平臺。這將使開發者和工程師更便捷地利用 英偉達的 AI 技術棧,包括語言模型、圖像模型、動畫模型等。
此外,英偉達推出了 Cosmos,首個物理世界基礎模型開發平臺,專注於理解物理世界的動態特性,例如重力、摩擦、慣性、空間關係、因果關係等。它可以生成符合物理規律的視頻、場景,廣泛應用於機器人、工業 AI 和多模態語言模型的訓練與驗證。
Cosmos 通過連接 英偉達 Omniverse 提供物理仿真,生成真實可信的模擬結果。這種結合是機器人和工業應用開發的核心技術。
英偉達的工業戰略基於三個計算系統:
用於訓練 AI 的 DGX 系統;
部署 AI 的 AGX 系統;
數字孿生系統,用於強化學習和 AI 優化;
通過這三個系統的協同工作,英偉達推動了機器人和工業 AI 的發展,構建了未來的數字化世界與其說這是一個三體問題,我們有一個「三計算機」解決方案。
英偉達的機器人願景讓我給您展示三個例子。
1)工業可視化的應用
目前,全球有數百萬工廠和數十萬個倉庫,它們構成了價值 50 萬億美元製造業的骨幹。未來,這一切都需要實現軟件定義和自動化,並融入機器人技術。我們與全球領先的倉庫自動化解決方案提供商 Keon,以及全球最大的專業服務提供商 Accenture 合作,專注於數字化製造,共同創造一些非常特別的解決方案。我們的市場推廣方式與其他軟件和技術平臺類似,通過開發者和生態系統合作伙伴進行,並且越來越多的生態夥伴接入了 Omniverse 平臺。這是因為每個人都希望可視化工業的未來。在這 50 萬億美元的全球 GDP 中,有如此多的浪費,也有如此多的自動化機會。
來看 Keon 和 Accenture 與我們合作的這個示例:
Keon(供應鏈解決方案公司)、Accenture(全球專業服務領軍者)和 英偉達正將物理 AI 引入價值萬億美元的倉庫和配送中心市場。管理高效的倉庫物流需要應對複雜的決策網絡,這些決策受到不斷變化的變量影響,例如每日及季節性需求變化、空間限制、勞動力供應,以及多樣化機器人和自動化系統的整合。今天,要預測物理倉庫的運營關鍵績效指標(KPIs)幾乎是不可能的。
為了解決這些問題,Keon 正在採用 Mega(一個 英偉達 Omniverse 藍圖)來構建工業數字孿生,以測試和優化機器人車隊。首先,Keon 的倉庫管理解決方案將任務分配給數字孿生中的工業 AI 大腦,例如將貨物從緩衝區位置移動到穿梭存儲解決方案。機器人車隊在 Omniverse 中的物理倉庫模擬環境中,通過感知和推理執行任務,規劃下一步動作並採取行動。數字孿生環境使用傳感器模擬,讓機器人大腦可以看到任務執行後的狀態,並決定接下來的動作。在 Mega 的精確追蹤下,整個循環持續進行,同時測量操作 KPI,如吞吐量、效率和利用率,所有這些都在對物理倉庫進行改動之前完成。
藉助 英偉達的合作,Keon 和 Accenture 正在重新定義工業自治的未來。
未來,每個工廠都將擁有一個數字孿生,這個數字孿生與實際工廠完全同步。您可以利用 Omniverse 和 Cosmos 生成大量未來場景,AI 將決定最優的 KPI 場景,並將其作為實際工廠部署的約束條件和 AI 編程邏輯。
2)自動駕駛汽車
自動駕駛革命已經到來。經過多年的發展,無論是 Waymo 還是 Tesla 的成功,都證明了自動駕駛技術的成熟。我們的解決方案為這一行業提供了三種計算機系統:用於訓練 AI 的系統(如 DGX 系統)、用於模擬測試和生成合成數據的系統(如 Omniverse 和 Cosmos),以及車內的計算機系統(如 AGX 系統)。全球幾乎所有主要汽車公司都在與我們合作,包括 Waymo、Zoox、Tesla,以及世界最大的電動車公司 BYD。還有即將推出創新車型的 Mercedes、Lucid、Rivian、小米和沃爾沃等公司。Aurora 則正在使用 英偉達技術開發自動駕駛卡車。
每年有 1 億輛汽車製造,全球道路上有 10 億輛汽車行駛,每年行駛總里程高達萬億英里。這些將逐漸實現高度自動化或完全自動化。這一行業預計將成為首個價值數萬億美元的機器人行業。
今天,我們宣佈推出下一代車載計算機 Thor。它是一個通用機器人計算機,能夠處理攝像頭、高分辨率雷達、激光雷達等傳感器的大量數據。Thor 是目前行業標準 Orin 的升級版,計算能力是其 20 倍,現已全面量產。同時,英偉達的 Drive OS 是首個被認證達到功能安全最高標準(ISO 26262 ASIL D)的 AI 計算機操作系統。
自動駕駛數據工廠
英偉達利用 Omniverse AI 模型和 Cosmos 平臺創建自動駕駛數據工廠,通過合成駕駛場景大幅擴展訓練數據。這包括:
OmniMap:融合地圖和地理空間數據,構建可駕駛的 3D 環境;
神經重建引擎:利用傳感器日誌生成高保真的 4D 仿真環境,併為訓練數據生成場景變體;
Edify 3DS:從資產庫搜索或生成新的資產,創建用於仿真的場景。
通過這些技術,我們將幾千次的駕駛場景擴展為數十億英里的數據,用於更安全、更先進的自動駕駛系統的開發。
3)通用機器人
通用機器人的時代即將到來。推動這一領域突破的關鍵在於訓練。對於人形機器人來說,模仿數據的獲取相對困難,但 英偉達的 Isaac Groot 提供瞭解決方案。它通過模擬生成海量數據集,並結合 Omniverse 和 Cosmos 的多宇宙仿真引擎,進行政策訓練、驗證和部署。
例如,開發者可以通過 Apple Vision Pro 遠程操作機器人,捕捉數據而無需實體機器人,並在無風險環境中教學任務動作。通過 Omniverse 的領域隨機化和 3D 到真實場景擴展功能,生成指數級增長的數據集,為機器人學習提供海量資源。
總之,無論是工業可視化、自動駕駛,還是通用機器人,英偉達的技術正引領物理 AI 和機器人領域的未來變革。
最後,我還有一個重要的內容想展示,所有這些都離不開我們十年前在公司內部啟動的一個名為 Project Digits 的項目,完整名稱為 Deep Learning GPU Intelligence Training System(深度學習 GPU 智能訓練系統),簡稱 Digits。
在正式發佈之前,我們對 DGX 進行了調整,使其與公司內部的 RTX、AGX、OVX 以及其他系列產品和諧一致。DGX1 的問世真正改變了 AI 的發展方向,而這也是 英偉達對 AI 發展的一個里程碑。
DGX1 的革命性
DGX1 的初衷是為研究人員和初創企業提供開箱即用的 AI 超級計算機。想象一下,以往的超級計算機需要用戶建造專屬設施,設計和打造複雜的基礎設施,才能實現其存在。而 DGX1 則是一臺專門為 AI 開發設計的超級計算機,無需複雜操作,開箱即可使用。
我還記得,2016 年我將第一臺 DGX1 交付給一家初創公司—— OpenAI。當時,埃隆·馬斯克(Elon Musk)、伊利亞·蘇茨科維爾(Ilya Sutskever)以及 英偉達的許多工程師都在場,我們共同慶祝 DGX1 的到來。這臺設備顯著推動了 AI 計算的發展。
如今, AI 已經無處不在。不僅限於研究機構和初創企業實驗室,正如我一開始提到的, AI 已經成為一種全新的計算方式和軟件開發方式。每一位軟件工程師、創意藝術家,甚至是使用電腦工具的普通用戶,都需要一個 AI 超級計算機。但我一直希望 DGX1 能夠更小一些。
最新 AI 超級計算機
以下是 英偉達最新的 AI 超級計算機。它仍然屬於 Project Digits,目前我們還在尋找更好的命名,歡迎大家提供建議。這是一臺真正令人驚歎的設備。
這款超級計算機可以運行 英偉達的完整 AI 軟件棧,包括 DGX Cloud。它既可以用作雲端超級計算機,也可以作為一臺高性能的工作站,甚至是放在桌面上的分析工作站。最重要的是,它基於我們秘密開發的一款新芯片,代號 GB110,這是我們製造的最小型 Grace Blackwell。
我手裡有一塊芯片,給大家展示一下它的內部設計。這款芯片是與全球領先的 SoC 公司 聯發科(MediaTek) 合作開發的。該 CPU SoC 專為 英偉達定製,使用 NVLink 芯片對芯片互連技術連接到 Blackwell GPU。這個小型芯片現在已經全面投產。我們預計這款超級計算機將在 5 月 左右正式上市
我們甚至提供了「雙倍算力」的配置,可以將這些設備通過 ConnectX 連接在一起,支持 GPU 直通(GPUDirect)技術。它是一套完整的超級計算解決方案,能夠滿足 AI 開發、分析工作和工業應用的各種需求。
此外,還宣佈了三款全新 Blackwell 系統的芯片量產、世界首個物理 AI 基礎模型以及三大機器人領域的突破 —— 自主 AI Agent 機器人、人形機器人和自動駕駛汽車。