您需要了解 Nvidia 在 2025 年 CES 上發佈的 AI 新品

avatar
Decrypt
01-08
本文為機器翻譯
展示原文
以下是簡體中文翻譯:

在2024年創紀錄之後,英偉達正以轟動的方式開啟2025年,推出一系列產品,可能鞏固其在AI開發和遊戲領域的主導地位。

英偉達CEO黃仁勳在拉斯維加斯的CES上展示了從個人AI超級計算機到下一代遊戲顯示卡的各種新硬體和軟體產品。

英偉達最大的公告:Project DIGITS,這是一臺3000美元的個人AI超級計算機,將一個PetaFlop的計算能力整合到一臺桌面尺寸的裝置中。

這臺機器採用了新的—直到現在還是秘密的—GB10 Grace Blackwell Superchip,可以處理高達2000億引數的AI模型,同時只需要標準電源即可執行。

對於更重的工作負載,使用者可以連線兩臺裝置來處理高達4050億引數的模型。

對比來看,最大的Llama 3.2模型,即Meta最先進的開源LLM,有4050億引數,無法在消費級硬體上執行。

到目前為止,這需要大約8個英偉達A100/H100 Superchip,每個晶片的成本約為3萬美元,總計超過24萬美元的處理硬體。

而兩臺英偉達的新款消費級AI超級計算機只需6000美元就能運行同樣的量化模型。

"AI將成為每個行業每個應用程式的主流。有了Project DIGITS,Grace Blackwell Superchip將惠及數百萬開發者,"英偉達CEO黃仁勳在一篇官方部落格文章中說。"將AI超級計算機放在每個資料科學家、AI研究人員和學生的桌面上,賦予他們參與和塑造AI時代的能力。"

對於熱愛技術細節的人來說,GB10晶片代表了一項重大的工程成就,這是與聯發科的合作成果。

這款系統晶片將英偉達最新的GPU架構與20個高能效ARM核心透過NVLink-C2C互連結合在一起。

每個DIGITS單元都配備有128GB的統一記憶體和高達4TB的NVMe儲存。再次對比,目前最強大的GPU只有約24GB的視訊記憶體(執行AI模型所需的記憶體),而H100 Superchip起步就是80GB的視訊記憶體。

公司正在爭相部署AI代理,英偉達知道這一點,這可能就是為什麼它開發了Nemotron,這是一個新的模型系列,有三種尺寸,並宣佈今天擴充套件了兩個新模型:Nvidia NIIM用於影片總結和理解,Nvidia Cosmos為Nemotron賦予視覺能力—理解視覺指令的能力。

到目前為止,這些LLM只是基於文字的。然而,這些模型在聊天、函式呼叫、編碼和數學任務方面表現出色。

它們可透過Hugging Face和英偉達的網站獲得,企業可透過該公司的AI Enterprise軟體平臺獲得訪問許可權。

對比來看,在LLM Arena中,英偉達的Llama Nemotron 70b的排名高於Meta開發的原始Llama 405b。它也擊敗了不同版本的Claude、Gemini Advanced、Grok-2 mini和GPT-4o。

英偉達的代理推動現在也與基礎設施有關。該公司宣佈與主要的代理技術提供商LangChain、LlamaIndex和CrewAI建立合作伙伴關係,在英偉達AI Enterprise上構建藍圖。

這些現成的部署模板解決了特定任務,使開發人員更容易構建高度專業化的代理。

一個新的PDF到播客的藍圖旨在與谷歌的NotebookLM競爭,而另一個藍圖則有助於構建影片搜尋和摘要代理。開發人員可以透過新的Nvidia Launchables平臺測試這些藍圖,該平臺支援一鍵式原型製作和部署。

英偉達將遊戲公告留到最後,推出了備受期待的GeForce RTX 5000系列。旗艦RTX 5090擁有920億個電晶體,每秒提供3,352萬億AI運算,是當前RTX 4090的兩倍效能。整個系列都採用了第五代Tensor Cores和第四代RT Cores。

新顯示卡引入了DLSS 4,可以使用AI生成多個幀來提高幀率高達8倍。"Blackwell,AI的引擎,已經來到PC遊戲玩家、開發者和創意人士手中,"黃仁勳說,"融合了AI驅動的神經渲染和光線追蹤,Blackwell是自25年前我們引入可程式設計著色器以來計算機圖形學最重大的創新。"

新顯示卡還採用了變換器模型進行超解析度,承諾提供高度逼真的圖形和更高的價效比—不過價格並不便宜:RTX 5070為549美元,5070 Ti為749美元,5080為999美元,5090為1999美元。

如果你沒有這麼多錢,又想玩遊戲,也不用擔心。

AMD今天也宣佈了Radeon RX 9070系列。這些顯示卡採用了新的RDNA 4架構,使用4nm製造工藝,並配備了專用的AI加速器來與英偉達的Tensor Cores競爭。

雖然具體引數仍未公開,但AMD最新的Ryzen AI晶片已經達到了50 TOPS的峰值效能。

遺憾的是,由於英偉達的CUDA技術,英偉達仍然是AI應用的王者。

為了應對這一點,AMD已經與惠普和華碩建立了系統集成合作夥伴關係,並且2025年將有100多個企業平臺品牌使用AMD Pro技術。

Radeon顯示卡預計將於2025年第一季度上市,這將在遊戲和AI加速領域為英偉達帶來有趣的競爭。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論