您需要了解 Nvidia 在 2025 年 CES 上发布的 AI 新品

avatar
Decrypt
01-08
本文为机器翻译
展示原文
以下是简体中文翻译:

在2024年创纪录之后,英伟达正以轰动的方式开启2025年,推出一系列产品,可能巩固其在AI开发和游戏领域的主导地位。

英伟达CEO黄仁勋在拉斯维加斯的CES上展示了从个人AI超级计算机到下一代游戏显卡的各种新硬件和软件产品。

英伟达最大的公告:Project DIGITS,这是一台3000美元的个人AI超级计算机,将一个PetaFlop的计算能力集成到一台桌面尺寸的设备中。

这台机器采用了新的—直到现在还是秘密的—GB10 Grace Blackwell Superchip,可以处理高达2000亿参数的AI模型,同时只需要标准电源即可运行。

对于更重的工作负载,用户可以连接两台设备来处理高达4050亿参数的模型。

对比来看,最大的Llama 3.2模型,即Meta最先进的开源LLM,有4050亿参数,无法在消费级硬件上运行。

到目前为止,这需要大约8个英伟达A100/H100 Superchip,每个芯片的成本约为3万美元,总计超过24万美元的处理硬件。

而两台英伟达的新款消费级AI超级计算机只需6000美元就能运行同样的量化模型。

"AI将成为每个行业每个应用程序的主流。有了Project DIGITS,Grace Blackwell Superchip将惠及数百万开发者,"英伟达CEO黄仁勋在一篇官方博客文章中说。"将AI超级计算机放在每个数据科学家、AI研究人员和学生的桌面上,赋予他们参与和塑造AI时代的能力。"

对于热爱技术细节的人来说,GB10芯片代表了一项重大的工程成就,这是与联发科的合作成果。

这款系统芯片将英伟达最新的GPU架构与20个高能效ARM核心通过NVLink-C2C互连结合在一起。

每个DIGITS单元都配备有128GB的统一内存和高达4TB的NVMe存储。再次对比,目前最强大的GPU只有约24GB的显存(运行AI模型所需的内存),而H100 Superchip起步就是80GB的显存。

公司正在争相部署AI代理,英伟达知道这一点,这可能就是为什么它开发了Nemotron,这是一个新的模型系列,有三种尺寸,并宣布今天扩展了两个新模型:Nvidia NIIM用于视频总结和理解,Nvidia Cosmos为Nemotron赋予视觉能力—理解视觉指令的能力。

到目前为止,这些LLM只是基于文本的。然而,这些模型在聊天、函数调用、编码和数学任务方面表现出色。

它们可通过Hugging Face和英伟达的网站获得,企业可通过该公司的AI Enterprise软件平台获得访问权限。

对比来看,在LLM Arena中,英伟达的Llama Nemotron 70b的排名高于Meta开发的原始Llama 405b。它也击败了不同版本的Claude、Gemini Advanced、Grok-2 mini和GPT-4o。

英伟达的代理推动现在也与基础设施有关。该公司宣布与主要的代理技术提供商LangChain、LlamaIndex和CrewAI建立合作伙伴关系,在英伟达AI Enterprise上构建蓝图。

这些现成的部署模板解决了特定任务,使开发人员更容易构建高度专业化的代理。

一个新的PDF到播客的蓝图旨在与谷歌的NotebookLM竞争,而另一个蓝图则有助于构建视频搜索和摘要代理。开发人员可以通过新的Nvidia Launchables平台测试这些蓝图,该平台支持一键式原型制作和部署。

英伟达将游戏公告留到最后,推出了备受期待的GeForce RTX 5000系列。旗舰RTX 5090拥有920亿个晶体管,每秒提供3,352万亿AI运算,是当前RTX 4090的两倍性能。整个系列都采用了第五代Tensor Cores和第四代RT Cores。

新显卡引入了DLSS 4,可以使用AI生成多个帧来提高帧率高达8倍。"Blackwell,AI的引擎,已经来到PC游戏玩家、开发者和创意人士手中,"黄仁勋说,"融合了AI驱动的神经渲染和光线追踪,Blackwell是自25年前我们引入可编程着色器以来计算机图形学最重大的创新。"

新显卡还采用了变换器模型进行超分辨率,承诺提供高度逼真的图形和更高的性价比—不过价格并不便宜:RTX 5070为549美元,5070 Ti为749美元,5080为999美元,5090为1999美元。

如果你没有这么多钱,又想玩游戏,也不用担心。

AMD今天也宣布了Radeon RX 9070系列。这些显卡采用了新的RDNA 4架构,使用4nm制造工艺,并配备了专用的AI加速器来与英伟达的Tensor Cores竞争。

虽然具体参数仍未公开,但AMD最新的Ryzen AI芯片已经达到了50 TOPS的峰值性能。

遗憾的是,由于英伟达的CUDA技术,英伟达仍然是AI应用的王者。

为了应对这一点,AMD已经与惠普和华硕建立了系统集成合作伙伴关系,并且2025年将有100多个企业平台品牌使用AMD Pro技术。

Radeon显卡预计将于2025年第一季度上市,这将在游戏和AI加速领域为英伟达带来有趣的竞争。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论