英伟达发布 Rubin:六款全新芯片助力下一代人工智能超级计算机

本文为机器翻译
展示原文
英伟达发布 Rubin:六款全新芯片助力下一代人工智能超级计算机

英伟达(NVIDIA)在2026年国际消费电子展(CES 2026)上发布了Rubin平台,这是一款由六颗全新芯片组成的一体化人工智能超级计算机,其训练计算能力是Blackwell系列的五倍。该平台旨在为构建、部署和保护大规模人工智能系统树立新的标杆,同时最大限度地降低成本,以支持人工智能技术的更广泛应用。

Rubin平台之所以能够实现卓越性能,得益于其六大组件的紧密协同设计:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6交换机、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU和NVIDIA Spectrum-6以太网交换机。这种集成式方案能够缩短训练时间并降低推理令牌成本。

Rubin 推出了五项关键创新,包括新一代 NVLink 互连技术、Transformer 引擎、机密计算、RAS 引擎和 NVIDIA Vera CPU。与 Blackwell 平台相比,这些进步使得智能体 AI、高级推理和大规模混合专家 (MoE) 模型推理的成本降低了高达十倍。该系统只需四分之一的 GPU 即可训练 MoE 模型,从而进一步加速 AI 的普及应用。

预计领先的人工智能实验室、云服务提供商、硬件制造商和初创公司将部署该平台,其中包括亚马逊网络服务 (AWS)、Anthropic、Black Forest Labs、思科、Cohere、CoreWeave、Cursor、戴尔科技、谷歌、Harvey、HPE、Lambda、联想、Meta、微软、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、Oracle 云基础设施 (OCI)、Perplexity、Runway、Supermicro、Thinking Machines Lab 和 xAI。

揭秘面向人工智能工厂的AI原生存储和软件定义基础设施

NVIDIA Rubin 推出了原生 AI 存储和安全的软件定义基础架构,旨在高效支持大规模 AI 工作负载。NVIDIA 推理上下文内存存储平台 (Inference Context Memory Storage Platform) 由 BlueField-4 提供支持,可快速共享和重用键值缓存数据,从而提高多轮代理 AI 应用的吞吐量和能效。BlueField-4 还包含高级安全可信资源架构 (ASTRA),为裸机和多租户 AI 环境中的安全配置和隔离提供单一可信的控制点。

该平台提供多种配置,包括集成了 72 个 Rubin GPU、36 个 Vera CPU、NVLink 6、ConnectX-9 SuperNIC 和 BlueField-4 DPU 的 Vera Rubin NVL72,以及连接 8 个 Rubin GPU 以支持基于 x86 的生成式 AI 平台的 HGX Rubin NVL8。NVIDIA DGX SuperPOD 作为大规模部署 Rubin 系统的参考架构,整合了计算、网络和管理软件。

Spectrum-6 和 Spectrum-X 以太网平台提供新一代网络和存储解决方案,采用共封装光器件、AI 优化架构和高速 200G SerDes 通信。这些创新显著提升了可靠性、能效和可扩展性,使基于 Rubin 的 AI 工厂能够在多个站点以统一环境运行,并支持未来百万 GPU 的基础设施。

NVIDIA Rubin 已全面投入生产,准备部署到云端和人工智能实验室。

新平台已全面投入生产,基于 Rubin 的系统预计将于 2026 年下半年通过合作伙伴推出。包括 AWS、Google Cloud、Microsoft 和 OCI 在内的主要云服务提供商,以及 CoreWeave、Lambda、Nebius 和 Nscale 等 NVIDIA 云合作伙伴,都是首批部署 Rubin 实例的厂商。Microsoft 计划将 NVIDIA Vera Rubin NVL72 机架级系统集成到下一代 AI 数据中心,包括未来的 Fairwater AI 超级工厂,从而为企业、研究和消费应用的高级训练和推理工作负载奠定基础。

CoreWeave 将把 Rubin 系统集成到其 AI 云平台中,支持多种架构,并针对训练、推理和智能体 AI 工作负载优化性能。思科、戴尔、HPE、联想和超微预计也将推出基于 Rubin 产品的服务器。包括 Anthropic、Cohere、OpenAI、Meta 等在内的领先 AI 实验室正在采用 Rubin 来训练更大、更强大的模型,并支持长上下文、多模态系统,与上一代 GPU 相比,延迟和成本均有所降低。

IBM、NetApp、Nutanix、Pure Storage、SUSE 和 VAST Data 等基础设施和存储合作伙伴正与NVIDIA合作设计下一代 Rubin 平台。Rubin 代表了 NVIDIA 的第三代机架级架构,并得到了 80 多家 MGX 生态系统合作伙伴的支持。Red Hat 宣布扩大合作,提供一套针对 Rubin 优化的完整 AI 堆栈,充分利用其混合云产品组合,包括 Red Hat Enterprise Linux、OpenShift 和 Red Hat AI,这些产品已被众多财富全球 500 强企业广泛采用。

NVIDIA 发布 Rubin:六款全新芯片助力下一代 AI 超级计算机这篇文章最初发表于元宇宙 Post

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论