在宣布收购 Arm 的六个月后,NVIDIA 首次介绍了其全新处理器及众多的合作伙伴关系,致力于为 AWS、Ampere Computing、联发科和 Marvel 等基于 Arm 的 CPU 平台实现加速。
来自今日 GTC 大会的最新消息:NVIDIA 大力助推 Arm 生态系统的发展。
NVIDIA 介绍了与 Arm 芯片、软件和服务提供商的合作情况,展现了高能效,加速平台和应用在客户端、云、高性能计算(HPC)和边缘计算领域的潜力。
NVIDIA 还发布了三款基于 Arm IP 构建的新处理器,其中包括 “Grace”,它是NVIDIA 的首款数据中心 CPU,将推动 AI、云和高性能计算提升至新高度。
此外,全新 BlueField-3 数据处理器(DPU)采用了更多的 Arm 核,为数据中心网络的新应用带来了新的可能性。
NVIDIA DRIVE Atlan 是 NVIDIA 首款由一个嵌入 Arm 核心的 DPU 组装而成的自动驾驶汽车处理器,这也意味着高性能网络有望应用于汽车制造商将于 2025 年推出的新车型中。
NVIDIA 首席执行官黄仁勋在 GTC 大会主题演讲中分享了他对 AI、HPC、数据科学、图形技术等领域的愿景。他再次承诺会持续扩展 Arm 生态系统,这也是 NVIDIA 和 Arm 于 2020 年 9 月宣布收购 Arm 的交易中的重要一部分。
在实现这些愿景的过程中,NVIDIA 介绍了其所做的一系列努力,即借助 NVIDIA GPU、DPU 和软件,为四家主要的 Arm 合作伙伴的 CPU 提速,从而为 Arm 开发者的应用程序赋能。
GPU 提升 AWS Graviton-2 实例的性能
在云方面,NVIDIA 宣布将为 AWS Graviton2 提供 GPU 加速,这是该云服务提供商自有的基于 Arm 的处理器。加速后的 Graviton2 实例将提供丰富的游戏串流体验,且能够以更低的成本实现更强大的AI推理性能。
例如,游戏开发者将使用 AWS 实例,实现安卓游戏和其他服务的串流,从而将 Graviton2 的效率与 NVIDIA RTX 图形技术(如光线追踪和 DLSS)相结合。
在高性能计算领域,全新 NVIDIA Arm HPC 开发者套件为超级计算机提供了一个高性能、高能效的平台。该平台结合了 Ampere Computing 的 Altra(一款拥有 80 个 Arm 核,处理频率高达 3.3 GHz 的 CPU)与最新的 NVIDIA GPU 和 DPU。
该开发者套件包含了一套 NVIDIA 编译器、库和工具,可用于 AI 和 HPC,使开发者能够为基于 Arm 的科学和技术计算系统提速。多家顶尖研究机构将成为其首批用户,包括位于美国的橡树岭国家实验室和洛斯阿拉莫斯国家实验室,以及韩国和台湾地区的顶级实验室等。
在 PC 领域,NVIDIA 正与全球最大的智能手机芯片供应商联发科合作打造新系列笔记本电脑。该款产品将搭载基于 Arm 的 CPU 和 NVIDIA RTX GPU。
这款笔记本电脑将采用 Arm 核与 NVIDIA 显卡,基于支持 Chromium、Linux 和 NVIDIA SDK 的参考平台,能够为消费者提供高效节能的便携式体验,同时在多媒体娱乐功能方面也毫不逊色。
而在边缘计算方面,NVIDIA 正在与 Marvell 合作,将其基于 Arm 的 OCTEON 处理器与 NVIDIA GPU 相组合。两者的结合将助力加速 AI 工作负载,实现网络优化和安全。
瑞士国家计算中心 (Swiss National Computing Centre)正在构建一个可提供 20 exaflops AI 性能的系统。美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)也将为其研究人员配备一台新的 AI 超级计算机。
二者都将搭载 NVIDIA 首款数据中心 CPU—— “Grace”。这是一款基于 Arm 的处理器,其针对最为复杂的 AI 和 HPC 工作负载,能够提供比当今最快服务器还要高出 10 倍的性能。

NVIDIA Grace CPU
这款 CPU 以先驱计算机科学家 Grace Hopper 的名字命名,能够满足数据驱动的 AI 时代的需求。借助第四代 NVLink,Grace 能以 900 GB/s 的速度实现与 NVIDIA GPU 的一致性连接,达到相当于目前服务器 14 倍的带宽。
NVIDIA Mellanox 网络在 Arm 方面的投入增加了一倍多。今日发布的 BlueField-3 DPU 拥有 400 Gbps 的链路,其 Arm 算力是当前最新 DPU BlueField-2 的 5 倍。

NVIDIA BlueField-3 DPU
这一简单的数据充分展现了加大 Arm 方面投入的重要性。如今一台 BlueField-3 DPU 就能实现与 300 个 x86 CPU 核同等算力的数据中心服务。
这一技术进步将为 Arm 开发者提供更多机遇,助力其构建快速、高效和智能化数据中心网络。
如今,DPU 能够卸载通信、存储、安全和系统管理任务,助力创建全新类别的系统,例如 NVIDIA 今日发布的云原生超级计算机。
Arm 核将率先应用于搭载 NVIDIA DRIVE Atlan 的新一代 AI 自动驾驶汽车中,成为 NVIDIA 发展路线图上的新一轮飞跃。

NVIDIA DRIVE Atlan
DRIVE Atlan 将实现每秒 1000万亿次以上的操作,实现显著的飞跃。这是 DRIVE 平台首次集成 DPU,通过 Arm 核为自动驾驶汽车带来数据中心级的网络。
Atlan 中搭载 DPU,也为 Arm 开发者提供了一个创建安全、存储、网络等创新应用的平台。