NVIDIA CEO发布Hopper架构、H100 GPU、全新超级计算机和软件
2022-03-23 18:23
NVIDIA GTC 大幕拉开:黄仁勋揭晓 AI 领域的卓越进展,并阐述 AI 和 Omniverse 如何将现实世界和虚拟世界相融合。
NVIDIA 创始人兼首席执行官黄仁勋分享了一个时代愿景,即以工业规模创造智能,并将其融入真实和虚拟世界。这将革新价值万亿美元的行业,并有望解决 “我们这个时代的重大挑战”。
在 NVIDIA GTC 大会主题演讲中,黄仁勋介绍了多款全新芯片,包括 Hopper GPU 架构和 H100GPU、AI 和加速计算软件以及强大的数据中心级系统。
“企业正在处理、完善他们的数据,构建 AI 软件,并逐渐成为智能制造商,” 身处一个 NVIDIA Omniverse 实时 3D 协作和模拟平台上打造的虚拟环境中,黄仁勋描述了 AI 如何在各个领域 “全面开花”。
Omniverse 将汇聚所有这些进步,加快人与 AI 之间的协作、更好地塑造和理解真实世界并成为新型机器人的试验场,推动“下一波 AI”的发展浪潮。
黄仁勋在这一全球最重要的 AI 大会上与领先的开发者、科学家和研究者们分享了他的愿景。
本届大会吸引了 1600 多名演讲者以及超过 20 万名注册参会者。演讲者来自美国运通、DoorDash、领英、Pinterest、Salesforce、ServiceNow、Snap 和 Visa 等公司。
黄仁勋的主题演讲以 NVIDIA 全新园区的壮观航拍拉开序幕。整个园区,包括热闹的先进机器人项目实验室,都是在 Omniverse 中渲染而成。
他分享了如何与广泛的生态系统合作来推进医疗和药物研发的进程,从而拯救生命,甚至帮助拯救我们的地球。
黄仁勋表示:“科学家们预测,要想有效地模拟区域气候变化,需要比现在强大十亿倍的超级计算机。”
“NVIDIA 将通过我们的 Earth-2 (全球第一台 AI 数字孪生超级计算机)来应对这一巨大挑战,并发明新的 AI 和计算技术,加速实现十亿倍的性能飞跃。”
全新芯片 NVIDIA H100:“全球 AI 基础架构的新引擎”
为了推动这些宏伟目标的实现,黄仁勋介绍了“全球 AI 基础架构的新引擎”,即基于 Hopper 架构的 NVIDIA H100。
他表示,语音、对话、客服和推荐系统等 AI 应用正在推动数据中心设计领域的巨大变革。
“AI 数据中心需要处理海量且持续的数据,以训练和完善 AI 模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型 AI 工厂。”
黄仁勋解释说,这些工厂全天候密集运行,即便是质量上的小幅改进也能大幅增加客户参与和企业利润。
H100 将帮助这些工厂更快发展。这个“庞大”的 800 亿晶体管芯片采用了台积电的 4 纳米工艺制造而成。
“Hopper H100 是有史以来最大的一次性能飞跃——其大规模训练性能是 A100 的 9 倍,大型语言模型推理吞吐量是 A100 的 30 倍。”
Hopper 实现了许多技术突破,包括一个新的 Transformer Engine,可以在不损失准确性的前提下将这些网络的速度提高 6 倍。
“Transformer 模型训练时间从数周缩短至数天。”
黄仁勋宣布 H100 已投入生产,并将在第三季度上市。
黄仁勋还发布了 Grace CPU 超级芯片,这是 NVIDIA 首款用于高性能计算的离散数据中心 CPU。
这款超级芯片由两个 CPU 芯片组成,并通过每秒 900 GB 的 NVLink 芯片互连技术连接成一个 144 核 CPU,具有每秒 1 太字节内存带宽。
“Grace 是全球 AI 基础架构的理想 CPU。”
黄仁勋还宣布推出基于 Hopper GPU 的全新 AI 超级计算机 — DGX H100、H100 DGX POD 和 DGX SuperPOD 。
NVIDIA 的全新 NVLink 高速互连技术将被应用于所有未来的 NVIDIA 芯片,包括 CPU、GPU、DPU 和系统级芯片。
他还宣布,NVIDIA 将向客户和合作伙伴提供 NVLink,帮助其构建配套芯片。
“NVLink 使客户能够通过新的方式构建利用 NVIDIA 平台和生态系统的半定制化芯片和系统。”
全新软件——AI 已“从根本上改变了”软件
黄仁勋称,得益于加速计算,AI 领域出现了“惊人的进展”。
“AI 已从根本上改变了软件功能以及创造软件的方式。”
黄仁勋解释说,Transformers 已经实现了自我监督学习,并且无需人类标记数据。因此,Transformers 正在越来越多的领域中发挥作用。
“Transformers 实现了自我监督学习,AI 的速度也得到了大幅提升。”
黄仁勋表示,Transformers 所带来的突破包括用于语言理解的 Google BERT、用于药物研发的 NVIDIA MegaMolBART 以及 DeepMind AlphaFold2。
他介绍了用于自然语言理解、物理、创意设计、角色动画甚至是 NVCell 芯片布局的全新深度学习模型。
“AI 正在各个领域‘全面开花’,包括新的架构、新的学习策略、规模更大、性能更强的模型、新的科学领域、新的应用、新的行业等,而且所有这些领域都在发展。”
黄仁勋表示,NVIDIA 全力投入于加速 AI 领域的新突破以及 AI 和机器学习在每个行业的应用。
NVIDIA AI 平台正在取得重大更新,包括 Triton 推理服务器、用于训练大型语言模型的 NeMoMegatron 0.9 框架以及用于音频和视频质量增强的 Maxine 框架。
该平台包含一套由 NVIDIA 优化和认证的端到端、云原生 AI 和数据分析工具与框架 NVIDIA AI Enterprise 2.0,并且现在支持所有主要的数据中心和云平台。
“我们在这次 GTC 上更新了 60 个 SDK。300 万名开发者、科学家和 AI 研究者以及数万家初创企业会发现,自己的 NVIDIA 系统变得更快了。”
现在,一些全球大型企业都在依赖 NVIDIA AI 软件和加速计算 SDK。
Microsoft Translator 使用 NVIDIA Triton 支持的实时翻译功能加速全球沟通。
AT&T 使用 NVIDIA RAPIDS 软件加速其数据科学团队的工作,这款软件可以让数万亿条记录的处理变得更加轻松。
“NVIDIA SDK 服务于医疗、能源、交通、零售、金融、媒体和娱乐等行业,总价值达到 100 万亿美元。”
“ 新一轮进化 ”:虚拟世界的Omniverse
半个世纪前,阿波罗 13 号登月任务遇到了麻烦。为了拯救船员,NASA 的工程师们在地球上创建了一个船员舱模型来“解决这个问题”。
黄仁勋表示:“在扩展到巨大的规模后,数字孪生就能成为一个与物理世界相连的虚拟世界。这代表着互联网的新一轮进化。”
用于构建数字孪生的 NVIDIA Omniverse 软件,以及全新数据中心级 NVIDIA OVX 系统,将成为“以行动为导向的 AI”的组成部分。
“Omniverse 是我们机器人平台的核心。像 NASA 和亚马逊一样,我们和机器人以及工业自动化领域的客户都意识到了数字孪生和 Omniverse 的重要性。”
黄仁勋解释说,OVX 将使用 Omniverse 数字孪生进行大规模模拟,使多个自主系统在同一时空运行。
OVX 的骨干是其网络编织架构,为此他发布了 NVIDIA Spectrum-4 高性能数据基础架构平台。
全球首个 400Gbps 端到端网络平台 NVIDIA Spectrum-4 由 Spectrum-4 交换机系列、NVIDIA ConnectX-7SmartNIC、NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 数据中心基础设施软件组成。
为了让更多的用户能够使用 Omniverse,黄仁勋发布了 Omniverse Cloud。现在只需简单的点击操作,协作者就可以通过云端 Omniverse 进行连接。
为了演示该功能,黄仁勋展示了四名设计师(其中一名是 AI)如何合作创建一个虚拟世界。
他还展示了亚马逊如何使用 Omniverse Enterprise “来设计和优化其无与伦比的订单履行中心。”
“现代化订单履行中心正在变成一座由人类和机器人共同运作的设施,堪称技术奇迹。”
“新一轮 AI 浪潮”:机器人和自动驾驶汽车
黄仁勋表示,新的芯片、软件和模拟功能将掀起“新一轮 AI 浪潮”,即能够“设计、计划和行动”的机器人。
黄仁勋解释说,NVIDIA Avatar、DRIVE、Metropolis、Isaac 和 Holoscan 是围绕“四大支柱”构建的端到端全栈机器人平台。“四大支柱”指的是真实数据生成、AI 模型训练、机器人堆栈和 Omniverse 数字孪生。
黄仁勋表示,NVIDIA DRIVE 自动驾驶汽车系统本质上是一个“AI 司机”。
Hyperion 8 可以通过 360 度摄像头、雷达、激光雷达和超声波传感器套件实现全自动驾驶。它是 NVIDIA 自动驾驶汽车的硬件架构,NVIDIA DRIVE 在此基础上打造而成。
Hyperion 8 将从 2024 年开始应用于梅赛德斯-奔驰汽车上,并于 2025 年应用于捷豹路虎汽车上。
黄仁勋宣布,作为新一代电动汽车、自动驾驶出租测、班车和卡车引擎的集中式自动驾驶和 AI 计算机,NVIDIA Orin 将在本月开始出货。
黄仁勋还宣布了 Hyperion 9,该架构内置即将推出的 DRIVE Atlan 系统级芯片,是当前基于 DRIVE Orin 架构性能的两倍。Hyperion 9 将于 2026 年开始出货。
全球第二大电动汽车制造商比亚迪将从 2023 年上半年起开始生产基于 DRIVE Orin 计算机的汽车。
Lucid Motors 透露,其 DreamDrive Pro 高级驾驶辅助系统基于 NVIDIA DRIVE 构建。
总体而言,NVIDIA 未来六年在汽车业务的研发生产投入已增加至 110 亿美元以上。
ClaraHoloscan 将 DRIVE 中使用的大部分实时计算力用于支持医疗仪器和实时传感器,如射频超声波、4K 手术视频、高通量摄像头和激光器等。
黄仁勋演示了 Holoscan 如何加速来自光片显微镜的图像,并创造出一部关于细胞运动和分裂的“电影”。
一般情况下,需要一整天时间才能处理完这些仪器一小时内产生的 3TB 数据。
但在加州大学伯克利分校的高级生物影像中心,使用 Holoscan 的研究人员能够实时处理这些数据,实现了显微镜在实验进行过程中的自动对焦。
Holoscan 开发平台现已向客户开放早期使用权限,并将于 5 月全面上线,在 2023 年第一季度达到医疗级使用标准。
NVIDIA 正在与数千名客户和开发者合作,帮助他们建造用于制造、零售、医疗、农业、建筑、机场和整座城市的机器人。
黄仁勋解释说,NVIDIA 的机器人平台由 Metropolis 和 Isaac 组成。Metropolis 是一个能够追踪移动物体的固定机器人,而 Isaac 是一个专为移动物体开发的平台。
为了帮助机器人在工厂、仓库等室内空间中找到路线,NVIDIA 发布了 Isaac Nova Orin。这个先进的计算和传感器参考平台建立在 Jetson AGX Orin 上,能够加速自主式移动机器人的开发和部署。
在一段演示中,黄仁勋展示了百事可乐如何结合使用 Metropolis 和 Omniverse 数字孪生。
四个层面与五个趋势
所有技术、产品发布和演示,都将助力 NVIDIA 推动新一代计算的发展。
黄仁勋解释说,NVIDIA 发布了覆盖其所有四层堆栈的新产品,包括硬件,系统软件和库,软件平台 NVIDIA HPC、NVIDIA AI 和 NVIDIA Omniverse 以及 AI 和机器人应用框架。
黄仁勋还提出了影响行业发展的五个趋势:million-X 百万倍计算速度飞跃,大幅加快 AI 速度的 Transformers,成为 AI 工厂的数据中心,对机器人系统的需求呈指数级增长以及下一个 AI 时代的数字孪生。
黄仁勋在演讲的最后总结道:“我们将在未来十年以数据中心规模加速整个堆栈,再次实现 million-X 百万倍性能飞跃。我已经迫不及待地想看到下一次百万倍性能飞跃将带来什么。”
在主题演讲的结尾,黄仁勋表示“大家今天所看到的每一个渲染和模拟”均由 Omniverse 生成,随后他介绍了一段由 NVIDIA 创作团队制作的精彩视频,带着观众“最后再游览一次 Omniverse”,来到 NVIDIA 园区中央欣赏一段迷人的爵士乐,而以黄仁勋为原型制作的数字形象 Toy Jensen 也出现在这个虚拟世界中。