首页 > 最新资讯 > NVIDIA和Ampere Computing助力Arm实现26倍的超算性能提升
NVIDIA和Ampere Computing助力Arm实现26倍的超算性能提升

NVIDIA和Ampere Computing助力Arm实现26倍的超算性能提升

2020-12-02 15:00

#人工智能 #深度学习


A100 GPU、基于Neoverse架构的SoC和Ampere Altra Mt. Jade平台为Arm在高性能计算领域的发展推波助澜。

在过去的18个月中,由于Arm和NVIDIA生态系统的共同努力,研究人员见证了基于Arm的高性能计算平台25.5倍的性能提升。

对于今天的成就,应为付出不懈努力的工程师们送上热烈的掌声。

Arm Neoverse N1内核使类似Ampere Computing Altra这样的SoC性能较去年提升了2.3倍。

NVIDIA A100 Tensor Core GPU实现了有史以来最大的代际性能飞跃。

最新平台升级至更多、更快速的内核、输入/输出通道和内存。

应用程序开发者利用许多新的优化对其软件进行了调整。

因此,NVIDIA用于HPC的基于Arm的参考设计采用了两个Ampere Altra SoC和两个A100 GPU,性能达到了研究人员在2019年6月使用的双SoC服务器的25.5倍。基于Arm的GPU加速参考平台仅在12个月内,就实现了2.5倍的性能提升。

包括GROMACS、LAMMPS、MILC、NAMD和Quantum Espresso在内的众多应用都受益于此。疫情之下,这些应用对于新药研发这样的重点工作至关重要。包括上述应用在内的众多可在基于Arm的系统上运行的应用程序,均可在NGC(NVIDIA GPU加速软件中心)的容器中找到。

致力于在分子动力学和量子化学等领域实现突破的公司和研究人员,可利用这些应用程序,推动基础科学乃至医疗健康等领域的进步。

了解幕后的Arm和HPC

最新的参考架构将Ampere Computing的Mt. Jade的高能效吞吐量(一个2U大小的服务器平台),与已在全球范围内为一些超级计算机运行加速的NVIDIA HGX A100进行了结合,是去年首次面世的基于Marvell ThunderX2与NVIDIA V100 GPU的设计之后的又一力作。

Mt. Jade采用两个Ampere Altra SoC封装,含80个内核,每个SoC均基于Arm Neoverse N1内核,所有内核的运行频率均高达3 GHz。它们可提供多达192条PCIe Gen4通道和高达8TB的内存,可为两个A100 GPU供电。

Mt. Jade服务器平台支持192个PCIe Gen4通道

这种结合为下一代超级计算机打造了一个强大的节点。Ampere Computing已经得到共九家原始设备制造商、设计制造商以及系统集成商的支持,其中包括技嘉科技、联想和纬颖。

蒸蒸日上的Arm高性能计算生态系统

生态系统不断扩展的另一个迹象是,Arm HPC User Group在SC20之前举办了一场线上活动,AWS、慧与、Jülich超算中心、日本的RIKEN、以及橡树岭和桑迪亚国家实验室等机构带来了三十几场演讲,多数演讲均可在其YouTube频道上观看。(链接:https://www.youtube.com/channel/UCFLVQ8FeIElHKEWRZuMSQVw/videos)

6月,Arm在超级计算领域掀起了迄今为止最大的一场轰动。当时,日本的Fugaku系统在全球最快的超级计算机TOP500榜单中排名第一,该系统使用富士通基于Arm的A64FX CPU,性能达到了惊人的415.5 petaflops。

当时,它是榜单上四台采用Arm的超级计算机之一,首次使用了Arm的SVE(Scalable Vector Extensions,即可伸缩矢量扩展)技术,这是Arm下一代Neoverse架构设计中内嵌的技术,NVIDIA的软件也将对此提供支持。

同时,AWS已经开始基于Arm的Graviton2处理器,在云端执行HPC任务,例如基因组学、财务风险建模和计算流体动力学等。

NVIDIA加速Arm在HPC领域的发展

HPC领域不断成长的Arm,是跨越智能手机与超级计算机领域,包含1300万开发者的广泛生态系统的一部分。NVIDIA旨在通过收购Arm来扩展这一社区,创建AI时代的全球顶级公司。

NVIDIA通过在NVIDIA AI、HPC、网络和图形软件中内置对Arm的支持,不断扩展生态系统。在去年的超级计算大会上,NVIDIA首席执行官黄仁勋宣布,除持续支持IBM POWER和x86架构之外,还将加速Arm在HPC领域的采用。

NVIDIA扩大对Arm生态系统的支持

此后,NVIDIA发布了采用Arm IP的BlueField-2 DPU,来加速并保护云、嵌入式和企业应用的网络和存储任务。十多年来,作为“狂热用户”的NVIDIA一直在内部产品中积极采用Arm设计,例如用于机器人和其他嵌入式系统的Jetson Nano模块。

NVIDIA很高兴能为Arm在HPC领域取得的巨大性能提升贡献一份力量。这是开放且生机勃勃的Arm生态系统不断发展壮大的故事中的最新篇章。

相关新闻