首页 > 最新资讯 > NVIDIA NGC扩大对Arm的支持
NVIDIA NGC扩大对Arm的支持

NVIDIA NGC扩大对Arm的支持

2019-11-20 19:24


TensorFlow、PyTorch、MxNet容器将支持在Singularity平台上运行。


如今,x86、Power架构以及NVIDIA GPU共同推动着超级计算机的发展。但随着中国、欧洲以及日本的一些站点开始基于Arm处理器着手打造其首套百万兆级系统,可以看出这种节能高效的CPU架构也正在逐渐被高性能计算领域中的第一梯队所采用。

但由于各站点多样化的原因,会导致集群管理工作复杂。而NVIDIA NGC容器注册表可以通过简化在Arm系统上的应用部署,来帮助系统管理员降低管理集群的复杂程度。

有了这些容器,用户无需再构建和管理复杂环境模块,而且可以更快速地部署应用,并在不影响性能的情况下获得可重复的结果。

为了帮助用户提高访问速度与生产力,NVIDIA将支持在Singularity平台上运行NGC深度学习容器。

NGC容器助力提高生产力

NGC注册列表为用户提供了容器化的HPC应用程序、深度学习框架、机器学习算法以及科学可视化工具。这些容器经过了性能优化,支持多GPU以及多节点系统,并经过了相关测试,可以运行于工作站服务器以及云环境等各种平台之上。

在NGC上,TensorFlow、PyTorch、MxNet与NVCaffe等深度学习框架还会持续地进行性能更新,并在NGC上每月定期发布,从而使用户可以构建更大型、更快速且精度更高的神经网络。HPC应用容器由开发者创建,新版本HPC应用容器能够让用户在相同的硬件基础上,轻松地获取最新特性与更优秀的性能。



支持在Singularity上运行深度学习容器

Singularity平台是HPC领域中最受欢迎的容器运行时之一,它允许用户在多租户系统上以普通模式拖拽并运行容器。然而,由于此前NGC的深度学习容器不支持Singularity平台,导致HPC研究者们与系统管理员无法通过NGC使用深度学习容器。

现在,从v19.11 测试版开始, NVIDIA NGC深度学习容器将支持在Singularity平台运行时上运行。此前,NVIDIA NGC的HPC容器已支持在Singularity上运行。

以Singularity平台为中心的指令现已被载入了各README之中,用户可以在其高性能计算环境内轻松部署NGC容器。

构筑Arm生态系统

随着从存储到网络,再到GPU处理的各种构建块开始协同工作,Arm平台正在迅速改进。除了硬件基础设施外,顶级HPC和可视化应用程序的开发者们已经将代码移植到了Arm上运行。

为了使用户能够在由GPU赋能的系统上更加简便地使用HPC应用程序,NVIDIA正在对NGC进行扩展,提供面向Arm的HPC、深度学习与可视化容器。这些容器经过了Singularity相关测试,能够让系统管理员轻松地为其用户提供支持。

在x86与Arm上轻松部署Julia

Julia是一种开源的HPC编程语言。现在,Julia能够以容器化的方式在x86与Arm上使用。用户可以通过使用Julia编写CUDA内核或者通过使用强大的阵列编程模型,将Julia应用于GPU编程当中。

Julia提供了面向HPC综合生态系统的套包,覆盖机器学习、数据科学、各种科学领域与可视化。

面向HPC集群的容器工具生态系统

一些超算中心更喜欢构建并托管其自身的容器。HPC Container Maker(HPCCM)是一个旨在简化HPC应用容器开发的开源项目。

HPCCM封装为模块化的构建块,借鉴了核心高性能计算组件在部署及容器方面的实践经验,尽可能地减少了镜像尺寸,同时还借鉴了其他容器的功能。

如今,管理气隙系统的HPC系统管理员可以自动下载并保存Singularity格式的最新版NGC容器与NGC Container Replicator。这可以让用户更快速地访问软件,减少其网络流量,节约存储空间。

面向边缘、数据中心与云端高性能计算的NGC

考虑到如今有着数以亿计的传感器在不断地产生大量数据,HPC需要跳出传统模拟范畴,转而在边缘处理传感器数据。例如,欧洲中期天气预报中心(ECMWF)每天会产生超过250TB的数据。对于需要处理如此海量数据的组织机构而言,最好的方案是在数据生成地对数据进行实时分析,并利用其中的关键数据构建更好的模型。

无论是在边缘、数据中心还是在云端,NGC均能够让用户在裸机、虚拟机或Kubernetes上轻松并一致地部署相同的HPC与AI软件堆栈。