DevZone | AI和HPC容器
2022-06-30 19:21
借助 NVIDIA NGC 目录中的 GPU 优化容器,更快地开发和部署应用。
什么是容器?
容器是一种便携式软件单元,可将应用及其所有依赖项合并为一个软件包,该软件包不受底层主机操作系统限制。这样无需再构建复杂的环境,并简化了应用开发到部署的过程。
NVIDIA NGC 目录包含一系列用于深度学习、机器学习、可视化和高性能计算(HPC)应用的 GPU 优化容器,这些容器均已经过了性能、安全性和可扩展性测试。
NGC 目录中的容器的优势
轻松部署
内置库和依赖项可让您轻松部署和运行应用。
加快训练速度
TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月会提供针对性能优化的更新版本,以便加快 AI 训练和推理速度。
运行位置不受限制
在 bare metal、虚拟机(VM)和 Kubernetes 上,将容器部署在任意位置(云端、内部私有云和边缘)的多 GPU/多节点系统上。
放心部署
容器经过常见漏洞和暴露(CVE)扫描(附有安全报告),并通过 NVIDIA AI Enterprise 得到了可选的企业支持。
性能优化
NVIDIA 构建的 Docker 容器每月都会更新,第三方软件也会定期更新,以提供所需的功能,便于您从现有基础架构中获得出色性能,并缩短找出解决方案的时间。
借助 BERT-Large 进行自然语言处理
BERT-Large 利用 Volta V100 和 Ampere A100 GPU 上的混合精度运算和 Tensor Core,在保持目标准确性的同时缩短训练时间。
在单节点的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,BERT-Large 和训练的性能表现。混合精度。BERT 的批量大小:3 (V100)、24 (A100)
用于图像处理的 ResNet50 v1.5
此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 体系架构上的 Tensor Core 进行混合精度训练,以加快训练速度。
在单节点 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 时,ResNet 50 的性能表现。混合精度。ResNet50 批量大小:26
用于深度学习的 Matlab
持续开发 Matlab 深度学习容器可提高训练和推理性能。
Windows 10,Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU
用于各种工作负载的容器
AI 容器
TensorFlow
TensorFlow 是一个用于高性能数值计算的开源软件库。
PyTorch
PyTorch 是具有 Python 前端的 GPU 加速型张量计算框架。
NVIDIA Triton 推理服务器
NVIDIA Triton 推理服务器是一种开源推理解决方案,可更大限度地提高 GPU 的利用率和性能。
NVIDIA TensorRT
NVIDIA TensorRT 是一个C++ 库,可加快 NVIDIA GPU 上的高性能推理。
应用框架
NVIDIA Clara
用于医疗成像的 NVIDIA Clara Train 是一个应用框架,包含超过 20 个先进的预训练模型、迁移学习和联合学习工具、AutoML,以及 AI 辅助的标记数据。
DeepStream
DeepStream 是一款流分析工具包,可用于基于 AI 的视频、音频和图像理解和多传感器处理。
NVIDIA Riva
NVIDIA Riva 是一个应用框架,适用于在 GPU 上提供实时性能的多模态对话式 AI 服务。
Merlin Training
Merlin HugeCTR 是 NVIDIA Merlin 的组件,是一款专为推荐系统设计的深度神经网络训练框架。
HPC 容器
NAMD
NAMD 是一段并行分子动力学代码,旨在实现生物大分子系统的高性能模拟。
GROMACS
GROMACS 是一款热门的分子动力学应用,用于模拟蛋白质和脂质。
Relion
Relion 采用经验贝叶斯方法分析低温电子显微镜(cryo EM)。
NVIDIA HPC SDK
NVIDIA HPC SDK 是编译器、库和工具的综合套件,用于构建、部署和管理 HPC 应用。