首页 > 最新资讯 > GTC21 | NVIDIA Quantum-2 赋能超算上云,跨入新高度
GTC21 | NVIDIA Quantum-2 赋能超算上云,跨入新高度

GTC21 | NVIDIA Quantum-2 赋能超算上云,跨入新高度

2021-11-11 12:20

#人工智能 #深度学习 #GTC21


全新 400Gbps InfiniBand 交换机和网络平台助力 AI、数据分析和高性能计算(HPC)应用实现安全、云原生、多租户和裸金属性能的统一

 

NVIDIA 于今日发布 NVIDIA Quantum-2 —— 新一代 InfiniBand 网络平台,为云计算提供商和超级计算中心提供极致的性能、广泛的接入能力及强大的安全性。

NVIDIA Quantum-2 平台即 400Gbps 的 InfiniBand 网络平台,包括 NVIDIA Quantum-2 交换机、ConnectX-7® 网卡、BlueField-3® 数据处理器 DPU(数据处理器)和所有支持这种新架构的软件。这也是迄今为止最先进的端到端网络平台。

NVIDIA Quantum-2 平台推出之时,正值越来越多的超级计算中心走向为广大用户开放之际,其中也包括许多外部用户,于此同时,全球云服务提供商也开始为他们的数以百万计的客户提供更多的超级计算服务。

NVIDIA Quantum-2 平台正是为上述的两种趋势的高要求应用而量身定制。凭借其云原生技术,这款产品提供每秒 400Gb/s 的高吞吐量和先进的多租户支持功能,可满足众多用户的需求。

NVIDIA 网络高级副总裁 Gilad Shainer  表示,“如今,超级计算中心和公有云的诉求正在走向融合 —— 它们必须为新一代高新能计算(HPC)、AI 和数据分析的应用提供尽可能高的性能,同时还应安全隔离应用,并响应用户对流量的不同需求。凭借 NVIDIA Quantum-2 InfiniBand 平台,现代数据中心已经可以将这一远景变为现实。”

NVIDIA Quantum-2平台的性能和云原生功能

凭借每秒 400 Gbps 的高吞吐量,NVIDIA Quantum-2 InfiniBand 将网速提高了一倍,网络端口数量增加了三倍。它在性能提升 3 倍的同时,还将对数据中心网络所需的交换机数量减少了 6 倍,于此同时,数据中心的能耗和空间各减少了 7%。

NVIDIA Quantum-2 平台实现了多租户之间的性能隔离,这使得一个租户的行为不会干扰到其它租户,同时通过利用先进的基于遥测且支持云原生的拥塞控制机制,确保了可靠的数据吞吐量,并且不受用户或应用需求高峰的影响。 

NVIDIA Quantum-2 SHARPv3  网络计算技术可为 AI 应用提供超出上一代产品 32 倍的加速引擎数量,借助  NVIDIA UFM® Cyber-AI  平台,将为数据中心提供先进的 InfiniBand 网络管理功能,包括预测性维护等。

NVIDIA  Quantum-2 平台中集成了纳秒级精度的计时系统可以同步分布式应用,如在数据库处理中,有助于减少等待及空闲时间。这一新功能,其使得云数据中心成为电信网络的一部分,可以托管软件定义的 5G 无线服务。

Quantum-2 InfiniBand 交换机

Quantum-2 平台的核心是全新的 Quantum-2 InfiniBand 交换机,其主芯片采用7纳米制程,包含了 570 亿个晶体管,略多于含 540 亿个晶体管的 NVIDIA A100 GPU

它具有 64 个 400Gbps 端口或 128个200Gbps 端口,并将提供不同端口数的交换机系统,最多达 2048 个 400Gbps 端口或 4096 个 200Gbps 端口——交换能力上,超出上一代 Quantum-1 约  5 倍。

携网络速度、交换能力和高扩展性的优势,使其成为构建下一代巨型高性能计算系统的理想选择。

全球众多领先的基础架构和系统厂商现已支持 NVIDIA Quantum-2 交换机,包括Atos、DataDirect Networks(DDN)、戴尔、Excelero、技嘉、惠普、IBM、浪潮、联想、Penguin Computing、QCT、超微、VAST Data和WekaIO。

Quantum-2 ConnectX-7 和 BlueField-3

NVIDIA Quantum-2 平台在主机端提供两个网络选项,NVIDIA ConnectX-7 网卡和 NVIDIA BlueField-3 DPU InfiniBand。

ConnectX-7 基于 7 纳米工艺设计,包含 80 亿个晶体管,其数据传输速率是目前世界领先的高性能计算网络芯片 NVIDIA ConnectX-6 的两倍,还使 RDMA、GPUDirect® Storage、GPUDirect RDMA 和网络计算的性能翻倍。ConnectX-7 样片将于明年 1 月问世。

BlueField-3 InfiniBand 也采用 7 纳米工艺设计,包含 220 亿个晶体管,提供 16 个 64 位的 Arm CPU,以卸载和隔离各种数据中心基础设施服务。BlueField-3 样片将于明年 5 月问世。

相关新闻