Ian Buck:NVIDIA 2020年五大关注重点
2019-11-12 18:49
NVIDIA副总裁兼加速计算总经理Ian Buck向CRN讲述了NVIDIA在AI领域的雄心壮志:“现今正在建造的超级计算机都将是AI超级计算机”。
NVIDIA在5G、
自动驾驶、医疗领域的远大目标
作为NVIDIA数据中心业务的负责人及NVIDIA CUDA并行计算平台的创造者,Buck所领导的业务,改变了计算基础架构的工作方式。如今,虽然NVIDIA GPU依然主导着游戏和内容创作领域;但同时,在过去几年,NVIDIA GPU也已成为了许多高性能计算和AI工作负载的核心。
Buck在采访中告诉CRN:“如今,随着AI的出现,数据中心正在发生变化。有些数据中心正在成为计算密集型超级计算机。”
NVIDIA于上周二宣布美国邮政将采用HPC和Dell EMC提供的GPU加速服务器实现人工智能邮件分拣,这证明了GPU对于数据中心市场的重要性日益增加。
但NVIDIA在数据领域的目标不仅限于传统的数据中心,还包括边缘服务器、医疗设备、自动驾驶汽车和机器人。
Buck表示:“我认为,AI已展现出远超传统算法的功能,它们可以实现智慧城市和会话式AI等新的应用和功能,但AI的处理能力都以计算能力为基础,而且还需要新的软件堆栈,这是一个需要大量创新的领域。同时,这个领域也真的非常有趣,它是创新的中心。
下面是Buck对于NVIDIA 2020年的五大重点关注领域的阐述,包括实现5G网络基础设施的创新、支持医疗领域AI的新软件框架等。
软件定义的5G基础设施
NVIDIA的一大关注重点在5G上。Buck认为这项技术被炒作得十分夸张。
他在上周二华盛顿举行的NVIDIA GTC大会上对观众说:“这项技术已经令人兴奋到大家不知道为什么要兴奋。”
但Buck表示,5G将成为一项重要的技术,任何炒作都无法改变这一点。他认为这是因为5G将通过提高带宽、大幅降低延迟、提高可靠性和增加设备密度来改进包括边缘AI在内的各种工作负载。
他表示:“我可以让我的设备变得非常便宜且节能,这样就可以实现真正的物联网。它不需要任何智能,只需要5G连接,就可以将其所有人工智能、处理过程等都移动到边缘。因此,5G使我们能够制造低端、低成本、无处不在的物联网设备,比如摄像头、门铃等。这些设备互相连接,其智能程度堪比一座数据中心。”
NVIDIA在5G方面的投资包括新的软件开发套件Aerial。该套件可在公司的EGX 边缘计算平台上运行,为5G基础设施实现GPU加速的软件定义无线接入网络。这将使电信公司在其服务范围内具有更大的灵活性。
Ericsson是NVIDIA在虚拟5G无线接入网构建领域的早期合作伙伴之一。这让企业能够提供增强现实、虚拟现实和游戏等新服务。
Buck认为:“有了5G,我们可以将所有这些功能都移到边缘,大量增加边缘上的软件定义服务。”
AI加速医疗
另一个NVIDIA所重视的领域是医疗。NVIDIA正在为此构建自己的软件堆栈,从而为用于医疗成像等应用的GPU加速AI流程提供支持。
“医疗行业受到严格的监管,而且十分复杂。但坦率地讲,其背后的机会以及解决这些问题的重要性,让NVIDIA不能不在这一领域进行投资。”
Buck表示,由于美国的放射科医生每天要处理的图像数量实在太多,因此医学成像是医学领域中,通过应用AI处理器而受益的科室之一。
Buck表示:“如今,各医院总共大约有50000名放射科医生。通常,放射科每天要处理约8000张图像。我们算一下就会发现,即便是50000名放射科医生也还远远无法满足需求。每名放射科医生处理每张图像的实际时间大约为四秒钟。对于那些等待着接受检查的人而言,这个数据太可怕了。”
NVIDIA正在通过Clara开发一套针对医疗行业的人工智能。Clara是一套可以让开发者使用NVIDIA GPU加速计算的开发工具。
Buck在GTC上说:“在成像应用中,成像工作流程实际上相对比较简单,而且许多AI域的人都很熟悉这个流程。你有一个无标签数据,里面包含被标注的数据,而我们可以使用Clara SDK在标签数据上训练一个系统,让它学习如何识别图像中的特定元素。”
Buck告诉记者,NVIDIA Clara已包含“13个用于从医学影像数据中提取主要器官的预训练模型”,包括一个被称为“转移学习”的流程。该流程可以承担现有训练模型的工作并将该工作扩展到新的应用。
他表示:“比如我们想检测某种肿瘤。我们可以从已识别器官的预训练模型着手,训练它检测癌症。”
自动驾驶汽车
毫无疑问,虽然自动驾驶汽车投入市场的时间已经超过了起初的预期,但自动驾驶无疑是NVIDIA最受瞩目的技术之一。
在GTC上的演讲中,Buck表示:“我知道这是一个热门的话题,但这也是最难的技术之一。这就是为什么我们现在还没有一台真正的自动驾驶汽车,因为这项技术真的非常复杂。”
Buck告诉我们,NVIDIA拥有自己的自动驾驶汽车车队。NVIDIA通过该车队收集数据并测试其自身的功能,包括公司的Drive平台。
“基本上每辆自动驾驶汽车内部都有一台AI超级计算机。每个神经网络和Drive堆栈都要处理数千种情况。该堆栈收集、处理数百PB的数据,并且必须记录下整个过程以确保可追溯性和安全性。”
自动驾驶汽车系统开发的一个重要方面是深度学习模型的训练,这项工作可以通过公司的DGX服务器平台完成。
Buck表示,“我们每天有几千个GPU进行训练。”
公司还拥有自己的现实世界模拟平台Drive Constellation。它可以模拟自动驾驶汽车的传感器,并在暴风雪等极端条件下对其进行测试。
Buck还表示:“事实上,我们已经进行了数百万英里的车辆模拟测试。”
自主机器
除了继续在自动驾驶汽车领域进行大量投入之外,NVIDIA还在自主机器,尤其是机器人领域“下了重注”。
Buck在GTC大会演讲中对观众说:“机器人技术的未来,关键在于交互以及与现实世界的互动。”
NVIDIA正在通过其Jetson AI平台为机器人实现新的智能功能。该平台包含一系列系统模块主板,主板上有CPU、GPU和其他各种高性能芯片。这些芯片是实现高性能所必不可少的。
最近,NVIDIA 发布了Jetson Xavier NX。NVIDIA称其为用于边缘AI应用的“全球最小超级计算机”。其计算主板大约只有一张信用卡那么大,包含384个CUDA核心和48个Tensor核心,可为尺寸、重量和功率受到限制的各类设备提供最高每秒21万亿次运算(TOPS)。
Buck表示:“该芯片系统具有与NVIDIA DGX深度学习服务器这类大型GPU计算平台相同的GPU架构。”
从太空探索到零售行业,自主机器可以为各种行业和应用带来益处。例如,机器人可以代替人类员工完成扫描商店库存等耗费时间的工作,同时还可以在需要时帮助客户。
在软件方面,NVIDIA提供了一个名为Isaac的软件开发套件。该套件用于加速AI机器人的开发。其关键功能之一是能够在模拟环境中运行机器人,以确保它们在现实世界中能够正常运行。
Buck表示:“我可以模拟传感器和物理设备,由于机器人已经在Isaac SDK的模拟世界中训练了数千万小时,因此当它们第一次在现实世界中运行的时候,就可以直接在现实世界中工作。”
AI超级计算机
NVIDIA在AI方面的大部分工作都集中在高性能计算领域,希望能够将高性能计算系统变成“AI超级计算机”。
Buck告诉CRN:“我们正在将所制造的超级计算机变成AI超级计算机。”他指出,美国在高性能计算和AI融合方面起到了领导作用,而这正是取得进步的重要标志。
这些工作的核心要素之一是NVIDIA Tesla V100数据中心GPU。该GPU可以提供每秒100万亿次浮点运算(teraFLOPS)的深度学习性能。
Buck表示,NVIDIA为美国田纳西州橡树岭国家实验室的Summit超级计算机提供了27000个Tesla V100 GPU。科学家们可以在这台计算机上使用深度学习,在高分辨率的气候模拟中识别极端天气模式。
“这仅仅是AI加速科学发现的诸多例子之一。将这项技术交给研究人员,让他们可以去做一些以前不可能的事情,这真是令人感到兴奋。”
凭借其在高性能AI领域的努力,NVIDIA在全球最强大的500台超级计算机中的地位日益凸显。例如由96个DGX-2H系统和1536个Tesla V100 GPU组成的NVIDIA DGX Superpod在该名单上名列第22位。
Buck在GTC的演讲中提到:“使用该系统,可以在约80秒内完成对ResNet-50的训练,堪称神速。”
NVIDIA在5G、
自动驾驶、医疗领域的远大目标
作为NVIDIA数据中心业务的负责人及NVIDIA CUDA并行计算平台的创造者,Buck所领导的业务,改变了计算基础架构的工作方式。如今,虽然NVIDIA GPU依然主导着游戏和内容创作领域;但同时,在过去几年,NVIDIA GPU也已成为了许多高性能计算和AI工作负载的核心。
Buck在采访中告诉CRN:“如今,随着AI的出现,数据中心正在发生变化。有些数据中心正在成为计算密集型超级计算机。”
NVIDIA于上周二宣布美国邮政将采用HPC和Dell EMC提供的GPU加速服务器实现人工智能邮件分拣,这证明了GPU对于数据中心市场的重要性日益增加。
但NVIDIA在数据领域的目标不仅限于传统的数据中心,还包括边缘服务器、医疗设备、自动驾驶汽车和机器人。
Buck表示:“我认为,AI已展现出远超传统算法的功能,它们可以实现智慧城市和会话式AI等新的应用和功能,但AI的处理能力都以计算能力为基础,而且还需要新的软件堆栈,这是一个需要大量创新的领域。同时,这个领域也真的非常有趣,它是创新的中心。
下面是Buck对于NVIDIA 2020年的五大重点关注领域的阐述,包括实现5G网络基础设施的创新、支持医疗领域AI的新软件框架等。
软件定义的5G基础设施
NVIDIA的一大关注重点在5G上。Buck认为这项技术被炒作得十分夸张。
他在上周二华盛顿举行的NVIDIA GTC大会上对观众说:“这项技术已经令人兴奋到大家不知道为什么要兴奋。”
但Buck表示,5G将成为一项重要的技术,任何炒作都无法改变这一点。他认为这是因为5G将通过提高带宽、大幅降低延迟、提高可靠性和增加设备密度来改进包括边缘AI在内的各种工作负载。
他表示:“我可以让我的设备变得非常便宜且节能,这样就可以实现真正的物联网。它不需要任何智能,只需要5G连接,就可以将其所有人工智能、处理过程等都移动到边缘。因此,5G使我们能够制造低端、低成本、无处不在的物联网设备,比如摄像头、门铃等。这些设备互相连接,其智能程度堪比一座数据中心。”
NVIDIA在5G方面的投资包括新的软件开发套件Aerial。该套件可在公司的EGX 边缘计算平台上运行,为5G基础设施实现GPU加速的软件定义无线接入网络。这将使电信公司在其服务范围内具有更大的灵活性。
Ericsson是NVIDIA在虚拟5G无线接入网构建领域的早期合作伙伴之一。这让企业能够提供增强现实、虚拟现实和游戏等新服务。
Buck认为:“有了5G,我们可以将所有这些功能都移到边缘,大量增加边缘上的软件定义服务。”
AI加速医疗
另一个NVIDIA所重视的领域是医疗。NVIDIA正在为此构建自己的软件堆栈,从而为用于医疗成像等应用的GPU加速AI流程提供支持。
“医疗行业受到严格的监管,而且十分复杂。但坦率地讲,其背后的机会以及解决这些问题的重要性,让NVIDIA不能不在这一领域进行投资。”
Buck表示,由于美国的放射科医生每天要处理的图像数量实在太多,因此医学成像是医学领域中,通过应用AI处理器而受益的科室之一。
Buck表示:“如今,各医院总共大约有50000名放射科医生。通常,放射科每天要处理约8000张图像。我们算一下就会发现,即便是50000名放射科医生也还远远无法满足需求。每名放射科医生处理每张图像的实际时间大约为四秒钟。对于那些等待着接受检查的人而言,这个数据太可怕了。”
NVIDIA正在通过Clara开发一套针对医疗行业的人工智能。Clara是一套可以让开发者使用NVIDIA GPU加速计算的开发工具。
Buck在GTC上说:“在成像应用中,成像工作流程实际上相对比较简单,而且许多AI域的人都很熟悉这个流程。你有一个无标签数据,里面包含被标注的数据,而我们可以使用Clara SDK在标签数据上训练一个系统,让它学习如何识别图像中的特定元素。”
Buck告诉记者,NVIDIA Clara已包含“13个用于从医学影像数据中提取主要器官的预训练模型”,包括一个被称为“转移学习”的流程。该流程可以承担现有训练模型的工作并将该工作扩展到新的应用。
他表示:“比如我们想检测某种肿瘤。我们可以从已识别器官的预训练模型着手,训练它检测癌症。”
自动驾驶汽车
毫无疑问,虽然自动驾驶汽车投入市场的时间已经超过了起初的预期,但自动驾驶无疑是NVIDIA最受瞩目的技术之一。
在GTC上的演讲中,Buck表示:“我知道这是一个热门的话题,但这也是最难的技术之一。这就是为什么我们现在还没有一台真正的自动驾驶汽车,因为这项技术真的非常复杂。”
Buck告诉我们,NVIDIA拥有自己的自动驾驶汽车车队。NVIDIA通过该车队收集数据并测试其自身的功能,包括公司的Drive平台。
“基本上每辆自动驾驶汽车内部都有一台AI超级计算机。每个神经网络和Drive堆栈都要处理数千种情况。该堆栈收集、处理数百PB的数据,并且必须记录下整个过程以确保可追溯性和安全性。”
自动驾驶汽车系统开发的一个重要方面是深度学习模型的训练,这项工作可以通过公司的DGX服务器平台完成。
Buck表示,“我们每天有几千个GPU进行训练。”
公司还拥有自己的现实世界模拟平台Drive Constellation。它可以模拟自动驾驶汽车的传感器,并在暴风雪等极端条件下对其进行测试。
Buck还表示:“事实上,我们已经进行了数百万英里的车辆模拟测试。”
自主机器
除了继续在自动驾驶汽车领域进行大量投入之外,NVIDIA还在自主机器,尤其是机器人领域“下了重注”。
Buck在GTC大会演讲中对观众说:“机器人技术的未来,关键在于交互以及与现实世界的互动。”
NVIDIA正在通过其Jetson AI平台为机器人实现新的智能功能。该平台包含一系列系统模块主板,主板上有CPU、GPU和其他各种高性能芯片。这些芯片是实现高性能所必不可少的。
最近,NVIDIA 发布了Jetson Xavier NX。NVIDIA称其为用于边缘AI应用的“全球最小超级计算机”。其计算主板大约只有一张信用卡那么大,包含384个CUDA核心和48个Tensor核心,可为尺寸、重量和功率受到限制的各类设备提供最高每秒21万亿次运算(TOPS)。
Buck表示:“该芯片系统具有与NVIDIA DGX深度学习服务器这类大型GPU计算平台相同的GPU架构。”
从太空探索到零售行业,自主机器可以为各种行业和应用带来益处。例如,机器人可以代替人类员工完成扫描商店库存等耗费时间的工作,同时还可以在需要时帮助客户。
在软件方面,NVIDIA提供了一个名为Isaac的软件开发套件。该套件用于加速AI机器人的开发。其关键功能之一是能够在模拟环境中运行机器人,以确保它们在现实世界中能够正常运行。
Buck表示:“我可以模拟传感器和物理设备,由于机器人已经在Isaac SDK的模拟世界中训练了数千万小时,因此当它们第一次在现实世界中运行的时候,就可以直接在现实世界中工作。”
AI超级计算机
NVIDIA在AI方面的大部分工作都集中在高性能计算领域,希望能够将高性能计算系统变成“AI超级计算机”。
Buck告诉CRN:“我们正在将所制造的超级计算机变成AI超级计算机。”他指出,美国在高性能计算和AI融合方面起到了领导作用,而这正是取得进步的重要标志。
这些工作的核心要素之一是NVIDIA Tesla V100数据中心GPU。该GPU可以提供每秒100万亿次浮点运算(teraFLOPS)的深度学习性能。
Buck表示,NVIDIA为美国田纳西州橡树岭国家实验室的Summit超级计算机提供了27000个Tesla V100 GPU。科学家们可以在这台计算机上使用深度学习,在高分辨率的气候模拟中识别极端天气模式。
“这仅仅是AI加速科学发现的诸多例子之一。将这项技术交给研究人员,让他们可以去做一些以前不可能的事情,这真是令人感到兴奋。”
凭借其在高性能AI领域的努力,NVIDIA在全球最强大的500台超级计算机中的地位日益凸显。例如由96个DGX-2H系统和1536个Tesla V100 GPU组成的NVIDIA DGX Superpod在该名单上名列第22位。
Buck在GTC的演讲中提到:“使用该系统,可以在约80秒内完成对ResNet-50的训练,堪称神速。”