内容介绍
该主题节目将分三期围绕NVIDIA GTC 2020主题演讲中重磅发布的Ampere架构,与大家进行深入讨论。本期为第二期节目,将向大家深入介绍首款采用NVIDIA Ampere架构的NVIDIA A100 GPU的五大关键性技术创新。
全新NVIDIA A100 GPU可将AI训练和推理性能提高20倍,其突破性技术设计来源于五大关键性创新:采用包含超过540亿个晶体管的7纳米Ampere架构、具有TF32的第三代Tensor Core核心、多实例GPU、第三代NVIDIA NVLink、以及结构化稀疏。
在本期节目中,您将了解到以下精彩内容:
--- 多实例GPU(MIG)技术在不同场景下,可以带来哪些应用优势?
--- 第三代Tensor Core核心具有哪些技术特点?
--- 针对神经网络计算,NVIDIA Ampere 架构采用TF32精度是出于什么考虑?
--- 用户若想利用结构化稀疏特性,需要遵循哪些步骤?
--- 第三代NVIDIA NVLink技术如何使服务器的性能得到高效扩展?
本期嘉宾介绍:
赖俊杰
赖俊杰博士,现任 NVIDIA 中国区工程及解决方案总监,清华大学电子工程系本硕毕业,法国 INRIA 博士毕业,博士期间的主要研究方向包括 GPU 架构研究,及 GPU 性能分析模型。在并行程序的性能分析,以及性能优化领域有丰富的经验。现在工作的重点是带领团队协助 NVIDIA 的关键用户完成机器学习应用的工程落地,以及尝试利用机器学习的最新技术,解决计算机视觉、语音、游戏等行业应用中遇到的实际问题。
全新NVIDIA A100 GPU可将AI训练和推理性能提高20倍,其突破性技术设计来源于五大关键性创新:采用包含超过540亿个晶体管的7纳米Ampere架构、具有TF32的第三代Tensor Core核心、多实例GPU、第三代NVIDIA NVLink、以及结构化稀疏。
在本期节目中,您将了解到以下精彩内容:
--- 多实例GPU(MIG)技术在不同场景下,可以带来哪些应用优势?
--- 第三代Tensor Core核心具有哪些技术特点?
--- 针对神经网络计算,NVIDIA Ampere 架构采用TF32精度是出于什么考虑?
--- 用户若想利用结构化稀疏特性,需要遵循哪些步骤?
--- 第三代NVIDIA NVLink技术如何使服务器的性能得到高效扩展?
本期嘉宾介绍:
赖俊杰
赖俊杰博士,现任 NVIDIA 中国区工程及解决方案总监,清华大学电子工程系本硕毕业,法国 INRIA 博士毕业,博士期间的主要研究方向包括 GPU 架构研究,及 GPU 性能分析模型。在并行程序的性能分析,以及性能优化领域有丰富的经验。现在工作的重点是带领团队协助 NVIDIA 的关键用户完成机器学习应用的工程落地,以及尝试利用机器学习的最新技术,解决计算机视觉、语音、游戏等行业应用中遇到的实际问题。
订阅英伟达 NVIDIA 技术月刊