首页 > 最新资讯 > 百度智算峰会精彩回顾:加速计算助力智能云深入产业
百度智算峰会精彩回顾:加速计算助力智能云深入产业

百度智算峰会精彩回顾:加速计算助力智能云深入产业

2022-12-29 13:44

#人工智能 #深度学习


过去十年,全球迎来一场 AI 革命,人工智能在各行各业引发了颠覆性的变革。在机器学习深度学习、大规模语言模型等 AI 能力的加持下,自动驾驶、生物医药、行业大模型、智算中心等行业和领域正迎来百万倍的效率飞跃。而这一切的背后,离不开加速计算

在今日举行的“2022 百度云智峰会·智算峰会”上,NVIDIA 亚太区开发与技术部总经理李曦鹏分享了以“加速计算助力智能云深入产业”为题的演讲,介绍了 NVIDIA 在加速计算领域的思考及洞见,包括 NVIDIA 如何与客户一起探索互联网行业的加速计算解决方案,实现端到端的极致性能优化,以及加速计算可以如何助力云深入到行业。以下为内容概要。

 

10 年 100 倍,加速计算价值千亿的巨大空间

我们首先看一下加速计算,以及各种计算任务(workload)如何上云。

对于一个现代的加速计算集群,这个集群可以是云上的一个高性能集群,也可以是客户自建的一个加速计算集群。它们需要去承担非常多种类的计算任务,从 AI 任务到 simulation(模拟或仿真),以及二者的组合 Sim+AI,或者 AI for Science,再到目前最火爆的数字孪生、量子计算等。大家可以看到,加速计算集群需要去支撑的计算任务非常丰富,实际上,这里还有大量,类似于数据处理、云端渲染、信息召回,数据库等也同样需要去加速的计算任务没有罗列出来。

大家可能会说,上面的这些计算任务是一个数据中心的典型应用,为什么要说是加速计算集群的典型应用呢?过去几十年间,得益于摩尔定律,算力在持续增长。但如今摩尔定律已经放缓,从最初每年 1.5-1.6 倍性能的提升,下降到如今每年 1.1 倍左右的提升。与此同时,加速计算却依然保持着每年 1.6x 以上的性能增速。五年可以实现 10 倍的性能提升,十年就可以实现 100 倍的提升,这与摩尔定律十年可以实现的 4 倍性能提升形成了显著的差异。

另一个方面,碳足迹、能源消耗,以及机房空间等各个因素,都制约了传统计算的规模扩大。如果大家看一下使用了加速计算的 Green 500 前 30 的超级计算机,它们的平均效能比是其他超级计算机的 7 倍多。这不但带来了能源的节省,也同时带来了更低的成本,使得我们的计算任务,特别是以 AI 为代表的计算任务可以不断地持续增加。

针对 AI 部分,和大家通常理解的只是模型训练和预测不同,NVIDIA 一方面需要对整个工作流提供端到端的加速,另外,也需要通过对不同部分的模块化,普惠到更多企业和终端用户。NVIDIA 在这方面一直引领业界,我们也提供了从基础设施、调度、加速库、加速框架、部署工具,一直到最上层的应用框架的全套解决方案,也就是 PPT 中所展示的 NVIDIA AI 平台软件 NVIDIA AI Enterprise。这里我就不具体展开,只是举一个例子。

我们以典型的 AI 模型端到端流程,介绍 NVIDIA 能提供什么支持。通常我们看到的,其实是图中中间的两个步骤,训练和预测,还有部分人在预测的时候也会简单使用框架进行预测。但是实际上,问题比这个复杂很多。

首先我们需要去做数据预处理,这里 NVIDIA 提供了 RAPIDS (针对结构化的数据),CV-CUDA(针对图片数据)等各种解决方案。

数据预处理的一个难点,需要做到训练预测的一致性,减少调试过程。处理好的数据需要喂给模型训练,模型训练企业用户可以选用不同的框架。NVIDIA 加速了 PyTorch、TensorFlow、JAX,还有国内越来越流行的 PaddlePaddle 等框架。同时,也有 TAO Toolkit 来做迁移学习

这里的一个难点是,需要做好数据预处理和训练的流水,避免频繁的数据搬运。有了模型之后,我们需要做预测优化。TensorRT 是现在精度最高、速度最快的深度学习推理优化器,NVIDIA 也在不断提高它的性能,并与各个深度学习框架集成,降低使用门槛。有了加速预测的模型后,我们可以使用 Triton 来进行大规模的部署。而实际使用中采集到的新数据,又可以用于训练。如果我们只是加速其中一部份,是没有办法达到模型的快速迭代,和实现整体性能的成倍提升,因此我们强调端到端的优化。

刚才我们以 AI 为例,讲到了 AI 类的计算任务如何可以被加速。但是实际上,目前世界上只有 5% 的计算任务被加速,这已经是几百亿美金的市场。

未来十年,所有的计算任务都将被加速,包括现有的以及十倍于现阶段的新计算任务!这将为加速计算市场带来 100 倍的增长空间!

<p style="\'margin-bottom:" 0px;outline:="" 0px;max-width:="" 100%;color:="" rgb(34,="" 34,="" 34);font-family:="" system-ui,="" -apple-system,="" blinkmacsystemfont,="" "helvetica="" neue",="" "pingfang="" sc",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;letter-spacing:="" 0.544px;white-space:="" normal;background-color:="" rgb(255,="" 255,="" 255);text-align:="" center;box-sizing:="" border-box="" !important;overflow-wrap:="" break-word="" !important;\'="">

相关新闻