3U一体,英伟达用DPU掌控数据时代
2021-04-14 19:28
就在刚刚结束的GTC2021峰会上,号称“AI教父”的黄仁勋再度以他标志性的皮衣出场,在自家厨房召开了全球瞩目的发布会。自从去年新冠疫情肆虐开始,“厨房演讲”就成为了黄仁勋的又一标志,而就在这次GTC2021大会上,黄教主更是发布了三款“激动人心”的新品——专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU以及业界首款1000TOPS算力的自动驾驶汽车SoC。更重要的是,在这次演讲中,表示将对包括未来英伟达的芯片架构进行重新打磨,以两年为一周期,在x86平台和Arm平台之间进行切换。
3U一体,英伟达开创新纪元
结合发展路线图,我甚至从中看到了一点TICK-TOCK战略(即按年度在架构和工艺之间切换)的影子,而上一个提出这一想法的是摩尔定律的提出和践行者英特尔。不过我们都知道,受限于芯片工艺,英特尔早在2015年就放弃了对这一战略的坚持,而如今我们看到的英伟达显然已经有了自己的战略构想,甚至可能开启属于自己的“定律时代”。
一直以来,大家对于英伟达的印象都是一家GPU加速计算解决方案提供商,尤其是在当下的智能化时代,我们通过英伟达的GPU进行加速计算而迈向了人工智能的新时代,机器学习、深度学习、神经网络等一系列名词都得益于GPU加速计算;而就在这大会上,英伟达出乎意料的“三箭齐发”,特别是CPU和DPU的发布让业界看到了英伟达的改变——未来英伟达完全有能力基于自家产品打造含CPU、GPU和DPU在内的一站式解决方案,再也不需要借助于其他任何处理器或者任何平台。
至此,英伟达也成为了一家全栈计算加速解决方案提供商,官方自称是“ a full stack accelerated computing company”。从这个角度来说,英伟达已经成为集CPU、GPU和DPU为一体的厂商,也成为了未来数字化时代里必不可少的关键厂商之一。不过相对于大家普遍看好的NVIDIA Grace处理器来说,我反而更关注数据处理的NVIDIA BlueField-3 DPU,很显然在海量数据浪潮的面前,专用优化的DPU才是未来的主力,就像AI时代的GPU一样。
相信很多人对于CPU(中央处理器)已经非常熟悉了,毕竟大多数人开始接触电脑的时候CPU就已经成为了绝对的核心。但是伴随着计算力的提升,尤其是异构计算的发展,最近几年GPU加速计算成为了人工智能、深度学习和大数据分析应用的关键。在如今的大数据时代,我们的手机、平板电脑、智能设备等等每天都会产生大量的数据,按照IDC的预测到了2025年全球数据总量可以达到175ZB,而要想妥善处理和应用这些数据,仅仅依靠当下的CPU和GPU都不太可能,由此才有了DPU的概念——Data Processing Unit ,数据处理器。
DPU,数字时代的核心发动机
DPU可以被看作是数据中心加速计算模型的第三个计算单元,用黄仁勋的话说则是“未来计算的三大支柱之一”。而它之所以被给予如此厚望,主要因为DPU是一种新型可编程处理器,它结合了行业标准的、高性能及软件可编程的多核CPU架构、高性能网络接口和各种灵活和可编程的加速引擎于一身,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。
比如我们刚刚提到的BlueField-3就是首款为AI和加速计算而设计的DPU,它针对多租户、云原生环境进行了优化,提供数据中心级的软件定义和硬件加速的网络、存储、安全和管理等服务。作为业内首款400G以太网和NDR InfiniBand DPU,BlueField-3采用的是ARM架构,具备16颗物理核心和18M IOPs弹性块存储,相比上一代产品来说其加速计算能力提升了10倍、加密速度提升了4倍。
如果你熟悉网络,又恰好用过Mellanox的网络设备,那你对于“卸载”这个词一定不会感到陌生。一直以来,我们都很信赖CPU,也为CPU安排了许多的任务。纵然伴随着科技的发展,CPU的算力越来越强,但不断增长的计算需求还是让处理器“压力山大”,很多时候许多业务不得不进行排队,尤其是对于处于“远端”的网络来说。
但是这种排队往往是致命的,会带来大量的时延,这也是网络厂商和用户都不能接受的。所以,网络企业就提供了“卸载”能力,在网卡上使用更智能、更强大的芯片,从而让业务不通过处理器本身而实现快速响应。这就相当于原本所有业务都在等公交车,这时候一个叫“网络”的小伙子开着汽车呼啸而过,那场面想想就觉得挺激动。
这就是“卸载”的价值所在。可以说,“卸载”是让处理器回归高级处理本质,让网络提升效率的最有效手段,而“卸载”能力的大小则与最终性能表现密切相关。在之前发布的BlueField-2上只提供30个CPU核心的“卸载”能力,而最新一代的BlueField-3则实现了10倍的加速计算性能提升,将这个数字提升到了300个CPU核心,并且在ConnectX-7网络芯片的加持下可以实现400Gbps的以太网或InfiniBand网络传输速率,这也就意味着无论是“卸载”能力还是“卸载”速度都获得了飞跃——也就是我们前面提到的“加速计算能力提升了10倍、加密速度提升了4倍”。
作为英伟达生态的一部分,这次发布的BlueField-3也同步提供了基于NVIDIA DOCA(集数据中心于芯片的架构)软件开发包的下载,该开发包提供了用于配置、升级和监控整个数据中心数千个DPU的编排工具,以及各种库、API和日益增加的各种应用,如深度数据包检测和负载均衡等,是一套的软件平台。如此一来,开发者们就能根据为应用场景自定义需求,实现软件定义和硬件加速的网络、存储、安全和管理等应用,更好的利用DPU工具。
多应用扩展,英伟达让网络变得更安全
火车跑得快,全靠车头带。为了让DPU发挥出更大的价值,除了DOCA开发包之外,英伟达也在这次大会上发布了一款名为NVIDIA Morpheus的应用框架,旨在为网络安全合作伙伴提供一整套能够实时检测和预防安全威胁的加速AI技术。据悉,Morpheus可以充分发挥NVIDIA AI计算和NVIDIA BlueField-3 DPU的优势,为用户提供从核心到边缘的数据中心保护能力。
虽然网络安全一直是整个行业的老生常谈,但是安全隐患本身却伴随着互联网的发展日新月异,攻击伪装得越来越好、病毒隐藏得越来越深、造成的损失也越来越大。据2019年全球互联网大会发布的报告指出,“为满足现有需求,网络安全人员数量需要增加145%”,很显然整个产业无法在短期内增加足够的人手,而过重的人力资源负担也会造成整个行业的成本飙升。因此,要解决网络安全问题,不能依靠提升人力覆盖,而是需要借助于更智能化、技术化的手段来实现。
权威分析机构Gartner则给出了另一个方向。在Gartner发布的网络检测和响应(NDR)市场指南中,明确提到要“将机器学习等分析技术应用于网络流量的NDR技术能够帮助企业检测其他安全工具检测不到的安全威胁,手动和自动响应功能是这个进入门槛较低的市场的竞争焦点”。应该说,这是一条正确的道路,也有可能帮助整个产业实现网络安全管理的数字化与智能化。很显然,这次英伟达Morpheus应用框架的发展也迎合了这种趋势。
“零信任安全模式要求我们实时监测数据中心的每一个操作。这是一个重大的技术挑战——必须在服务器内即刻感知入侵、发现威胁,且不影响现代数据中心的数据处理性能。NVIDIA Morpheus结合了服务器内的Mellanox网络和NVIDIA AI技术,通过对完整数据包进行实时检查来预见威胁,达到了威胁一出现即被消灭的目的”,黄仁勋表示。相对于传统方式,这一解决方案的最大特性就是将数据中心的计算阶段变成了边缘网络防御传感器,在同一个网络架构内,企业无需复制数据,也能够以线速分析每个数据包,而传统的AI安全工具通常只能采样5%左右的网络流量数据,在安全效果上两者并不可同日而语。
更重要的是,作为应用框架,Morpheus为开发者提供了深度学习的能力,任何人都可以基于模型创建自己的Morpheus AI功能,这样用户也就能够根据自己的应用场景选择最适合的方式,实现差异化。未来,通过在边缘和AI技术的结合,用户可以对网络安全实现实时的遥测、策略执行及操作,而这并不会影响到正在运行的业务和正在传输的数据,从而使得网络安全和数据分析变得更加智能和自由。
如今,英伟达正在与包括ARIA Cybersecurity Solutions、Cloudflare、F5、Fortinet和Guardicore等公司在内的多家行业安全巨头商讨合作内容,而包括Canonical、Red Hat和VMware等混合云平台解决方案供应商也表示将采用这一技术。我们相信未来这个数字还会不断的扩大,未来用户甚至在混合云端都可以即刻体验到这一技术,也可以获得最大限度的网络安全保障,实现业务高效、稳定、安全运行。
从计算到网络,从GPU到CPU和DPU,英伟达构建的“AI帝国”已经初步完成。如果说最早是CPU在数据中心“一统天下”,随后在GPU出现后变成了“划江而治”的话,那么DPU的发布更让这种关系变成了“三足鼎立”,这也标志着英伟达以后的产品很难再“假手他人”。或许未来,我们在选购计算设备的时候可以买到完全出自英伟达的整套解决方案,而这在不经意间就会改变原有的市场格局。