人工智能基础架构的发展观
2019-05-10 09:00
众所周知,目前人工智能依旧处于早期发展阶段。并且,在一些开发者们的见证下,人工智能从一门抽象的学术研究演变成了一系列可以实际应用的商业应用程序和新技术,为各个行业领域带来转变。
在将于本周举行的The Next AI Platform 活动现场,众多AI基础架构领域的先驱者们将汇聚一堂。其中就包括曾在Twitter领导其AI项目的Clément Farabet,他将登台参加现场访谈和座谈活动。
与大多数开发者不同,Farabet从AI和机器学习还处于萌芽之时起,就已经投入到了这一领域当中,那时GPU还没有像今天这样,被用来作为人工智能的主要动力。他早期就职于新南威尔士大学(University of New South Wales)和纽约大学(New York University),那时他还在使用FGPA作为计算平台,用于他的研究活动——研究使用卷积神经网络(CNN)来分析视频和图像。
2013年,Farabet与他人合作,联合创建了一家初创公司——MadBits,该公司主要借助深度学习视觉技术进行图像和视频识别技术的开发工作。2014年,该公司被Twitter收购,随后Farabet加入Twitter,开始为Twitter开发AI应用——他组建并管理了一支团队,为Twitter提供机器学习技术基础框架。
2017年,Farabet加入NVIDIA,领导AI基础框架/平台团队。该团队主要关注于自动驾驶汽车领域,但同时也参与NVIDIA在机器学习和数据科学领域的开发工作。近期,在接受访谈的时候,Farabet谈到了人工智能领域的飞速变化;同时他也表示:加入NVIDIA,给了他更广阔的视野去了解该技术正在向着怎样的方向发展。
“在过去的六七年当中,我们看到了深度学习的飞速发展,”Farabet提道。这种爆炸式的技术发展为像Twitter这样的社交媒体公司有能力和用户群体建立更加紧密联系,这种联系使得社交媒体公司与用户之间的关系比以往任何时候都要亲密。
与其他众多的社交媒体公司一样,Twitter有着庞大的用户原始数据,可以用于各种深度学习用例。于是,这些数据被用于搭建Twitter的推荐系统,该系统主要被用来向用户推送广告及其他用户发布的信息;此外这些数据也被用来优化Twitter平台的搜索和排名功能。在Twitter工作期间,Farabet组建了一个名为Cortex Core的内部团队,该团队负责深度学习平台的开发工作,为Twitter的各项产品和服务提供动力。
加入NVIDIA之后, Farabet转而投入到了自动驾驶领域当中。自动驾驶领域的数据和社交媒体领域有着本质的不同。在这一领域当中,没有像社交媒体领域那样庞大的数据基础可以利用;NVIDIA必须首先搞清楚如何从飞驰在公路上的汽车当中搜集数据。这需要使用与社交媒体行业所不同的数据存储体系架构和数据管理模式。
而所有的这一切让我们认识到,深度学习的核心其实是数据科学。数据科学是一门历史久远的学科,至今已有超过20年的历史。如今,数据科学是数据中心、深度学习和其他众多应用程序的核心要素。NVIDIA的SATURNV系统可以说就是一个缩影,向我们展示了:随着数据驱动的人工智能应用程序被纳入主流,变得更大、更多样化,架构思维是如何发生改变的。
根据Farabet的介绍,尽管SATURNV被视作是一台AI超级计算机,但其于2016年搭建的原型机依旧采用的高性能计算架构,可适用于传统的科学工作负载。这意味着,在搭建该系统的时候,运算节点间的互联互通是备受关注的一点(SATURNV节点采用了EDR InfiniBand)。但随着神经网络的规模日益庞大、复杂程度日益加深,其关注重心也从计算强度转为数据强度。
“这着实改变了我们对SATURNV的认识,” Farabet说到。“我们从当初的关注于高性能计算和节点之间的高性能互联,转而开始关注存储和计算之间的互联,以及云和计算之间的互联。”
接下来的是一个不断扩展的软件生态系统——它将支持这种以数据为中心的环境及其相关的工作负载,这包括一系列新的工具套件和应用程序:包括容器,生命周期管理包和软件定义存储。毋庸置疑,这一演变过程还远没有停止。