首页 > 最新资讯 > 笔记本电脑为何常常无法满足数据科学需求?
笔记本电脑为何常常无法满足数据科学需求?

笔记本电脑为何常常无法满足数据科学需求?

2021-03-09 18:33

#人工智能 #深度学习


对于现在许多需要在工作中处理高强度AI和数据科学工作负载的人而言,具备完整GPU加速功能的移动工作站必不可少。

1979年,万国联合收割机公司(International Harvester)在推出“Scout”越野车时(这款车被许多人认为是现代SUV的先驱),提出了“绝非一辆普通汽车”(Anything less is just a car.)这句令人难忘的宣传语。

当这辆车趟过一条泥泞的河流时,这则广告明确指出,普通汽车根本无法满足所有驾驶要求,但坚固耐用的Scout越野车将为消费者带来卡车所具备的各种优势。

 

1979年万国联合收割机公司的Scout越野车广告片

 

对于现在许多需要在工作中处理高强度AI和数据科学工作负载的人而言,具备完整GPU加速功能的移动工作站就是计算机领域的Scout——绝非一台普通的笔记本电脑。

如同SUV是为了应对苛刻的越野驾驶条件而打造一样,移动工作站也是为了满足针对数据科学和AI工作负载的极端需求而设计。移动工作站需要完整的GPU加速AI堆栈,还必须具备大型GPU内存去处理AI算法所需的大型数据集。

所有内置GPU的笔记本电脑都能为合适的工作负载提供一定程度的加速处理,但移动数据科学工作站所提供的优势不仅仅只是速度。尽管它们的性能非常强大,但其中一些工作站重量却出奇得轻。

移动工作站更适合用于数据科学主要有以下四个原因。

1. 解放开发者,提高其工作效率

在移动工作站上进行开发工作可以为开发者提供更高的自由度和工作效率,从而在本地和远程计算之间实现更好的平衡。

 
 

移动工作站所提供的自由度让开发者可以随时随地进行大胆的实验和极具创造性的开发项目。开发者可以根据需要随心所欲地作出任何尝试,这种灵活性可以带来更好的工作方式、生活方式和更高的生产力,同时减轻开发者的压力。

本地实验和迭代能力使数据科学家能够在大型数据集和训练模型等最有意义的地方使用云。此外,当开发者可以轻松试验不同的算法、参数和数据而无需考虑云端设置和成本时,工作效率得以大大提升。其他开发任务包括审核和清理数据、探索数据特征以及评估、建立和测试模型也可以变得更高效、更节省成本。

移动工作站在交互式工作负载、直播流媒体对象检测和许多自然语言处理(NLP)模型方面表现出色,同时它也让探索性编程变得更加容易。通过NLP模型(例如自动语音识别、文本转换语音和光学字符识别)的微调进行本地评估可以缩短实验时间,而且在处理直接与摄像头、麦克风和显示器交互的模型(比如在制作语音机器人原型)时速度也更快。

许多数据科学家正在通过快速多次迭代和快速试验结果来优化移动工作站上的AI工作负载。优化后,大数据集在本地服务器或云资源上的运行效率变得更高。

移动工作站在得到GPU优化软件目录(如NGC hub)的支持时,生产力将进一步提高。开发者可以免费下载预先训练的模型、GPU优化的AI、深度学习框架和各种特定行业AI软件开发包,比如用于自然语言处理的NVIDIA Jarvis和用于推荐系统的NVIDIA Merlin

2. 降低成本,更快获取结果

虽然任何笔记本电脑都可以将AI工作负载发送到云,但成本可能会迅速增加。本地或远程共享资源的调度需求可能会延迟数据准备结果以及使用机器学习、深度学习和其他密集型工作负载分析模型的开发结果。

移动数据科学工作站能够让您轻松借助云的功能。在本地进行云计算实验可以显著降低成本并节省时间。因此,移动工作站开发工作流程中唯一会产生重要云成本的环节就只剩下密集模型训练了。

就像拥有一台自己的汽车所产生的固定成本远超拼车所产生的计价成本一样,移动工作站能够为许多具有一定规模的数据科学工作负载节省大量成本,包括使用机器学习和深度学习的训练模型。

除了运营成本外,共享资源经常需要预定,这可能会遇到瓶颈或者设置和使用十分不便。此外,还必须考虑到收支平衡成本以及将大数据从边缘迁移到云的成本。实际上,在内置GPU的工作站上执行时,使用较大共享资源运行的工作负载效果会更加明显。

3. 体验一致

为了实现跨移动工作站、企业本地工作站和服务器的一致体验,需要一个一站式的数据科学堆栈。如果没有它,当堆栈转移到最终可能运行工作负载的中间服务器或生产服务器时,移动工作站的强大性能优势就会丧失。

 
 

更糟糕的是,开发者在移动工作站上有效深度学习算法的辛苦工作,可能会因在具有不同软件栈的服务器上运行时发生意外情况而功亏一篑。

4. 丰富的软件生态系统加快开发速度

和大多数笔记本电脑一样,移动数据科学工作站可以运行当下流行的办公应用。

而GPU加速平台的软件丰富程度使得开发者可以借助预建的软件管道来完成计算机视觉、NLP和推荐系统等特定任务,并且快速启动开发工作。

种类齐全的库确保了目前的开发优势,同时也为未来带来了灵活性。另外,大量软件库已获得在理想的GPU上运行的认证,这一点同样十分重要。

作为数据科学工作负载的事实标准,NVIDIA GPU已获得了业界最广泛的软件支持,形成了一个软件生态系统来为用户提供用于许多特定任务的预制软件管道。此外,RAPIDSCUDA等低级别库能够帮助开发者开发他们自己的管道。

是什么在推动数据科学发展?

企业和数据科学家需要确保他们的笔记本电脑是否为应对数据科学和AI挑战而进行了调整。随着数据科学型应用的日益普及,他们还需要考虑不通过移动平台加快开发速度所带来的成本。

NGC-Ready数据科学移动工作站的软件堆栈中包含了TensorFlow和PyTorch等使用最广泛的AI框架和SDK,它们可以为开发者提供节省环境设置时间。

相关新闻