从5V到5G:通信和其它行业是如何部署AI的?
2019-06-22 09:00
这样的转变同样也可以为许多其他行业带来益处。如果把数据比作是许多企业的矿产资源,那么AI就是帮助他们从中找到黄金的利器。
当电信公司重新评估其IT基础设施以提供对网络健康和最佳客户服务的高可视性时,他们主要面临四个需要考虑的关键因素。
数据优先自动化
包括电信在内的各种企业都正在探究数据优先自动化。数据优先自动化指的是通过在加速数据科学环境中结合领域专业知识,将数据前置于决策之前,并最终使用自动化来加速数据的时间并增强人类的能力。
电信运营团队面临三个重要趋势:
-
5V特性已经失效。大体量(volume),大价值(value),时效性(velocity),多样性(variety)和准确性(veracity)是数据的五个特征。大体量的数据量因体量太过庞大而无法完全保存。数据的价值因为无法获取其中的洞察力而变得很低。除非投入大量的资金,否则时效性和多样性很难保证。而且准确性通常会受到人工干预的左右。
-
采用VAST。根据OmniSci所提出的,VAST是解决5V下降的解毒剂。OmniSci是一家GPU加速分析和可视化公司,而VAST代表: 大体量(volume),灵活性(agility)和时空(spatial temporal )。数据量正在增长——在通常的用例中, 10亿行数据是很常见的。分析师预计,灵活的仪表盘和管线能够实现实时数据接收和决策。今天创建的数据记录中,至少有80%包含时空数据,其中数十亿个数据点可以在毫秒内可视化。
-
人工智能不能等待,所以以光速移动。识别客户的问题;构建产品;收集和规范数据;将数据可视化;并尽可能快地做出决策。
努力保持相关性
人工智能可以帮助企业机构在竞争中保持领先地位。其有助于预防一些可能会发生的突发状况;还可以提供另一道防线,随时关注企业机构的利益。
但这需要投入和努力去理解人工智能技术如何以有意义的方式帮助解决用例,以及理解潜在的局限性:
-
建立深度学习模型是件美妙的工作,但数据是基础。在数据上花费时间——清理数据、规范化数据、应用相关人工智能技术——可以避免出现垃圾信息进出的情况。
-
数据的结构和隐私与管理法规的编写方式不同。传统数据保护方式的改进速度不够快,无法跟上数据整合的步伐。
-
随着用于人工智能的数据以远超于IT团队所能理解的速度增长,许多企业机构都在努力满足其对硬件基础设施需求。他们需要备受隐性成本、不断增加的工作量和隐性IT工作的折磨。
GPU加速以节省时间、资源和金钱
采用GPU加速的深度学习数据准备解决方案(例如:Datalogue),能够借助于深度学习技术来实现数据的自动提取、理解、转换和加载。无需花费时间等待结果,或者使用人工来完成繁琐的任务。
使用GPU加速机器学习算法和库(如RAPIDS)可以帮助加快模型训练时间、未来预测和异常检测。
而且,GPU加速的分析和可视化平台(如OmniSci),可以在毫秒内将数十亿行数据可视化。这使数据科学家和分析人员能够高效地工作,并利用他们的创造力从数据中获得见解,并创建及时且有价值的报告。
这些工具可以解答以前无法解答的问题,并通过大量数据获得更全面的视图。
例如,Datalogue用户能够发现,他们的数据处理时间缩短了98%。其投资回报率是每月几十万美元。使用Datalogue,他们每月能够生成10万条以上的数据管线。
Omnisci用户们可以在300毫秒内轻松查看100亿行数据集,无需索引或聚合。
这些综合产品已经帮助Datalogue、Omnisci和NVIDIA的用户们节省了至少5000万美元的运营成本。
现在开始使用!但如何开始?
说到部署人工智能,每个人都在说要现在就开始,但是到底该如何开始呢?
-
首先,需要确定企业机构或其客户难以解决的基本用例,无论是在自动化、报告还是治理中。想想用人工智能自动化工作流的某些部分将如何改变数据的使用、保存和转换方式。
-
清楚地定义其中一些用例并证明概念。考虑将结果可视化能够如何帮助用户加深对结果的理解。并添加一个扩展用例,通过向数据集或其他高级发现模型应用预测模型来扩展新数据的可用性。
-
数据是洞察的生命线。快速实验,然后规模化应用。如果你能在一周内达到90%以上,那比一年内达到100%更有价值。在设计数据流程时,考虑您正在解决的问题,而不是数据源。
-
用数据解决问题需要团队合作。为不同团队成员选择合适的工具,然后优化底层平台,以提供工具和接口,将其贡献最大化。