首页 > 最新资讯 > 利用GPU实现用机器研究对话的科学,为了更好的销售结果
利用GPU实现用机器研究对话的科学,为了更好的销售结果

利用GPU实现用机器研究对话的科学,为了更好的销售结果

2019-04-18 09:00

#深度学习


 

睿科伦智能基于NVIDIA Tesla V100(立即免费试用) GPU的超大显存和非凡性能,实现了其核心产品交易磁带(DealTape)智能呼叫系统的语音识别与语义分析模型的快速训练推理。

 

睿科伦智能(Recurrent.ai)成立于2016年5月,致力于用机器研究对话的科学,并个性化地教给每个销售,让每次销售都有更好的结果。

 

公司拥有来自清华大学、卡内基梅隆大学的顶尖科学家、工程师和经验丰富的解决方案专家组成的精英团队,团队成员曾效力于Google Brain、Facebook AI Research、微软亚洲研究院等全球顶级人工智能机构与IBM全球咨询服务部、Cisco等全球领先的企业服务公司。

 

睿科伦智能团队具备深厚的人工智能研发实力,曾获NVIDIA先锋研究奖、Facebook ParlAI研究奖、北京市科学技术奖一等奖、吴文俊人工智能技术进步奖一等奖等;曾作为核心开发者研发了全球知名的科技大数据分析平台AMiner;2018 GTC China大会期间,睿科伦智能凭借在语音NLP领域的创新和对销售行为优化的贡献获得“NVIDIA 2018中国人工智能初创公司挑战赛”第4名的成绩。

 

语音识别的三大应用挑战

 

金融、教育和B2B等行业有大量公司会购买呼叫系统,他们对监督坐席与客户沟通的过程有着强需求,然而过去囿于技术,大部分录音只能靠人工重听或者弃置,没有利用它获得任何价值。

 

睿科伦智能聚焦证券和金融行业,拥有自主研发的全栈人工智能平台和大规模机器学习深度学习框架与算法,为券商、银行、保险、资管等金融机构以及更多企业提供 AI 技术方案和业务解决方案,实现机构及企业的 AI 转型和升级。

 

在消费结构进一步优化的当下,销售话术执行差、客单流失大、成单率低、销售客服新员工培训成本高等问题已经成为很多企业关注的重点。电话录音可追溯而不可作假的特性,让呼叫系统成为了一个不可篡改的精准用户画像来源。同时坐席与客户的全部沟通过程也完整保留在电话录音中,这意味着影响成单率的全部因素都在录音之中,只要能准确地把它们提取出来,就能有效提高企业的价值。

 

现行的语音识别在企业专业领域的运用面临的困难主要体现在三方面:

 

  1. 算力问题,语音识别的计算资源低效,导致识别速度慢,延迟长,信息总是滞后;

  2. 算法问题,现行通用的语音识别引擎识别专业领域电话录音的正确率低,效果差,丢掉很多关键信息,不足以支撑上层的语义处理任务;

  3. 上层NLP和数据分析挖掘技术问题,语音识别的结果离商业价值中间仍隔了大量复杂技术环节,技术完成商业变现的周期非常长,人力成本很高。

 

GPU带来全方位的解决方案

 

睿科伦智能核心产品交易磁带(DealTape)智能呼叫系统,拥有自主知识产权的核心技术栈,利用NVIDIA Tesla V100 GPU的超大显存和非凡性能,实现了语音识别与语义分析模型的快速训练和推理。

 

与睿科伦智能最早使用游戏级GPU进行对比,NVIDIA Tesla V100 GPU将每个Batch的计算时间缩短到原来的一半,同时Tesla V100 GPU的高显存可以将Batch Size提升到原来的400%,将深度学习模型的训练周期从一周缩短到一两天,并且将深度模型的参数数量提升了100%,显著提升了模型准确率。

 

在NVIDIA GPU强大的算力助力下,交易磁带(DealTape)突破了语音识别、说话人分离、话术执行质检、自动客户画像、话术推荐、话术提炼等核心功能的自研:

 

  1. 语音识别定制 通用引擎对企业专有名词的识别率较差。语音识别定制需要经过一个基线模型的积累,在这之后,数据就可以先让基线模型进行预识别,即使CER有三十多或者四十多,但是大部分字还是正确的,标注员可以对它进行标注,这样成本就大大降低了。交易磁带(DealTape)最新的基线模型是已经用了10000小时左右的标注数据进行训练的结果,对于已有积累的相关行业,标注的目的只是适配一下数据特点,只需要进行「轻标注」,标注量仅为全标注的十分之一,最大程度缩短测试周期,为企业节省大量时间成本及相应维护的人力成本。

     

  2. 话术分析与挖掘 拥有很多服务人员的大型企业都有非常标准的话术模版,通常来自于咨询公司或内部业务专家。但这些话术跟成单的真正关系难以得到验证。一方面,交易磁带(DealTape)基于上下文的语义抽取技术能高精度的检测服务人员对话术的执行情况。另一方面,与其它解决方案不同的是,DealTape可以将话术跟成单的关系这样的actionable insight完全解码可视化给各级管理者,辅助销售业绩的增长。对大多数完全没有模版的企业来说,DealTape基于深度学习的话术提炼黑科技可以直接根据销售目标提炼出最有影响力的模版和流程,比专家更加全面与客观。

     

  3. 语言模型的突破支撑垂直行业高精度语音识别,话术质检和话术提炼 语言建模是影响语音识别和话术挖掘效果的核心因素,睿科伦智能在语言建模这一NLP核心任务上取得了一系列突破,包括Highrank语言模型和Transformer-XL模型,在所有六个主流语言建模数据集上取得了世界第一(state-of-the-art)的结果,这也是历史上首次有团队在这六个数据集上同时取得世界第一的结果。

     

其中,Highrank语言模型指出了当前主流语言模型存在的表达能力根本缺陷,并提出了混合Softmax的方法解决了这一问题。Transformer-XL模型极大地提升了对超长序列进行建模的能力,其有效建模长度相比于传统RNN和标准Transformer分别提升80%450%,并且将Transformer模型在测试阶段的速度提升了超过1800倍。有了这样高效准确的建模能力,DealTape能够快速为每个客户交付客户专属的高精度语音识别和话术挖掘模型。

 

睿科伦智能联合创始人兼CEO陈麒聪先生表示:“沟通是人类社会的基础,睿科伦致力于通过我们的技术和创新,帮助各领域最优秀的公司优化每一次销售沟通的过程,提升沟通效率,助力他们开拓更专业更高效的行业新阵地。NVIDIA提供的GPU人工智能计算解决方案使我们快速突破了语音语义模型的深度学习技术开发,相信基于NVIDIA 深度学习平台的助力,将会高质量改善现在销售市场混乱低效不合规的状况,大大提升企业的销售转化率,让消费者真正享受到更及时更有针对性的商品和服务,有效帮助企业提升客户体验。”

 

AI赋能销售,深度挖掘商业价值

 

交易磁带(DealTape)智能呼叫系统采用了NVIDIA Tesla V100 GPU深度学习平台,每个客户的深度学习语音语义模型的训练时间从一周缩短到一到两天,且可以运行模型的参数数量提升了100%从而显著提升了模型准确率。这一改进有效地赋能了垂直行业的深度语音NLP应用,相比传统基于底层ASR的应用,大幅节省了垂直行业的语音NLP重复开发成本,让企业将更多精力应用于跟自身业务应用更结合的技术开发和迭代,而非在底层ASR和NLP理解上的开发,缩短了企业将AI在销售上转化为价值的宝贵时间。交易磁带不断自主挖掘不同的商业背景下,各类话术的积极与消极影响,让坐席和管理者都能够节省90%以上听录音的时间,直接发现沟通中的问题,进行有针对性的优化,有效提升企业转化率,同时为减少客诉,提升客户体验起到了有力保障。

 

作为一个高效的服务分析系统,交易磁带可以很好地与企业销售与服务团队的管理结合,开辟智能商业新领域,加速人机协同,共同进化。

相关新闻