首页 > 最新资讯 > NVIDIA 语音 AI 突破,使企业为品牌打造专属声音成为可能
NVIDIA 语音 AI 突破,使企业为品牌打造专属声音成为可能

NVIDIA 语音 AI 突破,使企业为品牌打造专属声音成为可能

2021-11-11 12:28

#人工智能 #深度学习 #GTC21


NVIDIA Riva 定制语音软件为虚拟助理、呼叫中心语音和其他基于语音的应用程序提供支持;Riva 企业版适用于大规模部署
 
 
 
NVIDIA 今天宣布推出一款工具,只需 30 分钟的音频数据,即可在一天之内打造类似真人的定制语音。
 
NVIDIA Riva 定制语音是 NVIDIA Riva 语音 AI 软件的一项功能,它提供强大的功能,使数百万公司使用少量数据即可在几小时而不再是几周内开发富有表现力的定制语音。
 
企业可以使用 Riva 定制语音打造具有专属语音的虚拟助理。呼叫中心可以借其快速开发具有辨识度的品牌语音,为客户提供服务。开发者可以借其创建各种各样的应用程序,为有语言障碍的人提供支持。
 
NVIDIA AI软件产品管理副总裁Kari Briski表示:“长期以来,模仿类似真人的互动一直是AI面临的一项巨大挑战,特别是对于那些具有行业术语的公司而言。现在,这些公司能够使用语音 AI 倾听客户,并且以他们品牌专属的、富有表现力的语音回复客户,推动更有趣味、更加愉悦的互动。”
 
 
最新版的 NVIDIA Riva 语音 AI 软件开发套件提供 Riva 定制语音。Riva SDK 包括先进的自动语音识别和文本到语音转换功能,可根据不同的口音和领域进行定制。它还能够将语音服务扩展到云、数据中心及边缘的数十万串流。
 

生态系统之声

 
在不到三年的时间里,NVIDIA 的对话式 AI 软件已实现 25 万次以上的下载量,在众多行业得到广泛应用。
 
RingCentral 是全球企业云通信、视频会议、协作和客服中心解决方案的优秀供应商,正在借助 Riva 自动语音识别提供视频会议实时字幕功能,打造更具吸引力的会议体验。
 
RingCentral 执行副总裁兼产品和工程总经理 Nat Natarajan 表示:“我们的目标是让会议更智能,现在借助 NVIDIA Riva,能够基于 NVIDIA GPU 训练实时转录模型,提高不同口音的准确性。未来,我们预计会有多个并发串流,Riva 可以轻松扩展,在 300 毫秒内实时处理这些串流。我们很高兴能与 NVIDIA 合作,一起展望未来。”
 
中国平安是全球最大的金融服务公司之一,正通过虚拟代理人来减少等待时间,改善客户体验。借助 Riva,它可以构建实时语音应用程序,不断提高准确性。
 
中国平安首席科学家肖京表示:“中国平安每天使用聊天机器代理人处理数百万客户查询。借助 NVIDIA 面向自动语音识别的预训练模型,在我们的数据上进一步微调,我们的系统在准确性方面提高了 5%,让我们能够提供更具吸引力、更加可靠的服务。”
 
此外,还有数十家软件制造商在生产中使用 NVIDIA 对话式 AI。Gosoft Contact Center 正在与 CP All 合作,后者拥有 20 多个业务领域,其零售领域在泰国涵盖 10000 多家 7-11 便利店。高度准确的 AI 语音机器人在泰语方面经过训练,每天总计可以帮助处理 24 万次呼叫。
 
Plabook Education 和 Data Monsters 正在与美国各地的学区合作,帮助孩子们学习通过 AI 数字虚拟形象阅读助理进行阅读,该助理可以帮助识别发音错误的单词并衡量其阅读准确性。
 
NVIDIA Riva 定制语音软件介绍视频
 

供货情况和定价

 
针对小型研发,NVIDIA Riva 在 NVIDIA NGC 容器仓库上免费提供。开发者可以加入 Riva 开放测试计划,立即试用软件并且接收相关功能更新通知。
 
对于具有大规模部署和寻求 NVIDIA 专家技术支持的客户,NVIDIA 还宣布 NVIDIA Riva企业版计划,该计划预计将于明年初推出。
 

Riva亮相GTC

 
在GTC主题演讲中,NVIDIA创始人兼首席执行官黄仁勋展示了Riva的语音AI能力,其中包括在Riva自定义语音的演示中,展示了只需30分钟的数据就能创造出类似人类的新的声音。
 
Riva还通过Project Tokkio、DRIVE Concierge和Project Maxine在Omniverse Avatar(一个创建交互虚拟形象的平台)中得以展现。Project Tokkio和DRIVE Concierge展示了客户服务和车内环境中的虚拟形象,而Project Maxine则强调了实时翻译并转录到多种语言。
 
在GTC上,有二十多场专注于对话式AI的演讲,包括Hugging Face、Snap、T-Mobile等公司的演讲。演讲主题涉及开发和整合GPU加速的语音和语言AI应用等方面最先进的算法、工具、挑战以及效果等。

相关新闻