首页 > 最新资讯 > GTC20 | 微软使用Turing-NLG和NVIDIA GPU提供实时整句查询建议
GTC20 | 微软使用Turing-NLG和NVIDIA GPU提供实时整句查询建议

GTC20 | 微软使用Turing-NLG和NVIDIA GPU提供实时整句查询建议

2020-10-13 09:55

#人工智能 #深度学习 #GTC20


每当想要快速找到一个问题的答案时,您是不是很讨厌在键盘上不停地搜索和敲打?如果是,那么您一定会爱上这个功能。

微软的Bing搜索引擎已使用Turing-NLG和NVIDIA GPU,可在输入时提供整句建议。

Turing-NLG是一种先进的大型无监督语言模型,具备强大的语言建模基准性能。

这项技术是无监督学习的最新AI技术范例,可通过提取特征和模式获得大量数据的意义,而无需人工提供任何预标记数据。

微软将这称之为“整句预测”。它如同变魔术一般,可以针对长搜索查询提出实时整句建议。

Turing-NLG是Bing在整句预测中使用的诸多创新之一,其他还包括模型压缩、状态缓存和硬件加速等。

整个夏天,微软都在与NVIDIA工程师合作,根据他们的需求优化Turing-NLG,从而为NVIDIA GPU上的模型提速,让全球用户享受到更强大的功能。

此次优化的一个关键作用是能极速运行这一庞大的AI模型,以增强实时搜索体验。通过对硬件和模型进行整体优化,微软和NVIDIA可将平均时延控制在10毫秒以内。

相比之下,眨一下眼的时间都超过100毫秒。

在整句预测出现之前,当遇到较长的查询时,搜索建议只会将用户当前输入的单词补充完整。

现在,如果您输入“The best way to replace”,就会立即看到三个整句建议:wood、plastic和metal。如果您输入“how can I replace a battery for”,整句建议“iphone、samsung、ipad和kindle”便会全部展现。

现在,Bing已经能够通过“整句预测”技术为用户提供整句建议。

您输入的字符越多,Bing所提示的内容就越接近您可能要询问的内容。

由于这些提示是即时生成的,因此它们不仅限于之前看到的数据或当前输入的单词。

因此,在查询过程中,Bing为您省下的不只是打几个字母的力气,而是可以让您直接少输入几个单词。

根据微软的报告,这项工作大大增加了自动建议实现的覆盖范围,从而显著改善整体用户体验。

相关新闻