T4 GPU助力麦图科技打造空管AI应用,为航空安全保驾护航
2020-10-29 22:42
在航空管制领域,麦图科技公司研发了管制语音识别系统。借助NVIDIA T4 Tensor Core GPU使该系统语音识别速度得到质的提升。使用CPU运算时识别速度为0.4s/条,而使用GPU时将其提高到了0.03s/条,在低功耗环境下效率提升了10倍以上,为航空安全保驾护航。
麦图科技是一家专注于企业级AI技术和应用研发的技术型公司。其产品聚焦智能航空领域,旨在为中国的航空数字化和智能化战略造桥铺路、助力产业结构升级。
仅靠CPU的管制语音识别系统算力捉襟见肘
麦图科技所研制的管制语音识别系统是一套专业领域的语音识别系统。该系统以语音识别引擎为核心,包含实时提示、安全监测、效率分析等主要模块,构建了从引擎到应用的完整体系。同时,该系统还可应用于管制语音指令的实时识别。根据识别结果,及时发现潜在的安全问题,并进行提示和告警。
为实现最佳的安全监测功能,管制语音识别系统需要满足三个需求:第一是管制语音识别引擎模型容量足够大,用以保证高水平的识别准确率。第二是管制语音识别引擎速度够快,从而保证能够及时发现问题,并进行提示。第三是硬件功耗适当、安装便捷。由于本系统运行需要完全离线,因此,需要能够便捷的整合到现有服务器体系之下。
但上述三个需求实现起来并不容易。出于实践的角度,该公司首先采用高频多核CPU识别进行尝试,但速度仍然有限。同时,随着识别模型体积越来越大,基于CPU的系统算力捉襟见肘,逐渐无法支持其模型规模。
T4 GPU助力满足管制语音识别系统需求
在中英文语音识别模型训练中,完成数千小时的音频训练过程。空管行业对于音频识别准确率有非常高的要求,为进一步提高管制语音识别准确度,需要利用海量的管制音频数据进行语音识别模型训练。借助NVIDIA T4 GPU的强大算力,该系统实现了数据规模超过4000小时的音频训练,语音识别准确度达到94%以上。
NVIDIA T4 GPU极大缩短了单条语音识别花费的时间。语音管制识别业务对实时性有很高的要求,使用多核CPU完成语音识别过程平均处理一条语音需要花费0.4秒,通过使用NVIDIA T4 GPU,明显缩短了单条语音的识别耗时,将处理时间缩短至0.03秒,减少该步骤耗时90%以上。
支持更大规模的语音识别模型。神经网络深度学习中,模型深度越大,模型准确度就越高,但是运行速度也会随之变慢。考虑到语音管制业务的实时性,语音识别过程的耗时需控制在可接受的范围内。通过使用NVIDIA T4 GPU,语音识别系统可以训练和使用更大规模的模型,以提高音频识别准确率。
T4 GPU为航空安全保驾护航
借助NVIDIA T4 GPU,极大提高了管制语音识别系统的语音识别准确率和识别速度,系统的整体性能得到提升,为客户提供了良好的用户体验,为拓展空管领域其他识别应用的业务打下了基础。
空管语音识别系统的使用提高了空管的工作效率和质量,减轻了管制员的任务量和工作压力,实现了在安全、监控、管理、规划和培训复训五个领域中的多种应用。在有效提升管制员活动透明度的同时,能够精确、量化的开展管制员管理和评价工作,为管制能力的提升指明了方向。通过降低空管指令的理解偏差和操作失误,为更加安全、高效的管制工作奠定可靠的基础。
NVIDIA T4 GPU解决了麦图科技在开发管制语音识别系统时遇到的算力瓶颈问题,极大提升了该套系统的实际表现,增强了系统的可迁移性与可拓展性,并将进一步补充该系统的功能和提高识别准确率变为可能。在NVIDIA产品的帮助下,麦图科技将持续提供便捷可靠的AI服务,为空管行业的数字化、智能化做出更多贡献。