NVIDIA 推出全新迁移学习工具包 3.0 版本,将 AI 快速推向市场
2021-02-26 19:37
目前,智能视觉和语音功能服务已经成为主流,几乎影响了我们日常生活的方方面面。AI 视频和音频分析正在增强从消费类产品到企业服务等各种应用,包括家用智能音箱、零售店中的智能自助服务终端或聊天机器人、工厂车间的交互式机器人、医院的智能患者监测系统以及智慧城市的自主交通解决方案。NVIDIA 一直走在技术发明的最前沿,并运用创新技术为这些服务提供支持、帮助开发者创造高性能产品、加快产品的上市速度。
NVIDIA 于今日发布了多个可直接用于生产的预训练模型和迁移学习工具包(Transfer Learning Toolkit, TLT)3.0 开发者测试版,以及 DeepStream SDK 5.1。此次发布包括一系列新型预训练模型。这些模型具有支持对话式 AI 应用的创新功能,可提供更加强大的解决方案来加速开发者从训练到部署的整个过程。
提升您的视觉 AI 生产力
对于开发者、初创公司和企业而言,从头开始创建一个模型不但耗时耗力,而且成本高昂。NVIDIA TLT 是一个能够消除 AI/DL 框架复杂性,并且使您无需编码就能更快构建生产级预训练模型的 AI 工具包。
借助 TLT,您可以通过 NVIDIA 为常见 AI 任务开发的多用途生产级模型或者 ResNet、VGG、FasterRCNN、RetinaNet 和 YOLOv3/v4 等 100 多种神经网络架构组合,使用自己的数据对特定用例的模型进行微调。所有模型均可从 NGC 获得。
预训练模型和 TLT 3.0(开发者测试版)主要亮点:
全新视觉 AI 预训练模型:车牌检测与识别、心率监测、手势识别、视线估计、情绪识别、人脸检测、面部特征点估计
通过自动语音识别(ASR)和自然语言处理(NLP)的预训练模型支持对话式 AI 用例
选择流行的网络架构进行训练,如 EfficientNet、YoloV4 和 UNET
经过改进的 PeopleNet 模型可以检测困难场景,比如坐着的人和旋转/扭曲的物体
用于推动兼容容器初始化的 TLT 启动器
支持具有第三代张量核心的 NVIDIA Ampere GPU,从而提升性能
“我们的收费公路综合车牌自动识别系统'NEX RoadView'采用了 NVIDIA 端到端视觉 AI 管道、生产级 AI 模型、TLT 和 DeepStream SDK。我们的工程团队不仅将开发时间缩短了 60%,而且使用 Jetson Nano 和 Xavier NX 将摄像头硬件成本降低了 40%。这使我们的供应商能够快速、可靠地部署市面上唯一的开箱即用 ALPR 解决方案——RoadView。对于我们来说,没有其他解决方案能够比这更能满足我们的需求。”
——INEX 首席执行官/首席技术官 Roman Prilutsky 博士
“我们正在帮助开发者和第三方供应商利用 Optra 的技术市场随时构建智能 AI 应用。作为边缘 AI 市场的‘新人’,实现产品和上市时间的差异化至关重要。TLT 所提供的现成 MaskRCNN 以及与 DeepStream 的简单集成,为我们的研发团队节省了 25% 的开发工作量。”
——Lexmark Ventures 公司 Optra 高级技术人员兼解决方案架构师 Chad McQuillen
“Quantiphi 借助 NVIDIA SDK 为零售业和媒体娱乐业的许多《财富》500 强客户构建实时视频分析工作流程。迁移学习工具包提供有效的自定义训练和模型修剪方法,实现了更快的边缘推理。DeepStream 让我们能够在云端构建高吞吐量推理管道,并轻松将其转移到 Jetson NX 设备上。”
——Quantiphi 解决方案架构负责人 Siddharth Kotwal
"KION 集团正在致力于为旗下各品牌提供强大的 AI 配送自主解决方案,以满足运营需求、解决物流优化难题并大幅减少流量异常事件。集团的创新、工程和数字化转型服务正受益于经过优化的 NVIDIA 预训练模型,同时集团也在使用迁移学习工具包快速创新和微调模型并使用 NVIDIA DeepStream 进行部署,通过 Jetson 平台释放多流密度。”
——KION 集团