NVIDIA 推出全新迁移学习工具包 3.0 版本，将 AI 快速推向市场

首页 > 最新资讯 > NVIDIA 推出全新迁移学习工具包 3.0 版本，将 AI 快速推向市场

2021-02-26 19:37

目前，智能视觉和语音功能服务已经成为主流，几乎影响了我们日常生活的方方面面。AI 视频和音频分析正在增强从消费类产品到企业服务等各种应用，包括家用智能音箱、零售店中的智能自助服务终端或聊天机器人、工厂车间的交互式机器人、医院的智能患者监测系统以及智慧城市的自主交通解决方案。NVIDIA 一直走在技术发明的最前沿，并运用创新技术为这些服务提供支持、帮助开发者创造高性能产品、加快产品的上市速度。

NVIDIA 于今日发布了多个可直接用于生产的预训练模型和迁移学习工具包（Transfer Learning Toolkit, TLT）3.0 开发者测试版，以及 DeepStream SDK 5.1。此次发布包括一系列新型预训练模型。这些模型具有支持对话式 AI 应用的创新功能，可提供更加强大的解决方案来加速开发者从训练到部署的整个过程。

提升您的视觉 AI 生产力

对于开发者、初创公司和企业而言，从头开始创建一个模型不但耗时耗力，而且成本高昂。NVIDIA TLT 是一个能够消除 AI/DL 框架复杂性，并且使您无需编码就能更快构建生产级预训练模型的 AI 工具包。

借助 TLT，您可以通过 NVIDIA 为常见 AI 任务开发的多用途生产级模型或者 ResNet、VGG、FasterRCNN、RetinaNet 和 YOLOv3/v4 等 100 多种神经网络架构组合，使用自己的数据对特定用例的模型进行微调。所有模型均可从 NGC 获得。

预训练模型和 TLT 3.0（开发者测试版）主要亮点：

全新视觉 AI 预训练模型：车牌检测与识别、心率监测、手势识别、视线估计、情绪识别、人脸检测、面部特征点估计

通过自动语音识别（ASR）和自然语言处理（NLP）的预训练模型支持对话式 AI 用例

选择流行的网络架构进行训练，如 EfficientNet、YoloV4 和 UNET

经过改进的 PeopleNet 模型可以检测困难场景，比如坐着的人和旋转/扭曲的物体

用于推动兼容容器初始化的 TLT 启动器

支持具有第三代张量核心的 NVIDIA Ampere GPU，从而提升性能

客户荐言

“我们的收费公路综合车牌自动识别系统'NEX RoadView'采用了 NVIDIA 端到端视觉 AI 管道、生产级 AI 模型、TLT 和 DeepStream SDK。我们的工程团队不仅将开发时间缩短了 60%，而且使用 Jetson Nano 和 Xavier NX 将摄像头硬件成本降低了 40%。这使我们的供应商能够快速、可靠地部署市面上唯一的开箱即用 ALPR 解决方案——RoadView。对于我们来说，没有其他解决方案能够比这更能满足我们的需求。”

——INEX 首席执行官/首席技术官 Roman Prilutsky 博士

“我们正在帮助开发者和第三方供应商利用 Optra 的技术市场随时构建智能 AI 应用。作为边缘 AI 市场的‘新人’，实现产品和上市时间的差异化至关重要。TLT 所提供的现成 MaskRCNN 以及与 DeepStream 的简单集成，为我们的研发团队节省了 25% 的开发工作量。”

——Lexmark Ventures 公司 Optra 高级技术人员兼解决方案架构师 Chad McQuillen

“Quantiphi 借助 NVIDIA SDK 为零售业和媒体娱乐业的许多《财富》500 强客户构建实时视频分析工作流程。迁移学习工具包提供有效的自定义训练和模型修剪方法，实现了更快的边缘推理。DeepStream 让我们能够在云端构建高吞吐量推理管道，并轻松将其转移到 Jetson NX 设备上。”

——Quantiphi 解决方案架构负责人 Siddharth Kotwal

"KION 集团正在致力于为旗下各品牌提供强大的 AI 配送自主解决方案，以满足运营需求、解决物流优化难题并大幅减少流量异常事件。集团的创新、工程和数字化转型服务正受益于经过优化的 NVIDIA 预训练模型，同时集团也在使用迁移学习工具包快速创新和微调模型并使用 NVIDIA DeepStream 进行部署，通过 Jetson 平台释放多流密度。”

——KION 集团

分享到微信分享到微博

精彩推荐

GTC22 秋季10大精彩内容