百度智能云联合 NVIDIA 完成首批 17 个自动驾驶模型优化
2023-02-28 11:19
在模型训练方面,大多数模型更侧重于算法的实现,关注易用性和模型的精度,往往忽略了模型吞吐,没有实现生产环境下的训练加速最优,GPU 利用率也很低。
针对这两大难题,百度智能云联合 NVIDIA,根据双方在自动驾驶行业丰富的实践经验,首批精选了 17 个模型,包括了 2D、3D 摄像头、雷达等多种传感设备,为车辆提供覆盖自适应巡航、碰撞检测、紧急制动、交通信号灯检车、车道偏离识别、环绕视图、盲点探索、后方碰撞警告等能力。
在模型优化方面,百度智能云技术团队联合 NVIDIA,针对常见智驾场景的感知模型,从数据 I/O 开销、模型计算开销、损失函数计算开销、优化器开销、分布式通信开销等角度进行全面深入分析,结合硬件集群和模型结构等因素,在 GPU 卡上联合 NVIDIA 进行了软硬一体优化,让算法与 GPU 配合更加默契,最终模型优化实现了平均 138%,最高 400% 的吞吐量提升。
在优化的过程中,百度智能云技术团队不断尝试各种手段来提高模型吞吐量和资源的利用率。比如,在 CenterPoint 的模型优化中吞吐效果经历了从 50%、到 169%,再到 391% 的提升,最终实现了目前 400% 的吞吐提升,训练时间缩短 80%。
在模型优化的过程中,百度智能云联合 NVIDIA 提炼出了一套通用的模型优化方法论,可以帮助团队在短时间内完成新模型的优化工作。
百度副总裁谢广军表示:“云智一体,深入产业”,模型训练是自动驾驶领域的核心场景。百度智能云联合 NVIDIA 对 17 个感知模型的训练进行了优化,最高可达到 400% 的训练吞吐提升,缩短 80% 的训练时间。双方沉淀的优化方法还将帮助更多行业提升模型训练效率,加速产业智能化升级。”