内容介绍
ParkNet深度神经网络利用摄像头图像数据识别开放的停车位。
自动驾驶实验室
这是NVIDIA DRIVE Labs自动驾驶实验室系列视频的第十一集,在上一集中我们用了真车在路上进行测试。在自动驾驶实验室系列视频中,我们将以工程技术为重点的视角关注实现自动驾驶汽车的各个挑战以及NVIDIA DRIVE AV软件团队如何应对这些问题。
任务:
识别停车位
方法:
ParkNet DNN
任何一个曾经在繁忙的停车场或者拥堵街区绕过圈的人都知道,寻找一个可用的停车位有的时候会很艰难。标记不清的停车线、大卡车后面藏着小汽车以及其他正在寻找停车位的“竞争者”,这一切都让一次快捷的商店之旅变成一场严酷的考验。
为了在这些环境中停车,自动驾驶汽车需要一个视觉感知系统,以在各种条件下检测可用的停车位。对于该系统来说最关键的是,无论在室内或室外以及在各种光照条件下,都能够感知由单线、双线或者模糊车道标记分隔的停车位,同时识别出它们是被占用,没被占用还是部分被占用。
停车位的几何形状也让识别变得更加复杂,因为并非每个停车位都是完美的矩形。它们可能是倾斜带有一定角度的四边形,也可能是垂直或平行的状态。这就导致了自动驾驶汽车在寻找可用的停车位时,需要考虑不同的停车位朝向。
AI标记停车位
为了感知停车位,NVIDIA利用了在各种条件下收集的摄像头图像数据,借助ParkNet DNN进行了深度神经网络处理。
为了解决停车位形状和朝向的几何多样性,我们在训练ParkNet的时候让它以四边形而不是长方形为标准识别停车位。深度神经网络不仅可以识别直角的四边形,还可以识别任意角度的四边形。这就让ParkNet在车辆面对任何朝向的停车位时都能够对其进行感知。
ParkNet还能确定四条边中的哪一边是停车位的“入口线”。也就是说,汽车应该从多边形的哪条线进入停车位并停车。由于入口线信息是自主泊车计划和控制软件的关键输入信息,它需要具有高识别率的特点,并且要遵守交通规则和常识。
借助ParkNet DNN在五个环绕摄像头感知装置下进行停车位的感知。红线表示四边形停车位的形状检测。绿线表示被定义为停车位入口线的那一侧。
ParkNet在2D图像中输出停车位检测和入口线的分类。因此,如果想在自主泊车规划和控制软件中使用ParkNet输出结果,需要先将2D图像变成3D坐标。
通过使用摄像头的自校准结果(即预计摄像头俯仰、偏航以及侧倾值,这些值表示上下左右以及顺时针逆时针的定位),可以将ParkNet的检测结果转换为3D坐标。这就让估算出的3D定位在用于短距离自主泊车操作时特别精准。
左图:ParkNet检测和分类结果在2D图像中。
右图:ParkNet检测和分类结果转换为3D坐标,并以俯视的视角进行可视化呈现。
自动驾驶实验室
这是NVIDIA DRIVE Labs自动驾驶实验室系列视频的第十一集,在上一集中我们用了真车在路上进行测试。在自动驾驶实验室系列视频中,我们将以工程技术为重点的视角关注实现自动驾驶汽车的各个挑战以及NVIDIA DRIVE AV软件团队如何应对这些问题。
任务:
识别停车位
方法:
ParkNet DNN
任何一个曾经在繁忙的停车场或者拥堵街区绕过圈的人都知道,寻找一个可用的停车位有的时候会很艰难。标记不清的停车线、大卡车后面藏着小汽车以及其他正在寻找停车位的“竞争者”,这一切都让一次快捷的商店之旅变成一场严酷的考验。
为了在这些环境中停车,自动驾驶汽车需要一个视觉感知系统,以在各种条件下检测可用的停车位。对于该系统来说最关键的是,无论在室内或室外以及在各种光照条件下,都能够感知由单线、双线或者模糊车道标记分隔的停车位,同时识别出它们是被占用,没被占用还是部分被占用。
停车位的几何形状也让识别变得更加复杂,因为并非每个停车位都是完美的矩形。它们可能是倾斜带有一定角度的四边形,也可能是垂直或平行的状态。这就导致了自动驾驶汽车在寻找可用的停车位时,需要考虑不同的停车位朝向。
AI标记停车位
为了感知停车位,NVIDIA利用了在各种条件下收集的摄像头图像数据,借助ParkNet DNN进行了深度神经网络处理。
为了解决停车位形状和朝向的几何多样性,我们在训练ParkNet的时候让它以四边形而不是长方形为标准识别停车位。深度神经网络不仅可以识别直角的四边形,还可以识别任意角度的四边形。这就让ParkNet在车辆面对任何朝向的停车位时都能够对其进行感知。
ParkNet还能确定四条边中的哪一边是停车位的“入口线”。也就是说,汽车应该从多边形的哪条线进入停车位并停车。由于入口线信息是自主泊车计划和控制软件的关键输入信息,它需要具有高识别率的特点,并且要遵守交通规则和常识。
借助ParkNet DNN在五个环绕摄像头感知装置下进行停车位的感知。红线表示四边形停车位的形状检测。绿线表示被定义为停车位入口线的那一侧。
ParkNet在2D图像中输出停车位检测和入口线的分类。因此,如果想在自主泊车规划和控制软件中使用ParkNet输出结果,需要先将2D图像变成3D坐标。
通过使用摄像头的自校准结果(即预计摄像头俯仰、偏航以及侧倾值,这些值表示上下左右以及顺时针逆时针的定位),可以将ParkNet的检测结果转换为3D坐标。这就让估算出的3D定位在用于短距离自主泊车操作时特别精准。
左图:ParkNet检测和分类结果在2D图像中。
右图:ParkNet检测和分类结果转换为3D坐标,并以俯视的视角进行可视化呈现。
订阅英伟达 NVIDIA 技术月刊