锁定胜局!计算机视觉助力球队收获胜利
2020-11-03 19:30
计算机视觉通过卷积神经网络实现,利用图像和视频对多个应用进行分割、分类和检测。
现如今,计算机视觉的发展已十分成熟。在棒球比赛中球队经理因投掷距离问题而与裁判发生争执的日子一去不复返。
这要归功于与并行处理技术一同发展的图像分类技术,使得计算机能够捕捉到飞行速度高达每小时95英里的棒球。并行处理技术和图像分类技术的结合成功帮助裁判精准定位球的位置,继而为裁判结果提供难以辩驳的证据。
但是,计算机视觉的应用不仅限于棒球。
计算机视觉是什么?
计算机视觉是一个广泛的术语,指深度神经网络为应用程序开发拟人视觉功能所做的各项任务,通常在NVIDIA GPU上运行。其可应用于对使用图像和视频作为数据的神经网络进行分割、分类和检测的具体训练。
美国职业棒球大联盟(Major League Baseball)正在本垒板上测试使用计算机视觉技术的AI辅助裁判。要在4秒中判断棒球是否击中本垒对人眼来说很难实现。但是在图像网络和NVIDIA GPU上运行的摄像头可以很好的解决这个问题,NVIDIA GPU可以进行每秒60帧以上的瞬时决策。
总部位于伦敦的鹰眼公司(Hawk-Eye)正在体育界推广这项技术。鹰眼公司由NVIDIA GPU驱动的球追踪和智能软件已被部署在20多项运动中,包括棒球、篮球、网球、足球、板球、曲棍球和纳斯卡赛车(NASCAR)。
但是,计算机视觉所能做的还有更多。
计算机视觉能做什么?
由卷积神经网络开发,计算机视觉可以处理多种任务,对各种应用进行分割、分类和检测。
计算机视觉拥有广阔的应用前景。随着计算机视觉在运动、汽车、农业、零售、银行、建筑、保险等各行业中落地,计算机视觉将无处不在。
关于计算机视觉,你必须了解的三件事
分割:图像分割是将像素分类,使其属于某个特定类别,如汽车、道路或行人。它被广泛应用于自动驾驶汽车应用中,包括NVIDIA DRIVE软件栈,用于区分道路、汽车和行人。你可以把它看作是一种可视化技术,帮助我们理解计算机的行为。
分类:图像分类用于识别图像中包含的内容。神经网络还可以通过训练来识别可爱的猫咪和狗狗。在有足够数据的情况下,还可以高精确度识别更多的物体和生物。
检测:图像检测使计算机可以定位目标所在的位置。就像下面图像中显示的下半部分,有一个个完整框住目标对象的矩形边框。探测器可以通过训练来具备检测图像中汽车或路人位置的能力,例如下面的编号框。
快速了解分割、分类和检测
分割——擅长描绘物体
多用于自动驾驶汽车领域
分类——这是猫还是狗?适用于精准分类
检测——目标所在的空间位置
以安全为目的,进行目标识别