视频分析领域有哪些有前景的算法?
西安交通大学人工智能与机器人研究所博士陶小语:
学术界的算法侧重精度,很多工作是对一些主流框架进行改进的。对工业应用而言,更看重速度、算力、能耗,很多场景下使用的还是成熟的传统方法,如DSP上做检测的DPM、手机上做人脸特征点定位的AMM、Dlib。基于CNN的方法,检测的话如Faster R-CNN/SSD 以及增强版FPN/RetinaNet/Mask R-CNN都是比较好的。分割的话,最近比较热的是Deeplab v3+,google已经放出了code。Tracking部分我们用的是DeepSort,行为识别,像比赛用的比较多的 TSN+I3D/C2D+TSN等,而FAIR去年出的Non-local NN也比较有意思。