是否在单机环境测试过该系统,能否讲下具体流程与细节?
西安交通大学人工智能与机器人研究所博士陶小语:
我们分别在P100双卡和K80八卡环境下,用多个行人/车辆的离线视频文件模拟多路视频。平台基于tf-1.3搭建,使用ffmpeg + cuvid硬解并转码到内存中,检测基于SSD-MobileNet-V1(fast) / SSD-Inception-V2(normal) / FasterRCNN-Res101(acc),在COCO+kitti+内部数据上pretrain,NMS下沉到GPU上,行人特征基于ReID数据集上pretrain得到的模型,跟踪算法基于deep sort。单卡测了1~4路视频的处理,最多可以做到6路来保证实时性,但需要适当降低采样率。4 GPU近线性加速(加速效率88~98%),继续增加视频路数CPU算力逐渐跟不上(2620睿最高2.3G),16GPU会加速效率退化到34%左右。