是否在单机环境测试过该系统，能否讲下具体流程与细节？

西安交通大学人工智能与机器人研究所博士陶小语：

我们分别在P100双卡和K80八卡环境下，用多个行人/车辆的离线视频文件模拟多路视频。平台基于tf-1.3搭建，使用ffmpeg + cuvid硬解并转码到内存中，检测基于SSD-MobileNet-V1(fast) / SSD-Inception-V2(normal) / FasterRCNN-Res101(acc)，在COCO+kitti+内部数据上pretrain，NMS下沉到GPU上，行人特征基于ReID数据集上pretrain得到的模型，跟踪算法基于deep sort。单卡测了1~4路视频的处理，最多可以做到6路来保证实时性，但需要适当降低采样率。4 GPU近线性加速（加速效率88~98%），继续增加视频路数CPU算力逐渐跟不上（2620睿最高2.3G），16GPU会加速效率退化到34%左右。

问题来源

智能监控场景下的大规模并行化视频分析方法