使用NPPI做YUV->RGB的CSC转换的时候,batch在一起和单独做有什么性能上的区别吗?
NVIDIA数据科学家徐添豪:
NPPI在GPU上其实是一个CUDA写的库,他在做YUV到RGB转换时,也是调用了CUDA的能力,对于CUDA的计算在batch的情况下,相当于提高了单个问题的计算复杂度,这是最直接的提升性能的一个方法,所以一般在会比单独做更快,但是能快多少,这个得具体的实测,跟你输入的图的大小也是有关系。单独做可以达到比较好的性能,若需要通过多流来做GPU上的并发处理,也可以做一定的尝试,来看这方面是否能做到一些优化。能达到多快,还是得根据具体的场景来做实际的分析。