我看您图片实例上GPU的任务像pipeline的形式 请问这是kernel引擎和数据拷贝引擎的并行吗? 如果说我一个kernel做a+b 一个kernel做c-d 这两个kernel在不同的流里 那么这两个kernel可以通过流的并发同时执行吗? 如果可以的话不是违反了Simd的特点
NVIDIA资深并行计算技术经理池哲贵:
Simd单指令多线程指的是在一个CUDA work上面,相比CUDAStream底层多了一个时限,CUDAStream上面没有单指令多线程这种限制。