NVIDIA AI 计算专区
首页
|
最新资讯
|
精彩活动
|
NVIDIA AI 大讲堂
|
白皮书下载
产品推荐
知识问答
登录
注册
我看您图片实例上GPU的任务像pipeline的形式 请问这是kernel引擎和数据拷贝引擎的并行吗? 如果说我一个kernel做a+b 一个kernel做c-d 这两个kernel在不同的流里 那么这两个kernel可以通过流的并发同时执行吗? 如果可以的话不是违反了Simd的特点
NVIDIA资深并行计算技术经理池哲贵:
Simd单指令多线程指的是在一个CUDA work上面,相比CUDAStream底层多了一个时限,CUDAStream上面没有单指令多线程这种限制。
登录查看完整答案
问题来源
基于NVIDIA DRIVE AGX的CUDA并行加速及GPU应用的性能分析
分享至: