NVIDIA AI 计算专区
首页
|
最新资讯
|
精彩活动
|
NVIDIA AI 大讲堂
|
白皮书下载
产品推荐
知识问答
登录
注册
CUDA的stream使得GPU计算具有粗粒度并行能力,那么,一般单卡使用多少stream比较合适?即:GPU卡的物理任务管理队列数量是多少?
NVIDIA中国区工程及解决方案总监赖俊杰:
单卡用多少stream没有一个特别的说法,我们写一个多stream程序之后,在满足你的计算逻辑的前提下,你可以尝试去试下到底用多少个stream比较合适。关于GPU卡的物理任务管理队列数量是多少,这个问题我还真没有仔细去了解过。
登录查看完整答案
问题来源
面向HPC及AI的巨大飞跃,NVIDIA全新Ampere GPU架构深度解析
分享至: