-
创新奇智工业智能部高级技术总监汤寅航
现有的工业质检平台主要用到了哪些技术?... 全文>
-
请问INT4的算力为什么是INT8的2倍,而不是4倍?
NVIDIA中国区工程及解决方案总监赖俊杰: 其实在各代的GPU都能发现类似的特点,... 全文>
-
NVLink 3.0通过12个X4 Link来支持双向600GB带宽,平均每个X4 link是50GB,这样的话,X16 link的双向带宽就有200GB,这个带宽已经超过PCIe 5.0的标准了,是这样吗?
NVIDIA中国区工程及解决方案总监赖俊杰: 我看了下你算的数字应该是对的,其实不仅... 全文>
-
我是做HPC的,刚才赖博士说Tensor Core在HPC中由于精度问题不专门使用就会浪费,那么,有没有办法把它利用上呢?比如,通过算法将FP32的矩阵运算分解为多个FP16的Tensor Core运算?
NVIDIA中国区工程及解决方案总监赖俊杰: 并不是Tensor Core在HPC应... 全文>
-
NVLink与NVSwitch是什么关系?
NVIDIA中国区工程及解决方案总监赖俊杰: 我们做一个简单类比,NVLink可以认... 全文>
-
L2压缩是为inference设计的吗?还是training也能用?
NVIDIA中国区工程及解决方案总监赖俊杰: L2压缩不是针对特定的inferenc... 全文>
-
我在用GPU做CFD的时候发现,同样的结构网格(比如把一块结构网格剖分成很多块),网格分区增加时,GPU加速迅速降低——这个可能是多种因素的结果,但其中是否意味着kernel的调度开销其实也挺大?
NVIDIA中国区工程及解决方案总监赖俊杰: 从描述上来说,看起来用到的kernel... 全文>
-
L2 Cache 的 Data Compression 能用来做 sparse tensor core 的 data encoding 吗?
NVIDIA中国区工程及解决方案总监赖俊杰: 这两个所用的场合或机制是有较大区别的,... 全文>