-
是否可以介绍下TAO里关于内存访问密集型layer的优化?
阿里巴巴高级算法工程师王梦娣: 这里的优化原则就是对于访问密集型计算可以进行一定fu... 全文>
-
NVIDIA的Tensor内核支不支持不同的数据维度存储顺序?
NVIDIA系统架构师齐家兴: 当前对Tensor Core来说,比较底层的可以通过... 全文>
-
混合精度训练是在cuDNN这一层支持吗,以前TensorRT层Plugin的精度基本是float32,将来Plugin是否也能支持混合精度?
NVIDIA系统架构师齐家兴: 混合精度训练是指对整个深度学习模型进行一些算法上的操... 全文>
-
NVIDIA是否计划对Tensor Core提供更细粒度的编程接口?(现有的wmma不利于构造高效的计算结构)
NVIDIA系统架构师齐家兴: 当前没有对Tensor Core提供更细粒度的接口,... 全文>
-
对于图改写算法,图的定义的原子单位是什么,是TensorFlow的layer的定义么?
NVIDIA系统架构师齐家兴: 当前我们在TensorFlow图优化的算法还是使用T... 全文>
-
例子里提到了APEX支持scale loss,APEX是否也支持图优化?
NVIDIA系统架构师齐家兴: 针对APEX工具包,它也是实现了TensorFlow... 全文>
-
FP32 to FP16 cast是在Tensor Core里做还是CUDA Core里做的?
NVIDIA系统架构师齐家兴: 因为从FP32到FP16的转换不涉及太多的计算,所以... 全文>
-
不同深度模型的混合精度策略如何确定?有没有自动化方法?
阿里巴巴高级算法工程师王梦娣: 主要的问题是策略如何确定,在图改写的维度主要基于规则... 全文>