混合精度训练是在cuDNN这一层支持吗,以前TensorRT层Plugin的精度基本是float32,将来Plugin是否也能支持混合精度?
NVIDIA系统架构师齐家兴:
混合精度训练是指对整个深度学习模型进行一些算法上的操作来进行训练的问题,那对于cuDNN,在具体的一些网络函数来对Tensor Core进行支持的,所以当前的cuDNN也是支持的。比如常见的卷积以及RNN都是支持Tensor Core的,那么TensorRT里面Plugin的精度在最新的TensorRT5.0版本中,用户可以自定义Plugin所支持的数据类型,FP16,FP32以及INT32这三种的。