NVIDIA是否计划对Tensor Core提供更细粒度的编程接口?(现有的wmma不利于构造高效的计算结构)
NVIDIA系统架构师齐家兴:
当前没有对Tensor Core提供更细粒度的接口,毕竟Tensor Core主要是针对4X4的矩阵乘法以及累加操作,也请继续关注CUDA版本的更新,如果有一些变化请参阅我们CUDA最新的发布。