-
MXNet这些框架都在做支持混合精度的API,那么PAI是不是在做重复的工作呢?
阿里巴巴高级算法工程师王梦娣: PAI在启动混合精度训练图改写的工作已经落地大半年了... 全文>
-
是否需要提前确认Overflow是哪个原因引起的,或者已经确认FP32的模型没有Overflow问题?
阿里巴巴高级算法工程师王梦娣: 如果有Overflow会skip这个batch,不更... 全文>
-
Cast Fusion是前后两个op都是fp16所以可以fusion?
阿里巴巴高级算法工程师王梦娣: 总体上主要有两个维度,一个是Cast Elimina... 全文>
-
用fp16的safe和unsafe op的区分的原则是什么?
NVIDIA系统架构师齐家兴: safe以及unsafe op的区分有这样几个考量,... 全文>
-
请问老师存算一体(直接在存储器中嵌入算法加速矩阵运算)与tensor core加速矩阵乘加有何区别?
NVIDIA系统架构师齐家兴: 关于这个问题我目前不太了解,无法回答你的问题。... 全文>
-
输出为FP32的话,那么下个layer的输入时,是要再从FP32转成FP16吗?
阿里巴巴高级算法工程师王梦娣: 是的,本质上人为改写模型时会出现大量的这种结构,比如... 全文>
-
关于PAI-TAO,PyTorch这种eager计算的支持吗,如果是那是如何支持的?
阿里巴巴高级算法工程师王梦娣: PAI-TAO本质上是根据编译的思维来做的,所以对于... 全文>
-
除了训练,阿里有做推理框架的相关工作吗?速度怎么样?
阿里巴巴高级算法工程师王梦娣: 我们有推出PAI-Blade推理优化的框架,里面会有... 全文>