请问INT4的算力为什么是INT8的2倍,而不是4倍?
NVIDIA中国区工程及解决方案总监赖俊杰:
其实在各代的GPU都能发现类似的特点,比如FP16的性能是FP32的两倍,INT8是FP32的四倍等,我觉得这是硬件上比较正常的一个比例。