NVIDIA AI 计算专区
首页
|
最新资讯
|
精彩活动
|
NVIDIA AI 大讲堂
|
白皮书下载
产品推荐
知识问答
登录
注册
请问INT4的算力为什么是INT8的2倍,而不是4倍?
NVIDIA中国区工程及解决方案总监赖俊杰:
其实在各代的GPU都能发现类似的特点,比如FP16的性能是FP32的两倍,INT8是FP32的四倍等,我觉得这是硬件上比较正常的一个比例。
登录查看完整答案
问题来源
面向HPC及AI的巨大飞跃,NVIDIA全新Ampere GPU架构深度解析
分享至: