GPU并行计算环境,2、4、8、16块V100的GPU卡并行性能是否几何倍数提升,是否有性能对比数据?
NVIDIA高级系统架构师易成:
GPU并行计算的扩展性和软件、算例都有很强的关系,对于DeepLearning应用,是很明显的近似线性加速效果的,扩展性非常好;对于amber,relion,加速效果也是非常好的,接近线性的加速,当然也和算例大小规模有关。
问题来源