
GTC22 | NVIDIA Hopper 全面投产
2022-09-23 09:49
#人工智能 #深度学习 #GTC22
分享到微信
分享到微博

Hopper 的全球推广
H100 走向云端
NVIDIA 的软件支持
H100 先进的 Transformer 引擎技术可助力企业快速开发精度更高的大型语言模型。随着这些模型的规模不断扩大,其复杂性也在不断提升,有些模型的训练时间甚至长达数月。
为解决这一问题,一些全球领先的大型语言模型和深度学习框架正在 H100 上进行优化,包括 NVIDIA NeMo Megatron、Microsoft DeepSpeed、Google JAX、PyTorch、TensorFlow 和 XLA。这些框架与 Hopper 架构相结合,能够显著提升 AI 性能,将大型语言模型的训练时间缩短到几天乃至几小时。