首页 > 最新资讯 > NVIDIA 推出 DGX Cloud,使每个企业能即时接入 AI 超级计算机
NVIDIA 推出 DGX Cloud,使每个企业能即时接入 AI 超级计算机

NVIDIA 推出 DGX Cloud,使每个企业能即时接入 AI 超级计算机

2023-03-27 11:51

#人工智能 #深度学习 #GTC23


Oracle Cloud Infrastructure 率先运行 NVIDIA AI 超级计算实例;微软 Azure、谷歌云等即将托管 DGX Cloud

加利福尼亚州圣克拉拉市 – GTC – 太平洋时间 2023 年 3 月 21 日 – NVIDIA 今日发布 NVIDIA DGX Cloud™。这项 AI 超级计算服务使企业能够即时接入用于训练生成式 AI 等开创性应用的高级模型所需的基础设施和软件。

DGX Cloud 可提供 NVIDIA DGX™ AI 超级计算专用集群,并配以 NVIDIA AI 软件。这项服务使得每个企业都可以通过一个简单的网络浏览器就能访问自己的 AI 超级计算机,免除了购置、部署和管理本地基础设施的复杂性。

企业可按月租用 DGX Cloud 集群,以便能够快速、轻松地扩展大型多节点训练工作负载的开发,无须等待需求量通常很大的加速计算资源。

NVIDIA 创始人兼首席执行官黄仁勋表示:“我们正处于 AI 的‘iPhone’时刻。初创企业正在竞相打造颠覆性的产品和商业模式,老牌企业则在寻求应对之法。DGX Cloud 使客户能够在全球规模的云上即时接入 NVIDIA AI 超级计算。”

NVIDIA 正在与领先的云服务商联合托管 DGX Cloud 基础设施,Oracle Cloud Infrastructure(OCI)将首当其冲,通过其 OCI 超级集群,提供专门构建的 RDMA 网络、裸金属计算以及高性能本地块存储,可扩展到超过 32,000 个 GPU 所组成的超级集群。

微软 Azure 预计将在下个季度开始托管 DGX Cloud。这项服务还将在不久之后扩展到谷歌云等。

 

行业巨头利用 NVIDIA DGX Cloud 

加速取得成功

首批使用 DGX Cloud 的 AI 行业先锋包括全球领先的生物技术公司安进(Amgen)、保险科技领导者 CCC Intelligent Solutions(CCC)以及数字业务平台提供商 ServiceNow。

安进正在使用 DGX Cloud 与 NVIDIA BioNeMo™ 大型语言模型软件来加速药物研发,比如包含 NVIDIA RAPIDS™ 数据科学加速库的 NVIDIA AI Enterprise 软件。

安进数字创新研究加速中心、生物制剂治疗研究执行总监 Peter Grandsard 表示:“借助 NVIDIA DGX Cloud 和 NVIDIA BioNeMo,我们的研究人员能够把精力集中在更深层次的生物学研究上,无需再处理 AI 基础设施和设置机器学习工程。相较于其他平台,我们借助 DGX Cloud 的强大算力和多节点能力,同时结合 BioNeMo 将蛋白质 LLM 的训练速度提高了 3 倍,使用 NVIDIA RAPIDS 将训练后分析速度提高了 100 倍。”

财产和意外保险领域的领先云平台 CCC 正在使用 DGX Cloud,以加快和扩展其 AI 模型的开发与训练。这些模型为该公司的创新汽车理赔解决方案赋能, 帮助加速该行业的智能自动化,并为每天数百万的企业用户及其消费者改进理赔体验。

ServiceNow 正在使用 DGX Cloud 与本地 NVIDIA DGX 超级计算机,来构建灵活可扩展的混合云 AI 超级计算,以来帮助其在大型语言模型、代码生成和因果分析方面的 AI 研究。ServiceNow 还与其他机构共同发起了一个负责任的开放科学生成式 AI 倡议——BigCode 项目,其在 NVIDIA 的 Megatron-LM 框架上进行训练。

打开浏览器即可使用

NVIDIA AI 超级计算和软件

企业可以使用 NVIDIA Base Command™ 平台软件管理和监控 DGX Cloud 训练工作负载,该软件可实现 DGX Cloud 以及本地 NVIDIA DGX 超级计算机之间用户体验的无缝衔接。通过使用 Base Command 平台,用户可根据每项工作所需的 DGX 基础设施的数量和类型,将工作负载与之相匹配。

DGX Cloud 包含 NVIDIA AI Enterprise。NVIDIA AI Enterprise 作为 NVIDIA AI 平台的软件层,通过提供端到端 AI 框架和预训练模型,来加速数据科学流程,并简化生产级 AI 的开发和部署。今日发布的 NVIDIA AI Enterprise 3.1 提供新的预训练模型、经过优化的框架和加速数据科学软件库,可进一步帮助开发人员启动他们的 AI 项目。

DGX Cloud 的每个实例都配有 8 个 NVIDIA H100 或A100 80GB Tensor Core GPU,每个节点共有 640GB GPU 内存。使用 NVIDIA 网络解决方案构建的高性能、低延迟结构确保了工作负载能够在互连系统集群中扩展,使多个实例就像一个巨型的 GPU,以满足高级 AI 训练性能要求。集成在 DGX Cloud 中的高性能存储为 AI 超级计算提供了完整的解决方案。

DGX Cloud 特有的来自 NVIDIA 专家的支持贯穿整个 AI 开发流程。用户可以直接与 NVIDIA 工程师一起优化模型,并迅速解决各种行业用例中的开发难题。

供应情况

DGX Cloud 实例的价格为每实例每月 36,999 美元起。企业机构可以联系 NVIDIA 合作伙伴网络了解更多详情。

相关新闻