什么是绿色计算?
2022-11-03 14:13
绿色计算也被称为可持续计算,旨在设计和使用计算机芯片、系统和软件的过程中最大限度地提高能效并减轻对环境的影响。
人人都想要绿色计算。
移动用户想要最大的性能和电池寿命;企业和政府越来越需要功能强大又环保的系统;云服务必须在不导致电网中断的情况下响应全球需求。
绿色计算因此在过去三十年中迅速发展,并将在未来继续发展。
什么是绿色计算?
绿色计算或可持续计算指在设计和使用计算机芯片、系统和软件的过程中,最大限度地提高能效并减轻对环境的影响。
绿色计算也被称为绿色信息技术、绿色 IT 或可持续 IT,它涵盖了整条供应链,从用于制造计算机的原材料到系统的回收方式。
在工作过程中,绿色计算机必须以最少的能源完成最多的工作。通常是以每瓦特性能来衡量绿色计算机的效率。
为什么绿色计算十分重要?
绿色计算是应对气候变化的重要工具,而气候变化是这个时代的生存威胁。
在过去的一个世纪中,全球气温上升了约 1.2 摄氏度,这使冰川融化,进而导致海平面上升约 20 厘米,并增加了极端天气事件的频率和严重性。
用电量的增加是引起全球变暖的原因。虽然数据中心目前的用电量为每年 200 太瓦时,只占总用电量的约 1%,但这个数字却在不断增加,需要引起重视。
强大、节能的计算机是解决方案的一部分。它们正在推动科学的发展和生活质量的提高,包括人们理解和应对气候变化的方式。
绿色计算由哪些部分组成?
工程师们认为绿色计算是一门综合学科。
该行业 MLPerf AI 基准测试功率工作组联合主席、在NVIDIA 从事性能分析的杰出工程师 Sachin Idgunji 表示:“能效是从软件到芯片的全栈式问题。”
例如在分析中,他发现 NVIDIA DGX A100 系统与上一代产品相比,在横向扩展 AI 训练基准测试中的能效提高了近 5 倍。
Sachin Idgunji 表示:“我的主要职责是分析和提高 AI 应用能效,从 GPU 和系统节点到整个数据中心规模。”
Idgunji 的工作为越来越多制造智能手机、超级计算机等产品的工程师提供了工作指引。
绿色计算的历史
绿色计算在 1992 年成为公众关注的焦点。当时美国环境保护局启动了“能源之星”项目来识别符合能效标准的消费电子产品。
目前已有三十多个产品组使用“ 能源之星”标志。
2017 年的报告发现,有近 22 个国家的 100 个政府和行业项目在推行绿色信息通信技术,即可持续的信息和通信技术。
其中绿色电子委员会组织提供了电子产品环境评估工具,以记录系统及其能效水平。该委员会声称,迄今为止,全球通过使用其推荐的 15 亿种绿色产品,已经节省了近 4 亿兆瓦时的电力。
整个行业的各个层面都在继续开展绿色计算的工作。
例如,一些大型数据中心使用液冷技术,另一些数据中心则选址于可以使用凉爽环境空气进行冷却的地点。施耐德电气最近发布的白皮书推荐了 23 个衡量数据中心可持续性水平的指标。
根据施耐德发布的白皮书,数据中心的可持续性衡量指标包括能源和水的使用以及温室气体排放和废弃物。
节能先驱
弗吉尼亚理工大学计算机科学教授 Wu Feng 一直致力于推动绿色计算。出于需要,他在洛斯阿拉莫斯国家实验室工作时开始了这项工作。
当时,Wu Feng 正在外部仓库中维护用于开放性科学研究的计算机集群,该集群在夏季和冬季故障率倍增,为此他建立了不会产生那么多热量的低功率系统。
在 2001 年的超级计算大会上,Wu Feng 演示了这个名为“Green Destiny”的系统。英国广播公司(BBC)、美国有线电视新闻网(CNN)和《纽约时报》等媒体对此进行了报道,引发了高性能计算(HPC)界多年来关于绿色计算潜在可靠性与效率的讨论和辩论。
随着超级计算机和数据中心的发展和不断刷新的功耗极限,人们对绿色计算也越来越感兴趣。2007 年 11 月,Feng 在与约 30 位高性能计算界大咖合作并收集业界反馈后,发布了首期 Green500 榜单。该名单成为了业界高能效超级计算机的基准。
绿色计算基准
Green500 充分调动了业界在进一步提升性能的同时控制能耗的积极性。
Feng 表示:“计算机的能效成倍增长。名列前茅的绿色超级计算机大约每一年半增加一倍每瓦特运算量。”
一些指标的结果显示,全球最“绿色”系统的能效在过去 14 年中增长了两个数量级。
Green500 显示,异构系统(除了搭载 CPU 之外还搭载 GPU 等加速器的系统)始终是最节能的系统。
Feng 将这些成果主要归功于加速器的使用,比如如今已被全球最快的系统普遍使用的 GPU。
他表示:“加速器在无需大量开销的情况下增强了大规模并行执行代码的能力,让系统的运行速度快得惊人。”
Feng 提到了日本早期的两代 Tsubame 超级计算机。由于使用了 NVIDIA Kepler 和 Pascal 架构的GPU,这两台超级计算机在 2014 年和 2017 年的 Green500 榜单上名列前茅,并且是该榜单上 GPU 加速系统的一部分。
Feng 表示:“加速器对整个榜单影响巨大。”凭借在绿色超级计算领域的工作,Feng 将在 11 月的这场超级计算活动上领取专属于他的奖项。
他还表示:“值得一提的是,NVIDIA 非常出色地参与并支持了 Green500,保证了能效数据的报告,帮助能效成为当今超级计算机设计中最重要的指标。”
提高 AI 和网络的效率
今天,GPU 和数据处理单元(DPU)正在为 AI 和网络任务以及在超级计算机和企业数据中心运行的模拟等高性能计算工作带来更高的能效。
AI 是这个时代最强大的技术,它将成为每个企业的一部分。麦肯锡估计,随着 AI 部署量的增加,到 2030 年 AI 将为全球 GDP 增加高达 13 万亿美元。
NVIDIA 估计,如果所有 AI、HPC 和网络卸载都在 GPU 和 DPU 加速器上运行,那么数据中心每年可以节省高达 19 太瓦时的电力(见下图),这相当于 290 万辆乘用车一年的能耗。
可见,加速计算具有惊人的节能潜力。
GPU 和 DPU 加速计算的节能潜力分析
AI 基准测试衡量效率
由于 AI 在企业工作负载中的比重日益增加,因此 MLPerf AI 行业基准测试从 2021 年 2 月开始就一直在衡量数据中心和边缘推理所有提交工作的每瓦特性能。
Idgunji 表示:“在用于高性能计算工作负载和 AI 训练的更大分布式系统上衡量 AI 的能效是下一个前沿领域,这与 Green500 的工作类似。”他所在的 MLPerf 功率工作组包括来自其他六家芯片和系统公司的成员。
NVIDIA Jetson 模块最近在 MLPerf AI 推理基准测试中展现出每瓦特性能上的巨大代际跃升
公开的结果激励着参与者对每一代产品中做出重大改进。他们还帮助工程师和开发者了解如何在 MLPerf 所测试的主要 AI 工作负载中平衡性能和效率。
Idgunji 表示:“软件优化是这项工作的重要部分,它们会对能效产生巨大的影响并且让你的节能系统变得更可靠。”
面向消费者的绿色计算
NVIDIA GPU 功率架构师 Narayan Kulshrestha 表示:“我们长期投资于提高个人电脑和笔记本电脑的效率,这是最正确的做法。”
例如为了提高系统效率,Dynamic Boost 2.0 使用深度学习自动将功率导向 CPU、GPU 或 GPU 的内存。另外,NVIDIA 为笔记本电脑创造了名为 Max-Q 的系统级设计来优化和平衡能效与性能。
构建循环经济
当用户更换系统时,标准的绿色计算做法是分解和回收旧系统。但 Matt Hull 发现了更好的方案。
NVIDIA 数据中心 AI 产品销售副总裁 Hull 表示:“构建循环经济,让每个人都能用上 AI 是我们的愿景。”
因此,他的目标是在发展中国家为该系统找到新的归属,让这些用户认为它有用且价格合理。这项正在开展的工作需要找到合适的合作伙伴并将在现有的生命周期管理流程中书写新的篇章。
绿色计算对抗气候变化
节能的计算机是对抗气候变化的最有效工具。
长期以来,政府实验室以及大学的科学家们一直使用 GPU 来模拟气候情景和预测天气模式。在 NVIDIA GPU 的驱动下,最新 AI 的天气预报建模速度比传统模型快 10 万倍。请观看以下视频了解详情:
为了加速气候科学的发展,NVIDIA 宣布建立 Earth-2 的计划。Earth-2 是专门用于预测气候变化影响的 AI 超级计算机。它将使用 3D 设计协作和模拟平台 NVIDIA Omniverse 来构建地球的数字孪生,使科学家能够以超高的分辨率模拟气候。
另外,NVIDIA 还与联合国卫星中心一起加速气候灾害管理,并在全球培训数据科学家使用 AI 改进洪水检测。
公用事业单位也在使用机器学习实现绿色、有弹性的智能电网。发电厂则在使用数字孪生进行预测性维护以及建立新能源模型,比如核聚变反应堆的设计等。
绿色计算的未来发展趋势
Feng 认为绿色计算背后的核心技术会取得多点突破。
短期内,他正在研究所谓的能量比例,即如何确保系统在需要峰值性能时获得峰值功率,并在系统放慢到空闲状态时“优雅”地把功率降低到零,就像现代汽车的发动机逐渐放慢转速并在红灯前停止一样。
研究人员试图缩小能量比例计算的差距
从长远看,他正在探索如何通过最大限度地减少计算机芯片内部之间的数据移动来减少其能耗。他还与许多其他研究者一起研究如何使用量子计算提供新型加速。
这些持续进行的绿色计算工作将不断提高计算机的性能与效率。