我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何有效减少 AI 模型的数据中心能源消耗?

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何有效减少 AI 模型的数据中心能源消耗?

在 Google 上搜索航班时,您可能已经注意到,现在每个航班的碳排放量估算值都显示在其成本旁边。这是一种告知客户其对环境影响的方式,并让他们将这些信息纳入决策中。

尽管计算机行业的碳排放量超过了整个航空业的碳排放量,但这种透明度尚不存在。这种能源需求不断升级的是人工智能模型。像ChatGPT这样巨大的流行模型预示着大规模人工智能的趋势,预测到2030年,数据中心将消耗全球21%的电力供应。

麻省理工学院(MIT)林肯实验室超级计算中心(LLSC)正在开发技术,以帮助数据中心控制能源使用。他们的技术范围从简单但有效的更改,如调整硬件的功率上限,到采用可以在早期停止人工智能训练的新工具。至关重要的是,他们发现这些技术对模型性能的影响最小。

从更广泛的角度来看,他们的工作是动员绿色计算研究并促进透明文化。“能源感知计算并不是一个真正的研究领域,因为每个人都在保留他们的数据,”领导能源感知研究工作的LLSC高级职员Vijay Gadepally说。“必须有人开始,我们希望其他人也能效仿。

抑制功率和冷却

与许多数据中心一样,LLSC 在其硬件上运行的 AI 作业数量显著增加。注意到能源使用量的增加,LLSC的计算机科学家对更有效地运行作业的方法感到好奇。绿色计算是该中心的一项原则,该中心完全由无碳能源提供动力。

训练 AI 模型(从庞大数据集中学习模式的过程)需要使用图形处理单元 (GPU),这些硬件是耗电的硬件。例如,训练 GPT-3(ChatGPT 的前身)的 GPU 估计消耗了 1,300 兆瓦时的电力,大致相当于1,450 个美国普通家庭一个月使用的电力。

虽然大多数人寻求 GPU 是因为其计算能力,但制造商提供了限制 GPU 允许消耗的功率的方法。“我们研究了封顶功率的影响,发现我们可以将能耗降低约12%至15%,具体取决于模型,”LLSC的研究员Siddharth Samsi说。

限制功率的影响是增加任务时间——GPU 完成任务所需的时间将延长约 3%,Gadepally 表示,考虑到模型通常需要几天甚至几个月的训练,这种增加“几乎不明显”。在他们的一项实验中,他们训练了流行的 BERT 语言模型,将 GPU 功率限制在 150 瓦,训练时间增加了两个小时(从 80 小时增加到 82 小时),但节省了相当于一个美国家庭一周的能源。

然后,该团队构建了软件,将这种功率封顶功能插入到广泛使用的调度器系统 Slurm 中。该软件允许数据中心所有者在其系统中或逐个作业设置限制。

“我们今天就可以部署这种干预措施,我们已经在所有系统中这样做了,”Gadepally说。

附带的好处也出现了,自从实施功率限制以来,LLSC 超级计算机上的 GPU 一直在以更稳定的温度运行 30 华氏度左右,从而减少了冷却系统的压力。运行硬件冷却器还可以提高可靠性和使用寿命。他们现在可以考虑推迟购买新硬件——减少中心的“隐含碳”,即通过制造设备产生的排放——直到使用新硬件所获得的效率抵消了这方面的碳足迹。他们还在寻找减少冷却需求的方法,通过战略性地将作业安排在夜间和冬季运行。

Gadepally说:“数据中心今天可以使用这些易于实施的方法来提高效率,而无需修改代码或基础设施。

全面了解数据中心的运营以寻找削减成本的机会可能会耗费大量时间。为了让其他人更容易完成这一过程,该团队与Northeastern大学的Devesh Tiwari教授和Baolin Li合作,最近开发并发布了一个用于分析高性能计算系统碳足迹的综合框架。系统从业者可以使用此分析框架来更好地了解其当前系统的可持续性,并考虑对下一代系统进行更改。

调整模型的训练和使用方式

除了对数据中心运营进行调整外,该团队还在设计提高 AI 模型开发效率的方法。

在训练模型时,AI 开发人员通常专注于提高准确性,并以以前的模型为基础进行构建。为了实现所需的输出,他们必须弄清楚要使用哪些参数,而要做到这一点可能需要测试数千种配置。这个过程被称为超参数优化,是LLSC研究人员发现的减少能源浪费的成熟领域。

“我们开发了一个模型,基本上着眼于给定配置的学习速度,”Gadepally说。鉴于这个比率,他们的模型预测了可能的表现。表现不佳的模型会提前停止。“我们可以在早期给你一个非常准确的估计,最好的模型将在100个模型中的前10个模型中,”他说。

在他们的研究中,这种提前停止导致了巨大的节省:用于模型训练的能源减少了80%。他们将这种技术应用于为计算机视觉、自然语言处理和材料设计应用程序开发的模型。

“在我看来,这种技术在推进人工智能模型训练方式方面具有最大的潜力,”Gadepally说。

训练只是 AI 模型排放的一部分。随着时间的推移,排放的最大贡献者是模型推理,或实时运行模型的过程,例如用户与 ChatGPT 聊天时。为了快速响应,这些模型使用冗余硬件,一直运行,等待用户提出问题。

提高推理效率的一种方法是使用最合适的硬件。此外,该团队还与Northeastern大学合作,创建了一个优化器,将模型与碳效率最高的硬件组合相匹配,例如用于推理计算密集型部分的高功率GPU和用于要求较低的方面的低功耗中央处理器(CPU)。这项工作最近在国际ACM高性能并行和分布式计算研讨会上获得了最佳论文奖。

使用此优化器可以减少 10-20% 的能源使用,同时仍能满足相同的“服务质量目标”(模型的响应速度)。

此工具对云客户特别有用,这些客户从数据中心租用系统,并且必须从数千个选项中选择硬件。“大多数客户高估了他们的需求;他们之所以选择功能过强的硬件,只是因为他们不知道更好,“Gadepally 说。

绿色计算意识的增强

实施这些干预措施所节省的能源也降低了开发人工智能的相关成本,通常以一比一的比例降低。事实上,成本通常被用作能源消耗的代名词。既然节省了这些成本,为什么不让更多的数据中心投资于绿色技术呢?

“我认为这有点激励失调的问题,”萨姆西说。“在构建更大更好的模型方面,有如此激烈的竞争,几乎所有次要考虑因素都被搁置一旁。

他们指出,虽然一些数据中心购买了可再生能源信用额度,但这些可再生能源不足以满足不断增长的能源需求。为数据中心供电的大部分电力来自化石燃料,而用于冷却的水正在导致流域压力。

他们还承认,如果没有能够向人工智能开发人员展示其消费的工具,就很难实现透明度。他们希望能够向每个LLSC用户展示每项工作,他们消耗了多少能源,以及该能源量与其他能源量的比较情况,类似于家庭能源报告。

这项工作的一部分需要与硬件制造商更紧密地合作,以便更容易、更准确地从硬件中获取这些数据。如果制造商能够标准化数据的读取方式,那么节能和报告工具就可以应用于不同的硬件平台。LLSC 研究人员和英特尔之间正在开展合作,以解决这一问题。

即使对于意识到人工智能强烈能源需求的人工智能开发人员来说,他们也无法独自做太多事情来遏制这种能源使用。LLSC团队希望帮助其他数据中心应用这些干预措施,并为用户提供能源感知选项。他们的第一个合作伙伴关系是与美国空军合作,美国空军是这项研究的赞助商,该研究运营着数千个数据中心,应用这些技术可以显着降低其能耗和成本。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何有效减少 AI 模型的数据中心能源消耗?

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何有效减少 AI 模型的数据中心能源消耗?

在让人工智能变得更好的竞赛中,麻省理工学院(MIT)林肯实验室正在开发降低功耗、高效训练和透明能源使用的方法。

数据中心消耗的能源比你想象的要少

发表在学术期刊《科学》(Science)上的一份报告指出,“数据中心代表着日益数字化的世界的信息支柱”,人工智能和制造技术的进步意味着必须处理和存储大量数据。
数据中心2024-12-03

AI崛起加剧数据中心能源消耗,谷歌新技术或帮助减排

谷歌引领的一项创新技术逐步受到重视:该技术通过软件在全球太阳能和风能资源丰富的区域搜索清洁电力,随后增加这些地区数据中心的运营活动。这种策略不仅有助于减少碳排放,还能降低运营成本。

戴尔构建的绿色数据中心有效降低能源消耗率

戴尔科技集团始终坚信,优先考虑环境的可持续性以更好的推动人类进步是每个技术提供商的责任。
戴尔2024-12-01

如何消减数据中心的能源需求以获取利润

如今,行业人士都知道英国能源市场正在经历一个转型期,因为需要平衡人们的需求,以确保提供可靠的能源供应,减少碳排放量,并且维护其经济性。
数据中心2024-11-29

如何提高数据中心效率并削减能源费用?

Uptime Institute的可持续发展研究主管 Jay Dietrich 分享了企业如何提高 IT 效率以及一些改善数据中心生态和可持续友好性的好方法……

如何为数据中心选择最有效的消防措施

如今,并没有一个针对数据中心的通用消防解决方案。不同的区域有不同的火灾隐患,每种消防技术都有其优点。
数据中心2024-11-30

如何在Couchbase中进行有效的数据模型设计

在Couchbase中进行有效的数据模型设计是非常重要的,以下是一些指导原则:考虑数据访问模式:在设计数据模型时,首先要考虑数据将如何被访问和查询。这将有助于确定最佳的数据结构和索引设计。使用适当的数据结构:根据数据的特性和访问模式,选择最
如何在Couchbase中进行有效的数据模型设计
2024-04-09

如何利用可观测性技术优化数据中心的能源效率

从经济和环境的角度来看,数据中心的能源效率至关重要。由于能源成本占数据中心运营费用的很大一部分,因此提高能源效率可以节省大量成本。此外,由于数据中心在全球能源消耗和相关温室气体排放中占相当大的份额,因此提高其能源效率可以有助于缓解气候变化。

AI算力需求飙升功耗也猛增,数据中心该如何降温——戴尔科技携手英特尔共建绿色数据中心破解能效难题

“AI的尽头是光伏和储能”,相信很多人对这句话并不陌生。这句话非常形象地说明了AI对电力的高依赖和高消耗,言简意赅,在业界广为流传。
戴尔科技2024-11-30

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录