人工智能
生成式AI让电网不堪重负
生成式AI对能源需求巨大,导致全球电网承受巨大压力,数据中心的能源消耗将持续上升。
生成式AI有一个大问题,Hugging Face的机器学习公司Sasha Luccioni说,生成式AI是一个能源大户。
“每次你查询模型时,整个系统都会被激活,所以从计算的角度来看,这非常低效,”她说。
以许多生成式AI系统核心的大型语言模型(LLMs)为例。它们已经在大量的书面信息上进行了训练,这使得它们能够对几乎任何查询生成文本。
“当你使用生成式AI时……它是在从头生成内容,基本上是在编造答案,”Dr. Luccioni解释道。这意味着计算机需要非常努力地工作。
根据Dr. Luccioni和同事最近的一项研究,生成式AI系统可能比运行特定任务软件的机器使用大约33倍的能量。这项工作已经过同行评审,但尚未在期刊上发表。
然而,消耗这些能源的不是你的个人电脑,也不是你的智能手机。我们越来越依赖的计算实际上发生在巨大的数据中心中,对于大多数人来说,这些数据中心是看不见的,也不在意。
“‘云’,你不会想到这些加热并消耗大量能源的巨大金属盒子,”Dr. Luccioni说。
世界各地的数据中心正消耗越来越多的电力。2022年,它们消耗了460太瓦时的电力,国际能源署(IEA)预计这一数字将在四年内翻倍。到2026年,数据中心的年用电量可能达到1000太瓦时。“这种需求大致相当于日本的电力消费量,”IEA表示。日本人口有1.25亿。
在数据中心,巨量信息被存储以便在世界任何地方检索——从你的电子邮件到好莱坞电影。那些无名建筑中的计算机还支持AI和加密货币。它们支撑着我们所知的生活。
但一些国家非常清楚这些设施的能源消耗。目前在都柏林禁止新数据中心的建设。近五分之一的爱尔兰电力被数据中心消耗,预计未来几年这一比例将显著增长——与此同时,爱尔兰家庭正在减少他们的用电量。
英国国家电网的负责人在三月份的一次演讲中表示,数据中心的电力需求将在十年内增长六倍,主要是由于AI的崛起。然而,国家电网预计电气化交通和供热所需的能源总量将更大。
研究公司Wood Mackenzie的Chris Seiple表示,美国的公用事业公司开始感受到压力。
“他们在政府政策的推动下,国内制造业复兴的同时,正面临数据中心需求的冲击,”他解释道。据美国报道,一些州的立法者现在正在重新考虑给予数据中心开发商的税收减免,因为这些设施对当地能源基础设施的压力实在太大。
Seiple先生说,数据中心选址正进行“土地争夺战”,争夺靠近发电站或可再生能源中心的位置:“爱荷华州是数据中心开发的热点地区,那里有大量风力发电。”
由于延迟问题(即从数据中心发送信息到用户接收信息之间的时间延迟,通常以毫秒为单位)对越来越受欢迎的生成式AI系统来说不再是主要问题,一些数据中心现在可以负担得起搬到更偏远的地方。过去,处理紧急通信或金融交易算法的数据中心通常位于或非常靠近大型人口中心,以获得最佳响应时间。
毫无疑问,数据中心的能源需求将在未来几年上升,但具体上升多少存在巨大不确定性,Seiple先生强调。
这种不确定性部分归因于生成式AI背后的硬件正在不断演变。
Compass Quantum数据中心业务的总经理Tony Grayson指出,Nvidia最近推出的Grace Blackwell超级计算机芯片(以一位计算机科学家和一位数学家命名),专门用于支持高端进程,包括生成式AI、量子计算和计算机辅助药物设计。
Nvidia表示,未来公司可以在90天内训练出比目前可用的AI大几倍的模型。需要8000个上一代Nvidia芯片和15兆瓦的电力供应。
但是,据Nvidia称,同样的工作可以通过仅2000个Grace Blackwell芯片在相同时间内完成,它们只需4兆瓦的电力供应。
这仍然需要8.6吉瓦时的电力消耗——大致相当于贝尔法斯特整个城市一周的用电量。
Grayson先生说:“性能的提升使得整体能源节省非常显著。”但他也同意,电力需求正在影响数据中心运营商选址:“人们正在寻找电力便宜的地方。”
Dr. Luccioni指出,制造最新计算机芯片所需的能源和资源也非常可观。
尽管如此,美国劳伦斯伯克利国家实验室的顾问Dale Sartor认为,随着时间的推移,数据中心的能效确实有所提高。其效率通常以电源使用效率(PUE)来衡量。数字越低,效果越好。他指出,最先进的数据中心的PUE大约为1.1。
这些设施确实产生了大量的废热,而在找到利用这些废热的方法方面,欧洲领先于美国,例如用于加热游泳池,Sartor先生说。
Equinix数据中心公司的英国董事总经理Bruce Owen表示:“我仍然认为,需求增长将超过我们所见的效率提升。”他预测,未来将有更多数据中心内建发电设施。去年,Equinix在都柏林申请建造燃气发电数据中心的计划被拒绝。
Sartor先生补充说,最终成本可能会决定生成式AI在某些应用中的价值:“如果旧的方法更便宜、更容易,那么新方法的市场将不大。”
Dr. Luccioni强调,人们需要清楚了解面前不同选项在能效方面的差异。她正在参与一个项目,开发AI的能效评级。
“与其选择这个非常笨重且耗能巨大的GPT衍生模型,不如选择这个能效等级为A+的模型,它将更加轻便和高效,”她说。