0

0

ChatGPT热潮下的冷思考:2025年AI能耗或超人类,AI计算需要提质增效

PHPz

PHPz

发布时间:2023-04-12 09:43:02

|

1762人浏览过

|

来源于51CTO.COM

转载

经过多年的开发,OpenAI公司推出的DALL-E和GPT-3生成式AI系统风靡全球,目前凸显了其惊人的应用潜力。然而,这种生成式AI爆发式增长存在一个问题:每当DALL-E创建一张图像或GPT-3预测出现下一个的单词时,就需要进行多次推断计算,因此占用大量的资源,并耗费更多的电力。当前的GPU和CPU架构不能有效地运行以满足迫在眉睫的计算需求,这为超大规模数据中心运营商带来巨大的挑战。 

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ChatGPT热潮下的冷思考:2025年AI能耗或超人类,AI计算需要提质增效

调研机构预测,数据中心成为了全球最大的能源消费者,占总用电量的比例将从2017年的3%上升到2025年的4.5%。以中国为例,2030年全国运营的数据中心用电量预计将超过4000亿度,占全国总用电量的4%。 

云计算供应商也认识到他们的数据中心使用了大量电力,并采取了提高效率的方法措施,例如在北极建设和运营数据中心,以利用可再生能源和自然冷却条件。不过,这还不足以满足AI应用爆炸式增长的需求。

美国劳伦斯伯克利国家实验室在研究中发现,在过去20年,数据中心效率的提高一直在控制能耗的增长,但研究表明,现在的能效措施可能不足以满足未来数据中心的需求,因此需要采用更好的方法。 

数据传输是致命瓶颈

效率的根源在于GPU和CPU的工作方式,特别是在运行AI推理模型与训练模型的时候。很多人了解“超越摩尔定律”以及在更大尺寸的芯片上封装更多晶体管的物理限制。更先进的芯片正在帮助解决这些挑战,但目前的解决方案在AI推理方面有一个关键弱点:在随机访问内存中传输数据的速度显著降低。 

传统上,分离处理器和存储芯片成本更低,多年来,处理器时钟速度一直是计算机性能的关键限制因素。如今,阻碍发展的是芯片之间的互连。

美国国家标准与技术研究院(NIST)研究人员的Jeff Shainline解释说:“当内存和处理器分离时,连接两个域的通信链路就成为了系统的主要瓶颈。”美国橡树岭国家实验室研究人员Jack Dongarra教授简洁地说:“当我们审视当今计算机的性能时,发现数据传输是致命的瓶颈。” 

AI推理vs.AI训练 

与使用AI模型进行预测相比,AI系统在训练AI模型时使用不同类型的计算。AI训练在一个基于Transformer的模型中加载数以万计的图像或文本样本作为参考,然后开始处理。GPU中的数千个内核非常有效地处理大量丰富的数据集,例如图像或视频,如果需要更快地得到结果,可以租用更多的基于云计算的GPU。 

ChatGPT热潮下的冷思考:2025年AI能耗或超人类,AI计算需要提质增效

虽然AI推理需要更少的能量来进行计算,但在数亿用户的自动补全中,需要大量的计算和预测来决定下一个单词是什么,这比长期的训练要耗费更多的能量。

比如,Facebook的AI系统每天在其数据中心观察到数万亿次推断,在过去三年,这一数字增加了一倍多。研究发现,在大型语言模型(LLM)上运行语言翻译推理所消耗的能量是初始训练的两到三倍。

需求激增考验计算效率 

ChatGPT在去年年底风靡全球,GPT-4也更加令人印象深刻。如果能采用更节能的方法,就可以将AI推理扩展到更广泛的设备上,并创造出新的计算方式。 

简篇AI排版
简篇AI排版

AI排版工具,上传图文素材,秒出专业效果!

下载

例如,微软的Hybrid Loop旨在构建动态利用云计算和边缘设备的AI体验,这允许开发人员在Azure云平台、本地客户端计算机或移动设备上运行AI推理时做出后期绑定决策,以最大限度提高效率。Facebook引入了AutoScale来帮助用户在运行时有效地决定在哪里计算推断。 

为提高效率,需要克服阻碍AI发展的障碍,并找到行之有效的方法。

采样和流水线可以通过减少处理的数据量来加快深度学习。SALIENT(用于采样、切片和数据移动)是由麻省理工学院和IBM公司的研究人员开发的用于解决关键瓶颈一种新方法。这种方法可以显著地降低在包含1亿个节点和10亿条边的大型数据集上运行神经网络的需求。但它也影响了准确性和精确性——这对于选择下一个要显示的社交帖子来说是可以接受的,但如果试图近实时地识别工地上的不安全条件则不符合要求。

苹果、英伟达、英特尔和AMD等科技公司已经宣布将专用AI引擎集成到处理器中,AWS甚至正在开发新的Inferentia 2处理器。但这些解决方案仍然使用传统的冯·诺依曼处理器架构、集成SRAM和外部DRAM存储器——这些都需要更多电力来将数据移进和移出存储器。

内存内计算或成为解决之道 

此外,研究人员已经发现了另一种打破“内存墙”的方法,那就是让计算更接近内存。 

内存墙指的是限制数据进出内存速度的物理屏障,这是传统架构的一个基本限制。内存内计算(IMC)通过直接在内存模块中运行AI矩阵计算来解决这一挑战,避免了通过内存总线发送数据的开销。 

IMC适用于AI推理,因为它涉及一个相对静态但很大的权重数据集,可以反复访问。虽然总是需要输入和输出一些数据,但是AI通过将数据保存在相同的物理单元中,可以有效地使用和重复用于多个计算,从而消除了大部分的能量传输费用和数据移动的延迟。 

这种方法提高了可扩展性,因为它可以很好地用于芯片设计。通过采用新芯片,AI推断技术可以在开发人员的电脑上进行测试,然后通过数据中心部署到生产环境。数据中心可以使用一组带有许多芯片处理器的大型设备来有效地运行企业级AI模型。 

随着时间的推移,预计IMC将成为AI推理用例的主导架构。当用户处理大量的数据集和数万亿次的计算时,这是非常有意义的。因为不必浪费更多资源在内存墙之间传输数据,而且这种方法可以轻松扩展以满足长期需求。 

小结:

AI产业现在正处于一个令人兴奋的转折点。生成式AI、图像识别和数据分析的技术进步揭示了机器学习独特的联系和用途,但首先需要建立一个能够满足这一需求的技术解决方案。因为根据Gartner的预测,除非目前能提供更可持续的选择,否则到2025年,AI消耗的能源将超过人类活动所消耗的能源。在这种情况发生之前,需要想出更好的办法!

相关专题

更多
go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

46

2025.09.03

数据分析的方法
数据分析的方法

数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。php中文网为大家带来了数据分析的相关知识、以及相关文章等内容。

463

2023.07.04

数据分析方法有哪几种
数据分析方法有哪几种

数据分析方法有:1、描述性统计分析;2、探索性数据分析;3、假设检验;4、回归分析;5、聚类分析。本专题为大家提供数据分析方法的相关的文章、下载、课程内容,供大家免费下载体验。

277

2023.08.07

网站建设功能有哪些
网站建设功能有哪些

网站建设功能包括信息发布、内容管理、用户管理、搜索引擎优化、网站安全、数据分析、网站推广、响应式设计、社交媒体整合和电子商务等功能。这些功能可以帮助网站管理员创建一个具有吸引力、可用性和商业价值的网站,实现网站的目标。

724

2023.10.16

数据分析网站推荐
数据分析网站推荐

数据分析网站推荐:1、商业数据分析论坛;2、人大经济论坛-计量经济学与统计区;3、中国统计论坛;4、数据挖掘学习交流论坛;5、数据分析论坛;6、网站数据分析;7、数据分析;8、数据挖掘研究院;9、S-PLUS、R统计论坛。想了解更多数据分析的相关内容,可以阅读本专题下面的文章。

502

2024.03.13

Python 数据分析处理
Python 数据分析处理

本专题聚焦 Python 在数据分析领域的应用,系统讲解 Pandas、NumPy 的数据清洗、处理、分析与统计方法,并结合数据可视化、销售分析、科研数据处理等实战案例,帮助学员掌握使用 Python 高效进行数据分析与决策支持的核心技能。

71

2025.09.08

Python 数据分析与可视化
Python 数据分析与可视化

本专题聚焦 Python 在数据分析与可视化领域的核心应用,系统讲解数据清洗、数据统计、Pandas 数据操作、NumPy 数组处理、Matplotlib 与 Seaborn 可视化技巧等内容。通过实战案例(如销售数据分析、用户行为可视化、趋势图与热力图绘制),帮助学习者掌握 从原始数据到可视化报告的完整分析能力。

55

2025.10.14

ChatGPT注册
ChatGPT注册

ChatGPT注册方法:1、访问OpenAI的官方网站,进入注册页面;2、完成注册后收到一份邮件,打开后点击验证账号;3、选择一个适合您需求的订阅计划;4、获得访问ChatGPT的权限即可。

529

2023.09.12

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

10

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号