作者:赵广立,赵宇彤 来源:中国科学报 发布时间:2024/11/1 21:52:25
选择字号:
关注!5年后生成式AI或将产生500万吨电子垃圾

 

即便做了充足的心理准备,汪鹏仍感到形势严峻——

如果不采取循环经济策略,生成式人工智能到2030年预计将累计产生500万吨电子废弃物,“或将会给人类可持续发展带来重大挑战”。

伴随着人工智能(AI)的飞速发展,有关生态环境的隐忧也浮出水面:能耗增高、碳排放激增……种种讨论里,唯独缺少对算力设施及硬件报废产生的电子废弃物的关注。

瞄准这一空白,中国科学院城市环境研究所研究员汪鹏及其团队实习生张凌宇,联合该所研究员陈伟强和以色列瑞赫曼大学教授阿萨夫·察科尔,率先开展生成式人工智能带来的电子废弃物挑战的量化分析,发现如果不采取循环经济的策略,2023年至2030年生成式人工智能带来的电子废弃物将累积达120万至500万吨。

10月28日,相关研究成果在线发表于《自然—计算科学》,并得到审稿人的高度认可,“这项研究率先尝试量化人工智能对电子废弃物的影响,重要而且迫切。”

看纪录片诞生的想法

从纪录片里获得科研灵感,看似不可思议,却实实在在地发生了。

“‘挖矿’需要耗费大量电力,并带来大量二氧化碳排放,以及电子垃圾生成。”正在观看纪录片《永远吹冲锋号》的汪鹏听到这句话愣了下,一个念头一闪而过:正在飞速发展的生成式人工智能会不会也产生了许多电子垃圾?

基于这个想法,他展开了一系列的文献阅读及调研。他发现,围绕人工智能与可持续发展的讨论,主要集中在能源、碳排放等方面,几乎没人系统研究过其潜在的电子废弃物问题。

“这个研究方向有搞头!”他心想。不久后,英伟达一场发布会更让他坚定了念头。2024年3月,英伟达推出的Blackwell计算平台重量高达1.36吨(约3000磅),相当于一辆碳纤维法拉利!

“生成式人工智能的底层是一个材料密集型行业。”汪鹏感慨道,数据中心和服务器群中包括多种高性能计算硬件,比如GPU、CPU、内存模块、存储设备等,且服务器普遍寿命在3年左右。当其寿命结束后,就会成为大量电子废弃物。

综合考虑后,汪鹏团队决定着手开展生成式人工智能电子废弃物的研究。但很快,一个难题摆在了他们面前,怎样关联、量化生成式人工智能硬件需求以及产生的电子废弃物数量?

就生成式人工智能而言,一方面,其迅猛发展带来了大规模计算需求,对计算硬件和基础设施的需求持续增长;另一方面,芯片制程工艺的进步带来芯片性能的快速提升,单个芯片性能越高,同样算力需求下所需的芯片数量越少。

但未来生成式人工智能的发展和应用会如何发展?又会产生多少算力需求?具体到硬件层,需要多少芯片和服务器?受地缘政治影响,如何考量不同地区的硬件差异呢?汪鹏团队犯了难。

不容忽视的全球性挑战

汪鹏团队决定以大语言模型为研究重点,“兵分两路”。

一方面,在预测未来大语言模型的算力需求时,该团队参考了产业界多方预测及行业研究报告,预设了三种不同的发展情景,分别是广泛应用的“激进发展情景”、有限应用的“中等发展情景”,以及少数特定应用的“保守发展情景”。

同时,汪鹏团队通过评估大语言模型参数规模、训练数据量、全球大语言模型数量、每日活跃用户数等因素推导得出,不同发展情景对算力需求的复合年增长率分别为136%、115%和85%。

另一方面,芯片性能考量也尤为关键。基于摩尔定律,汪鹏团队根据2020年至2022年服务器的增长数量,推算2023年至2030年服务器的算力水平变化。并出于地缘政治的考虑,相应调整了中国、美国、欧洲等地区芯片性能及发展水平。

此外,目前只有少数企业具备生产先进GPU芯片的能力,本研究基于这些企业过往两年的产能及出货量情况,设置了未来GPU产能扩展率的限制条件,构建了产能约束的发展情景.

基于上述思考,汪鹏团队创新地开发了“算力物质流(CP-MFA)”模型,对人工智能“需求—算法—算力—芯片”进行分层解构及参数化建模,“该方法有效串联了人工智能终端服务需求与底层物理世界的关联,为今后围绕人工智能硬件设施的相关研究提供了重要基础工具。”汪鹏进一步解释道。

模型推演结果显示,如果不采取任何循环经济措施,2030年,生成式人工智能产生的电子废弃物可高达250万吨。2023年到2030年,在激进、中等和保守情景中,产生的电子废弃物总量分别是500万吨、300万吨和180万吨。

做个“吹哨人”

提及生成式人工智能的爆发式增长,总是绕不开著名的阿玛拉定律:“人们总是高估一项科技所带来的短期效益,却又低估它的长期影响。”

“生成式人工智能的发展带来了革命性的变革和机遇,这是非常好的事情。但我们必须清晰界定,从长远来看,这项技术会带来哪些挑战和负面影响,提前预警、重点防范。”汪鹏告诉记者,“考虑到生成式人工智能的发展速度很快,为了更及时预测、预警电子废弃物问题,不同于与以往按年度划分,我们选择以季度为单位展开研究。”

应对这一挑战,汪鹏团队基于“需求—算法—算力—芯片”框架,提出了全链条循环经济策略。

从算法层面,探索设计更加高效的算法,减少算力消耗;从芯片层面,通过高效芯片开发,减少不必要的计算和存储,提高数据处理的性能和效率,可以较预期减少约50%的电子废弃物;在运营层面,将寿命结束的服务器降级循环利用,额外使用一年,就能够避免约62%的电子废弃物;拆卸、翻新和重新制造已过时服务器的关键模块则能节省42%等。

但这些措施要想真正落地,还有很长的路要走。汪鹏团队调研发现,全球只有零星几家企业针对该问题提出应对策略。

“相关企业应该加快行动,积极应对这一挑战。”汪鹏说。当前,生成式人工智能的发展仍在“跑马圈地”,快速增长的背后,潜藏着很多问题,距离真正“负责任”的人工智能还任重道远。

“由于生成式人工智能催生了更高的算力要求,数据中心重复建设的问题也愈发突出。”汪鹏举了个例子,“比如一些厂商想要独立开发算法,就难免会重复训练,这可能导致比模型估算结果更多的电子废弃物的产生。”

面对现实挑战,汪鹏坦言,本研究只能发挥类似“吹哨人”作用。“未来,我们这项研究还将进一步深入,实现更加精准、全面的人工智能电子废弃物的监测,同时关注人工智能引发的更多资源环境问题及相关技术挑战。”汪鹏期待,通过这一研究,希望能推动更多国家及企业出台相关举措,让人工智能更“负责任、可持续”。

  ?

生成式人工智能产生电子废弃物量化框架图(课题组供图)

相关研究信息:https://doi.org/10.1038/s43588-024-00712-6


 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
首张另一星系中的恒星照片出炉 《自然》(20241121出版)一周论文导读
清华这位院士搭建了一座室外地质博物园 科学家完整构建火星空间太阳高能粒子能谱
>>更多
 
一周新闻排行
 
编辑部推荐博文
 
Baidu
map