ChatGPT月排碳500吨背后,绿色数据中心的万亿市场
2023年开年后,人工智能赛道上,OpenAI旗下的ChatGPT就一直占据了头条。推出不到两个月的时间,它的月活用户就突破1亿,创造了最快的“从0到1”的增长纪录。但人工智能普及化的背后,算力大幅提升,也带来了科技公司们所需能源和碳排放量的增长。
数智化转型和数字经济发展过程中,数据中心作为算力基础设施,也是城市构建智慧大脑、智慧城市的重要载体。同时也有调研机构数据显示,数据中心已然成为全球最大的能源消费者。在过去20年,数据中心效率的提高一直在控制能耗的增长,但面对ChatGPT这样具有颠覆性的技术,也不禁让人们思考:未来,在高性能计算、AI大模型等需求的加持下,我们会需要什么样的数据中心,现在的能效措施可以满足未来数据中心的需求吗?
事实上,数据中心这个“能耗大户”,早已得到各方面的关注。在双碳的大目标下,中央及地方政策对数据中心的能耗指标做出了新的规定,对于各地新建数据中心的审批也已经收紧。东数西算工程的正式启动,也给数据中心的集群化、低碳化发展提供了契机。
数据中心,应该如何实现绿色化革新,解决PUE值(数据中心消耗的所有能源与IT负载消耗能源的比值)之困?市界研究院邀请上海社科院数字化绿色化协同发展研究中心主任、安徽长三角双碳发展研究院院长李易,以及中国电子云超融合总架构师陈沙克,共同讨论了这个问题。
火爆的ChatGPT,碳排放量有多高?
人工智能对话应用ChatGPT,不仅能够代替人写文章、写情书、写代码、做题,现在,它已经开始在不少机构里代替人工写文案和研报了。3月15日,OpenAI发布了GPT-4;3月16日,百度文心一言面世。
在这背后,有关ChatGPT的环境成本问题开始受到越来越多的关注。有机构曾表示,要训练这样一个包含1750亿参数的大模型,需要上万个CPU/GPU 24小时不间断输入数据,将带来巨大的耗电量和碳排放量。
对此,中国电子云超融合总架构师陈沙克认为,这其中应该也有误传的成分存在。据其表示,OpenAI没有正式公布过它的训练过程,外界只能推算;英伟达的说法是大概用了1000张A100 GPU芯片、用时一个月的时间完全训练,如果按照这个计算,约消耗130万度电、碳排放约520吨。“可能大家对这个数字没有概念,我们换个说法,目前每人每年约产生5吨碳排放,换算下来就是,训练ChatGPT一个月,相当于100多人一年的碳排放量。”
“AI竞赛基本上就是装备竞赛。”陈沙克说,不过对于ChatGPT这样大模型的研发,他认为,“从量化标准的角度来讲,它的碳排放量并没有大家想象中大。”
(图源/视觉中国)
但ChatGPT技术的发展,进一步催生了AI算力等大功率应用场景的普及,也需要大量的算力作为支撑。随着算力的增长,以及ChatGPT的训练、访问都需要大流量的云服务器支持,市场开始预期,数据中心的需求将被迅速拉升。对数据中心的“绿色化”,也将成为大势。
根据国际能源机构(IEA)的数据,数据中心是全球最大的能源消费者之一。建设绿色数据中心,不仅符合双碳战略的要求,对于其自身降本增效也将有着巨大的作用。据报道,联合市场研究公司预测,从2022年到2031年,绿色数据中心市场的复合年均增长率将达到20%,总市场规模将从2021年的497亿美元上升至3039亿美元。
双碳目标下,数据中心的PUE值之困
智能时代的数字化转型,以及数字经济发展,推动了数据中心的积极部署。“发展数字经济遇到的矛盾包括数据从哪产生,产生之后如何运算、分析、处理、传输、交互等。无论是从存储的角度,还是从运算的角度看,都需要消耗大量的数据中心。”李易说。
然而,数据中心也是“能耗大户”。“虽然现在全球对数据中心耗电和温室气体排放并没有进行精准的监测,但是我可以大概说一个数据:10年前,数据中心在美国消耗的电能是整个社会用能的10%,中国是不到3%。随着我们数字经济的蓬勃发展,这个比例一定很快就会和10年前美国的能耗水平看齐。”李易透露。
“现在的数据中心大量耗电,也存在能源结构的原因。比如上海自身的清洁能源,坦白讲并不能够支撑整个城市的用电量。所以,在上海或北京的数据中心用的还是所谓的非绿色电比如煤电。”李易表示。而东数西算工程的启动,就源于对东西部地区算力和能源的供需调节。利用西部地区的风、光、水资源提供的绿电,规划数据中心的集群化和中心化发展,再加上南水北调等手段,解决现在数字经济发展同时所产生的能耗问题和矛盾。
东数西算工程中,对于数据中心的PUE值的要求也不断提高。由于PUE指的是数据中心消耗的能源和IT设备消耗能源的比值,一般来说,PUE值越接近1,表示节能减排的程度越高;PUE值越高,表示制冷、供电等基础设备耗能越大。
2019年2月,工信部在《关于加强绿色数据中心建设的指导意见》中规定,到2022年,数据中心平均能耗基本达到国际先进水平,新建大型、超大型数据中心的PUE降至1.4以下。2022年8月,《信息通信行业绿色低碳发展行动计划(2022-2025年)》提出,到2025年,全国新建大型、超大型数据中心PUE降到1.3以下。
“东数西算”工程,也对数据中心的建设标准提出要求,更强调低碳节能。据21世纪经济报道梳理,“东数西算”工程要求张家口、韶关、长三角、芜湖、天府、重庆数据中心集群的PUE在1.25以下,和林格尔、贵安、中卫、庆阳数据中心集群的PUE在1.2以下。
自2020年数据中心被纳入“新基建”以来,各地涌起数字化相关产业发展浪潮。但出于对能耗问题的考虑,近年来,在部分电力资源成本较高、能源指标紧张的城市,当地政府基于碳排放指标考核,陆续发布了对数据中心的节能要求,限制数据中心建设。如北京在《北京市新增产业的禁止和限制目录(2018年版)》中曾提出,禁止新建和扩建PUE在1.4以上的数据中心。
“涉及到能源指标,现在要在北上广深等地建数据中心,已经非常困难。”李易告诉市界。在部分西部、北部地区,由于电力资源丰富,且气温较低、能效更好,并有政策优惠的地区,数据中心的建设和运营成本可大为降低。
而算力“向西”,也仍然存在挑战。
李易提到,可再生能源在供给上还存在一定的困难和问题,且比想象中复杂,绿色能源要实现还有一定距离。互联网企业生态主要集中在东部,李易建议,对时延性要求比较高的业务最好还留在东部进行计算,在算力设施和需求之间的布局上做好调配。
而要真正解决数据中心低效问题,建设绿色数据中心并不是个短期能够实现的问题,而是需要新基建的投资规划中,整体建设理念的提高。“现在很多理论、很多标准怎么实现‘从理想照进现实’,需要我们真抓实干,让真正懂得市场的企业主体,能够参与到决策制定当中去,以此更好地去推进数字经济的绿色发展。”李易表示。
此外,作为用电大户,数据中心与碳交易市场之间的关系也得到了行业关注。李易和陈沙克也均提到,碳排放权交易市场扩展,引入市场化的机制,也将对数据中心绿色化、能源得到更有效利用带来积极作用。
自2011年10月以来,国内已在北京、天津、上海、重庆、湖北、广东、深圳7地开展了碳排放权交易地方试点工作。2022年7月,全国碳排放权交易市场正式上线交易,不过当前还仅针对发电行业。
“目前,中国有规模的发电厂全部都纳入到了全国配额的碳排放交易市场,很快钢铁、水泥、化工等8大行业,也即中国85%的温室气体排放迟早也将被纳入进去,只是时间问题。”李易说。
(图源/视觉中国)
对于期望降低PUE值的数据中心来说,也期待新的技术和方案的支持。有研究表明,在数据中心中,耗能部分主要有服务器、存储、网络通信设备等IT设备系统,以及空调制冷、电源等设备等。在这些环节上降低功耗,也能降低PUE值。
陈沙克介绍称,在IT设备降低能耗上,也有很多事情可做。“比如空调的温度调高一度,都能大幅降低碳排放;另外包括企业使用机械硬盘比较耗电和污染,如果技术上采用全闪的架构,也能带来很多绿色。”
再比如,和风冷相比,液冷技术在散热需求较高的数据中心里具有优势,但是目前它仍然有待深化研究,在规模化商用上还具有成本的限制。陈沙克也建议,数据中心绿色化过程中,在技术和解决方案选择上,仍旧要以考虑成本投入为主。
在应用的案例中,中国电子信创云顺义基地是中国电子云的重要基础设施,其建设级别为“国标A级”增强级。“我们从各方面去降低PUE值,主要围绕着如何更加高效运行,让它使用更多的绿色能源。”此外,其也注重数据中心服务器的实际利用率,“一旦遇到设备的闲置,我们也会把机器关闭。利用类似这样的技术,我们将PUE值降到了1.3。”陈沙克说。
云计算走向下半场
数据中心的建设、运维、服务等不同阶段,涉及到了多种的服务需求。对于云服务商们来说,为企业提供更多的创新解决方案,成为未来竞争的重点。
超融合基础架构(HCI)是指一台服务器承担计算、网络、存储和虚拟化等所有功能,而多套单元设备通过网络聚合起来,可以实现模块化的无缝横向扩展,形成统一的资源池。近年来,中国电子云也聚焦超融合产品。
据陈沙克介绍,超融合是把计算存储和网络安全融合在一起,这是提高利用率,也是符合绿色数据中心最理想的一种方式。“以前,大家对超融合定义的是虚拟化、私有云,随着技术发展,超融合和私有云的边界变得非常模糊。从2003年开始,政务的采购75%都是超融合。”而对于客户最关心的安全问题上,中国电子云选择了云原生分布式架构,“把安全设备做成云原生的方式去部署,这样做的好处就是,当平台流量只有一个虚拟机的时候,不用占用太多的安全资源,客户想要保护的资源的数量可进行弹性伸缩。”
陈沙克提到,据IDC预测,2021年超融合市场规模是18亿美元左右,而到了2026年将超过36亿美元。
在数字经济的大旗下,作为数字基础设施的数据中心,其能耗与碳排也开始走上了趋优的道路。总体来看,随着中国数字经济体量不断扩大,云计算已经成为支撑数字经济发展的基石,云服务商必然会加大对于数据中心清洁能源的使用和制冷技术的创新等方面的布局,推动绿色数据中心的建设。云计算的下半场,也值得期待。
(图源/视觉中国)
直播对话Q&A节选:
Q:人工智能平台对数据处理的需求是巨大的。尤其是,ChatGPT本质是OpenAI自主研发的GPT-3.5语言大模型。据说,1万枚英伟达A100芯片是做好AI大模型的算力门槛。请问是有这个说法吗?训练ChatGPT这样一个包含1750亿参数的大模型,需要上万个 CPU/GPU 24 小时不间断输入数据,它的耗电量和碳排放大约能达到多少?
陈沙克:这应该是一个误传。Open AI没有正式公布过它的训练过程,外界只能推算,英伟达的说法是大概用了1000张A100 GPU芯片、用时一个月的时间完全训练。如果按照这个计算,约消耗130万度电,碳排放约520吨。可能大家对这个数字没有概念,我们换个说法,目前每人每年约产生5吨碳排放,换算下来就是,训练ChatGPT一个月,相当于100多人一年的碳排放量。
Q:业内也有很多人士认为,像微软、谷歌、百度等建设的大模型,很可能需要计算能力的大幅提升,所产生的后果将是科技公司所需能源和碳排放量的大幅增加。这对绿色数据中心建设,是一个新的机遇吗?
陈沙克:对于巨头来讲,经济压力肯定是有的,但对能源的碳减排应该影响不大,因为AI竞赛基本上就是装备竞赛,从量化标准的角度来讲,它的碳排放量并没有想象中大。严格意义上,碳排放是指影响了大气层的二氧化碳的排放量,并不是说我们烧一吨煤的碳排放的量。根据我们前面的计算,训练ChatGPT一个月,相当于100多人一年的碳排放量,这跟别的工业比起来不算特别多。
Q:无论是双碳,还是在现在我们的数字经济的需求之下,全社会都在关注降碳增效,建设数据中心是不是一个很有力的抓手?出于节能目的,部分地方对数据中心建设进行收紧,这和推动数字经济之间是否存在矛盾?
李易:事物之间都存在矛盾。汽车革命开始以来,一方面每个人都希望家里有一辆车,这是对美好生活的向往。但是路上车越来越多之后,首先对大气造成污染的各种排放物就会增多,其次会造成交通拥堵。怎么解决这些问题?北京会限号,上海会限制燃油车的上牌。
现在温室气体排放的问题或者说气候变化问题,是典型的市场失灵问题,用经济手段实际上不太能够找到解决方法,所以联合国才会有各种各样的措施,从1992年的应对气候的框架到京都议定书到现在巴黎协定等等。
发展数字经济遇到的矛盾包括数据从哪产生、产生之后如何运算、分析、处理、传输、交互等。无论是从存储的角度,还是从运算的角度,都需要消耗大量的数据中心。
虽然现在全球对数据中心耗电和温室气体排放并没有进行精准的监测,但是我可以大概说一个数据,10年前,数据中心在美国消耗的用能是整个社会用的10%,中国约不到3%。随着我们数字经济的蓬勃发展,这个比例一定很快就会和10年前美国的10%水平看齐。
现在的数据中心大量的耗电,存在能源结构的原因。比如上海,上海本身自身的清洁能源,坦白讲并不能够支撑整个上海的用电量,所以在上海的数据中心或者在北京的数据中心用的是所谓非绿色电比如煤电。消耗煤电自然就会产生温室气体。
所以我们新的国家战略,也就是东数西算工程,就是将发达地区的数据运算挪到西部地区,那里风光水都很多,绿电很多,在那里算完之后将结果反馈给发达地区,再加上南水北调等手段,以解决现在数字经济发展同时所产生的能耗问题和矛盾。
Q:自数据中心被纳入新基建以来,各地对建数据中心的态度如何?
李易:大概在5年前,北上广深的数据中心指标就非常难拿到了。今天如果企业是到内蒙、新疆建一个数据中心,当地政府会热情欢迎你,还有补贴措施。但与此同时,想在北上广深建数据中心就非常困难了,因为涉及到能耗指标。
Q:对于现在的数据中心能耗标准,国家的政策要求是什么样的?
李易:电能利用率(PUE),也即数据中心总耗电量与数据中心IT设备耗电量的比值,等于1.5。这是衡量数据中心总体能耗水平的指标。但可再生能源在供给上存在困难和问题,且比想象中复杂。绿色能源离我们想象中的实现存在一段距离。
Q:东数西算工程正式全面启动,要求新建数据中心PUE值必须低于1.3,并且PUE值超过1.5的老旧数据中心需要逐步完成节能改造。这又该如何改造?
李易:做好针对每台设备的耗电量化。
我觉得现在很多理论很多标准都是很好的,但是怎么把它从理想照进现实,需要我们真抓实干,让真正的懂得市场主体,能够参与到决策或者说决策的制定当中去,以此更好的去推进数字经济的绿色发展。
Q:数据中心产业链如何避免浪费资源或重复建设的问题?
李易:国家数据局的批复成立,我认为对中国未来的围绕数据的数字经济良性发展,会起到很大的积极作用。
Q:在数据中心IT设备和基础设施上,有哪些解决方案?
陈沙克:有很多能做的事情。比如空调的温度调高一度,都能大幅降低的碳排放。另外包括企业使用机械硬盘比较耗电和污染,如果技术上采用全闪的架构,也能带来很多绿色。
Q:中国电子信创云顺义基地作为中国电子云的重要基础设施,采用了哪些绿色节能手段,实现了什么样的PUE值?
陈沙克:它是我们自主运营的数据中心,我们从各方面去降低PUE值,主要围绕着如何更加高效的运行,让它使用更多的绿色能源。一旦遇到设备的闲置,我们也会把机器关闭,利用类似这样的技术,我们将PUE值降到了1.3。
Q:建设安全、高效、绿色的新型数据中心的需求,是否也给超融合带来了机会?
陈沙克:超融合是把计算存储和网络安全融合在一起。这样的话,它的利用率最高,也是符合绿色数据中心最理想的一种方式。
Q:超融合早已存在,其中也有了大型厂商,比如VMvare、华三、深信服等。而在近几年,在数据中心和基础设施领域,超融合又再次被多家厂商提出,这里的原因何在?
陈沙克:以前,大家对超融合定义的是虚拟化、私有云,随着技术发展,超融合和私有云的边界变得非常模糊。从2003年开始,政务的采购75%都是超融合。
Q:目前电子云推出了超融合产品,其独特之处是什么?
陈沙克:比如说,当大家把计算网络合在一起后,最关心的是安全问题。客户买完云平台后,需要过等保三级,需要专门的安全设备来对接。我们通过云原生的技术,把安全设备以云原生的方式去部署,这样做的好处就是,当平台流量只有一个虚拟机的时候,不用占用太多的安全资源,客户想要保护的资源的数量可进行弹性伸缩。
IDC对中国的超融合市场规模做过预测,2021年是18亿美元,到2026年可达到36亿美元。
Q:双碳大目标下,绿色新基建对节能减排提出更高要求,数据中心的绿色化转型趋势明显,但是整体上,还有哪些问题是亟待解决,或者需要沿着什么路径去解决比较好?
李易:数字经济发展到现在,各地政府围绕着乡村振兴、碳达峰碳中和,都在做很多探索。想要获得可持续发展,顺应世界的发展潮流,肯定要有所承诺有所贡献。
我们今天讨论数字经济也好,数据中心也好,既然国家、主管部门都有相关政策,我觉得我们的业界就要团结起来。反过来,企业也可以在其中寻找新的商业机会,顺应合规要求,迅速推出适应市场,满足市场的产品。
目前,中国有规模的发电厂全部都纳入到了全国配额的碳排放交易市场,很快钢铁、水泥、化工等8大行业,也即中国85%的温室气体排放也迟早将被纳入进去,只是时间问题。
Q:纳入的前提,是否需要形成统一的碳排放衡量标准?
李易:标准其实非常简单,比如说现在除了全国的统一大市场之外,各地都有对地方的实体经济温室气体排放的管控要求。归根结底就是一条路,逼企业往节能、清洁能源的方向去走,形成技术转型。
Q:对于绿色数据中心市场的变化,以及对企业将来如何建设自己的绿色数据中心,两位嘉宾有什么建议?
陈沙克:我觉得碳交易在政策上面应该强力推行,市场化推广是一个很好的思路。
李易:我想从学者或者第三方的角度讲讲。首先,政策制定者起着决定性作用。一些优秀创业者其实有很多围绕数字经济往绿色发展的动作,但政策压力传导不够,导致企业成长不起来。第二,我觉得东数西算还是要引入市场主体,避免造成资源的浪费。
最后一点我想说,市场确实很大,初期也存在混乱的状态,但对于未来,我坚定看好,数字经济一定能成为很好、很优良的资产。
作者丨陈畅
编辑丨杨洁