近日,工业和信息化部等六部门联合印发《算力基础设施高质量发展行动计划》,从计算力、运载力、存储力以及应用赋能4个方面提出了到2025年的发展量化指标。随着AI加速技术融合,算力需求持续爆发,企业纷纷扩大算力供给。有报告预测,2020年至2030年,人工智能驱动的算力将增长500倍,通用算力将增长10倍。算力已经成为智慧社会的重要基石。如何健全算力网、解决算力难、用好算力券、充分激活算力脑,成为当下数字时代产业经济发展的关键。
筑牢算力底座
走进位于京西智谷智能计算中心的北京昇腾创新人工智能科技中心机房,只见数十台机柜整齐排列,机柜内闪烁着蓝光,每台机柜里面都搭载着8台昇腾910服务器,每台服务器有8个人工智能加速芯片通过绿色网线实现直连。
“目前已有20多家企业利用这些服务器数据进行本地大模型孵化,每7天就可以孵化一个新的行业模型。”北京昇腾人工智能生态创新中心CTO杨光说,要实现超算与AI融合,必须筑牢算力基础底座。
“京西智谷是北京人工智能重点布局地区,计划对标千亿元规模的人工智能产值。未来将有更多的人工智能企业在这块‘沃土’上聚集。”北京中关村门头沟园管委会副主任谭李丽表示,这也是北京市落地的第一个面向中小企业的公共算力平台。
人工智能计算中心是算力经济的重要基石,除了在北京,百度、阿里、联想、科大讯飞等AI大模型算力集群还在杭州、成都等多地开花。
阿里云相关负责人表示,降本增效是各地计算中心当前的主要任务之一。他直言,当下,智能计算投入成本、技术门槛更高。一家公司在各环节投资规模合计可能高达数百亿元。阿里云通过体系化的核心技术自研,以飞天智算平台作为输出,可以将万卡并行有效算力扩大到90%。
联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽认为,AI算法模型的变革让算力需求呈现数百倍的增长。未来,联想100%算力基础设施产品将支持AI,50%基础设施的研发将投入在AI领域。
用好算力网络
在算力需求迅猛增长的背后,算力资源能源承载不足、部分AI算力资源稀缺带来的零部件价格高涨等问题,让“算力难、算力贵”的情况日益凸显。
与此同时,算力浪费现象广泛存在。目前,全国有近30个城市布局了智算中心,但部分低水平智算中心还存在盲目追求“理论”算力规模的情况,并形成了封闭割裂的区域算力市场。这些智算中心相对缺乏市场化运营机制,资源利用率不高,封闭架构往往无法兼容其他生态运行。部分中心CPU利用率较低,商业收入无法支撑运维成本,造成“数字烂尾楼”现象。
南京大学高性能计算中心主任盛乐标认为,解决算力资源浪费问题,筑牢底座、织就“一张网”至关重要。此外还需解决好调度、直连等问题。“近年来,由于大模型对GPU资源的依赖,导致GPU价格飞涨,这无疑增加了新的智能计算中心建设的成本和周期。”
当前人工智能算力产业成本普遍较高。北京昇腾人工智能生态创新中心COO李天哲举了个例子。在训练端,GPT3的单次训练成本约为500万美元,推理端单次生成信息文本的成本是当前主流搜索引擎的3倍至4倍,人工智能企业的搜索调用成本较高,大部分企业无法负担这样的成本。
李天哲认为,避免人工智能算力分散和浪费的主要方式,是统一建设具有公共性质的、能够提供普惠算力服务的人工智能计算中心,通过组建专业化的、具备工程化开发和调优经验的人工智能团队,合理利用人工智能计算中心资源以及算力资源,为人工智能企业提供开发服务。
当前,我国算力产业已初具规模,产业链企业集群效应明显,在一定程度上可以有效解决智算芯片缺失和算力能耗急剧增长的问题。“自建算力中心成本巨大,周期不可控,而成熟的算力中心可以根据需求灵活调整。”中科视语PMO徐超说。
“未来,多地计算中心将聚焦头部企业,增加国产训练集群,着力提升算力精度、降低平均能耗,联动京津冀、长三角、粤港澳大湾区、东西部算力资源,建设智能算网新生态。”谭李丽认为。
鼓励算力应用
要让算力如同水电一样随取随用,在构建泛在、惠普算力底座与体系的同时,还需激励参与主体切实发挥带动效应。
为解决算力成本问题,近日,北京、上海、杭州、苏州等地围绕算力产业及应用密集出台新一轮政策,纷纷发放算力券。
从杭州、成都等地公布的算力券细则来看,重点支持AI创新企业,支持中小企业购买算力服务,鼓励智算中心采用国产自主可控的软硬件。“算力券的发放能够帮助企业降低算力使用成本,是推动企业数字化转型的一项重要举措。”中国信息通信研究院云计算与大数据研究所所长何宝宏表示,更好发挥算力券的价值,应从以下方面开展工作,一是形成完备的算力券发放和管理制度,尤其是面向中小企业、未来产业等加大算力券的发放比重;二是鼓励算力供应企业加强产品研发,形成体系化的产品组合,丰富算力券使用范围;三是对算力券使用效果进行评价,全程跟踪企业算力券使用情况,对于使用效果好的企业进行鼓励,并形成示范案例进行推广。
企业是算力的提供者和最终使用者,算力券推动了供需双方的结合。李天哲认为,算力券应该重点面向两类企业群体:第一类是具备丰富技术储备和算法开发经验,但是无力承担高昂算力成本的初创企业和团队;第二类是在创新技术生态体系上做算法开发的企业,为他们提供优惠支持,让更多企业能够开发出自主可控的人工智能方案。
盛乐标建议,算力券要避免出现滥发、滥用、浪费等现象,平衡好算力供需关系,避免闲置浪费,提高使用效率和效果,重点支持对价格敏感的科技型中小企业、科研机构、高校等,并向承担或参与国家或地方重点项目、攻关项目的企业倾斜。另外,应对算力券的供给建立积分或返券制度,对取得重要突破或重要成果的企业,增加算力券的支持力度和支持周期,形成良性循环。同时,还需要简化企业领用算力券的流程,方便中小企业使用。
充分发挥算力券作用的关键,还在于如何有效激活算力脑。
“稳健技术底座上构建的算力脑,将催生更多创新应用。通过采用高效能、低功耗的芯片和优化算法方式追求算力规模的增长,将促进视觉遥感等创新技术规模化应用落地。”格灵深瞳副总经理周瑞认为。
在北方工业大学数字产业学院副院长徐继宁看来,要充分发挥算力平台的资源优势,加快政策细则实施,各方还需深化全方位的产教融合平台建设,搭建产学研合作的桥梁,从而推动创新应用更多、更快、更好地落地。(记者 贾丽)
来源:经济日报