近日,IDC与浪潮信息联合发布《2022-2023 中国人工智能计算力发展评估报告》(以下简称《报告》)。报告指出,中国人工智能计算力(以下简称智能算力)继续保持快速增长,2022年智能算力规模达到268百亿亿次/秒(EFLOPS),超过通用算力规模。预计未来5年中国智能算力规模的年复合增长率将达52.3%,是同期通用算力增速的3倍。那么这种趋势的背后隐藏了什么?
由表及里:中国人工智能城市排行榜,智能算力成破题点
众所周知,随着新一轮科技革命和产业革命的浪潮席卷而来,特别是人工智能、大数据、5G等新一代信息技术的应用,人类进入数字经济时代。与此同时,伴随数字经济时代的到来,以AI应用为特征的智慧城市的建设也是如火如荼。
究其原因,德勤在其《AI来临:重构城市DNA》的报告中认为,AI是一个“城市赋能器”,将从经济发展及城市功能等多方面深度重构城市的DNA。从城市发展趋势来看,人工智能将成为关键破题点。作为影响面极为广泛的颠覆性技术,人工智能已快速渗透到城市发展和人们生活的方方面面。对于城市而言,人工智能不仅将成为城市经济发展的新引擎,同时也是城市建设的新机遇。
为此,《报告》针对不同城市在人工智能投资规模、相关政策支持力度、政策落地情况和实施进展、人工智能技术成熟度,以及劳动供给等维度对中国城市人工智能发展进行综合评估,给出了2022年中国人工智能城市排行榜。
除了上述因素外,当我们结合《报告》中2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS的事实,作为人工智能基础设施的智能算力才是破题点。
此外,从增长率看,《报告》预计2021—2026年期间,中国智能算力规模年复合增长率为52.3%,相比之下,同期通用算力规模的年复合增长率仅为18.5%也可以看出,智能算力不仅是现在,更是未来中国人工智能城市能否可持续发展的关键。
俗话说:“一花独放不是春,百花齐放春满园”。如果说,《报告》中的2022年中国人工智能城市排行榜只是中国人工智能城市,甚至某种程度上是中国人工智能发展的代表或者缩影的话,那么如何将作为破题点的智能算力下沉,加速人工智能的普惠化,才是当下和未来中国人工智能发展的核心。
对此,《报告》指出,除了TOP10城市之外,武汉、长沙等多个城市在自身产业优势及各种因素推动下,人工智能应用也取得了较大进展。此外,一些城市深耕特定的人工智能应用并取得了明显成果,成为城市智能化新标签,如安徽宿州淮海智算中心、浙江青田元宇宙智算中心陆续投建等。
以青田元宇宙智算中心为例,其坐落于浙江省东南部的青田县,是国内首个元宇宙智算中心,同时也是首个算力、算法、开发平台一体化的新型元宇宙基础设施,通过协同创建、高精仿真、实时渲染、智能交互四大作业环节,将为多产业的元宇宙场景提供算力的技术支撑,在实体数字化方面逐步突破多维度和多场景的屏障。
此外,青田元宇宙智算中心以建立国家级产业标杆为目标,汇集1000+生态开发者资源,引导十万级AI、元宇宙产业精英和科技人才汇集,共同实现元宇宙与边缘计算战略落地,同时开展5G应用创新研究,在娱乐、工业等领域打造相关行业标准。
大势所趋:智能算力成算力主角,普惠化仍存挑战
如上述,尽管《报告》中的2022年中国人工智能城市排行榜证明了中国人工智能产业的快速发展以及智能算力作为破题点的重要性,但在业内看来,人工智能要想做到真正的普惠化仍面临挑战,最典型的表现就是智能算力和算法。
众所周知,自2012年后,驱动AI的底层机器学习技术计算量呈指数级增长,远超摩尔定律带来的算力提升速度,对以CPU为主的通用(基础)算力提出严峻考验,而众所周知的事实是,目前CPU的物理工艺、核心数已接近极限,但数据量的增长却不会停止,导致算力必须要不断提升的矛盾日益突出。
因此,在AI时代下,仅由CPU作算力的提供者已经不能满足需求,向包括GPU、GPU、FPGA、ASIC等加速芯片异构而成的智能算力的演化成为趋势,并最终成为数字经济时代下算力的主角。
而事实是,多元算力从“能用”到“好用”并且为企业创造业务价值,还有比较长的路要走,尤其是以百花齐放的AI算力芯片为核心,打造出一个通用性强、绿色高效、安全可靠的计算系统,对于推动人工智能技术普及应用至关重要。
《报告》认为,一般来讲,从芯片到计算系统,需要完成体系结构、信号完整性、散热、可靠性等大量系统性设计工作,涉及到材料、 热力学、电池技术、流体力学、化学等众多学科。由于人工智能基础架构往往是高密度集成的大算力系统,系统功耗、总线速率、电流密度等指标随业务需求持续攀升,给人工智能计算系统设计带来严峻挑战。
除了上述因芯片多元化而带来的人工智能计算系统设计挑战外,《报告》对于大模型的行业落地和发展情况也进行了分析,认为大模型是智能算力驱动下典型的重大创新,被认为是“通用智能”的雏形,是业内探索实现普惠人工智能的重要途径之一。
例如2022年,大模型正在成为AIGC领域发展的算法引擎。在大模型的能力加持下,包括以文生图以及虚拟数字人等AIGC类应用将快速进入到商业化阶段,并为元宇宙内容生产带来巨大的变革。大模型正在让人工智能技术从五年前的“能听会看”,走到今天的“能思考、会创作”,未来有望实现“会推理、能决策”的重大进步。
但随之而来的是,这些大模型训练的计算和存储资源开销之大,对加速计算系统和人工智能软件栈都有很高的要求,训练千亿、万亿模型动辄需要上千块加速卡,对大模型的推广和普惠带来了很大的挑战。同时,受限于边际递减效应,模型复杂度与精度的进一步提升将会需要更大比例的计算资源开销,对计算效率问题的顾虑会限制大模型参数规模的持续扩张。
此外,根据《报告》显示,虽然人工智能应用正在稳步发展,大部分受访者表示他们已经将人工智能应用在业务中,但一些应用仍处在实验、评估和测试阶段,只有三分之一企业声称已达到成熟阶段。究其原因,《报告》认为,为人工智能专门构建的IT基础设施的缺乏往往是人工智能应用无法进一步深入的原因。
化解挑战:技术创新与智能算力、算法基建化并行
所谓挑战之下必有机遇,对于上述挑战,业内和部分企业已经在利用自己的洞见和创新正在或者已经化解,从而将挑战转变为新的机遇。
例如针对前述多元算力的挑战,图灵奖获得者John Hennessy和David Patterson2019年共同发表的《计算机架构的新黄金时代》中提出:当摩尔定律不再适用,一种更以硬件为中心的针对特定问题领域定制设计计算机体系架构的方法DSA(Domain-Specific Architectures)会成为主导,这种设计的核心在于针对特定问题或特定领域来定义计算架构。
无独有偶,《报告》认为,基于DSA(Domain-Specific Architectures)思想设计的人工智能芯片,在特定人工智能工作负载上表现出远超通用芯片的处理能力,大大推动了人工智能芯片的多元化发展,并为产业AI化的加速提供了重要的产业基础和更加丰富的选择。
具体到如何落地,与单纯的芯片厂商相比,系统厂商由于长期位居服务市场和客户的最前沿(离市场和用户最近),最知晓他们的痛点和需求,所以在我们看来,有且只有系统厂商,依靠其系统级的创新能力,有的放矢,真正化解挑战,最终释放出智能算力的最大价值,高效率地输出智能算力,满足市场和用户实际的应用场景及业务需求。而《报告》也印证了我们的观点。
以系统层面的架构创新为例,《报告》称,在基础硬件、基础软件、核心应用、上层生态间建立起统一的技术路线及标准API接口,将加速器模块标准化,简化人工智能基础架构设计,缩短硬件开发和产业赋能周期,而浪潮信息开放加速人工智能服务器NF5498,支持 UBB v1.0 OAM基板,OAM兼容性高、扩展性好,支持多品牌异构加速芯片,已经在众多客户场景里面实现了落地,有效支撑国内外多元算力芯片的发展。
而在应对大模型挑战方面,《报告》认为,在产业实际落地阶段,不再追求模型参数和算力的堆砌。业内通过知识蒸馏、模型裁剪、模型压缩等技术,基于通用大模型生成具备该行业或场景所需特定技能的专业模型,在保留通用大模型的知识、认知推理能力及泛化能力基础上,实现了针对该领域的技能专业化、模型轻载化和调用标准化。例如浪潮信息发布的四个技能模型——知识增强的对话模型、知识检索问答模型、中英文翻译模型、古文理解模型,在继承“源1.0”大模型通用的知识与能力基础上,面向特定领域的场景进行针对性的技能优化,模型精度和训练效率均处于业界领先:在十分之一参数量的情况下,即可在相同任务上复现98%的通用大模型效果,推理速度最高提升9倍。
至于为人工智能专门构建的IT基础设施的缺乏,《报告》认为,智能算力对于提升国家、区域经济核心竞争力的重要作用已经成为业界共识。而随着“东数西算”工程的启动以及智算中心的建设,应从国家层面实现有效的资源结构整合,助力产业结构调整,构建更为健全的算力、算法基础设施,即智能算力与算法的基建化。
中国速度:引领全球智能算力和应用发展,未来更可期
看现在和未来,人工智能支出已经成为支持企业数字化转型支出的主力之一。
《报告》预测,全球范围内,企业在包括软件、硬件和服务在内的人工智能 (AI) 市场的技术投资从2019年的612亿美元增长至2021年的924亿美元,预计将在2022年(同比)增长26.6%至1,170亿美元,并有望到2025年突破2000亿美元,增幅高于企业数字化转型(DX)支出整体增幅。在这一过程中,人工智能服务器仍是人工智能市场增长的主力军。
IDC数据显示,2021年全球人工智能服务器市场的同比增速超过全球整体人工智能市场的增速,是整体人工智能市场增长的推动力。而未来五年,人工智能服务器市场将继续高速增长,预计2026年全球人工智能服务器市场规模将达到347.1亿美元,五年复合增长率为17.3%。
具体到中国,人工智能应用的加速落地很大程度推动了中国人工智能服务器的高增长。根据IDC数据,2021年中国人工智能服务市场规模达到59.2亿美元,与2020年相比增长68.2%,其中,浪潮信息、新华三、宁畅、安擎等诸多中国厂商正加速推动人工智能基础设施产品的优化更新,探索赋能技术升级,为人工智能技术的用户带来价值。
而提及人工智能应用的加速落地,《报告》指出,从行业维度看,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。与2021年相比,行业AI渗透度明显提升。其中,互联网行业依然是人工智能应用渗透度和投资最高的行业;金融行业的人工智能渗透度从2021年的55提升到62,智能客服、实体机器人、智慧网点、云上网点等成为人工智能在金融行业的应用典型;电信行业的人工智能渗透度从2021年的45增长到51,人工智能技术融入电信网络的构建、优化,并为下一代智慧网络建设提供支撑;制造行业的人工智能渗透度从40增长到45,预计到2023年年底,中国50%的制造业供应链环节将采用人工智能。
从场景应用维度看,智能化场景在行业的落地随着时间的推移,正呈现出更加深入、更加广泛的趋势。人工智能持续为提升用户体验做出贡献,当前诸如智能客服、智能推荐、精准营销等场景深入落地到各行业;人工智能也在精准科学防疫,加强公共卫生安全体系建设中承担重要角色,在病毒演变预测、疫苗药物研发、辅助诊断等维度实现广泛应用;长期来看,企业通过在数字人等数字化营销内容创作领域布局,创造差异化的营销体验,升级品牌形象;另外,科学家们越来越多地利用人工智能技术和方法,从数据中建立模型,重点围绕新药创制、基因研究、新材料研发等领域加速对前沿科学问题的探究。
更让我们感到可喜的是,IDC调研显示,超过80%的中国企业将在未来一年持续增加人工智能服务器的投资规模,中国人工智能服务器市场将在未来五年保持稳定增长,预计到2026年,中国人工智能服务器市场规模将达到123.4 亿美元。而这种以人工智能服务器为代表的智能算力的增长势必会从行业和应用场景等方面加速和扩大人工智能应用的落地,未来更可期。
写在最后:智能算力可以从数据中发现创新点,有效缩短人类创新和发现的时间、人力和成本消耗,从而让企业、政府、科研机构找到新方法、新路径,实现转型升级和创新已经成为业内的共识。
看未来,《报告》指出,人工智能应用正在从单点技术到多种技术能力融合方向发展、从事后分析向事前预判和主动执行方向发展、从计算智能和感知智能向认知智能和决策智能方向发展,创新应用场景逐步增多。未来五年,随着人机交互、机器学习、计算机视觉、语音识别技术的成熟,人工智能将在企业市场中加快应用与落地,智能算力将成为未来创新的核心推动力。而正在发生的事实也证明了这个结论。
这里我们以智算在人类生命健康的蛋白质结构解析为例来说明为何智能算力就是创新力。
传统蛋白质结构的解析一般依赖冷冻电镜、核磁共振、X射线衍射三种方式,确定一个蛋白质结构需要几个月甚至是几年。过去半个多世纪,人类一共解析了五万多个人源蛋白质的结构,仅是人类蛋白质组里大约17%的氨基酸结构信息。而基于深层神经网络的AlphaFold实现了原子精度的蛋白质结构预测计算方法,在一年的时间内,它将预测的结构信息比例从17%大幅提高到58%,是一个典型的量变引起的质变。可以说,AI在破解生命的蛋白密码方面,已经具备了相当的创见能力。
由此可以看出,智能算力为国家创造力的发展带来实质性推进,不仅在应用科学的突破上发挥了重要作用,也开始渗透到基础科学领域,极大提高了科学研究的效率并加速科学发展的进程。
而具体到行业和企业,智能算力可为企业带来切实的创新成效。根据IDC预测,2022年,全球企业将在人工智能解决方案上投资1,180亿美元。2021至2026年间,预计该支出将以26.5%的复合年增长率增长至3010亿美元,是同期全球IT总支出五年复合年增长率6.3%的四倍多。而根据IDC针对企业应用人工智能现状调研发现,目前企业利用人工智能应用在三方面获得了显著收益,分别是研发速度和流程的创新,产品和服务的创新,以及商业模式的创新,这些创新给企业带来了深远的影响,不管是超大规模企业还是中小企业,都在寻找适合自己的人工智能应用方式,并从中受益。
智能算力就是创新力,一切还只是开始!