图片来源@视觉中国
生成式AI为产业带来了机会和挑战,随着摩尔定律的持续放缓,算力已经远远跟不上数据的激增和算法的突破。
11月29日,浪潮信息联合IDC共同发布《2023-2024年中国人工智能计算力发展评估报告》。报告对人工智能(AI)产业、算力及应用进行了整体阐述和分析,从地域和行业维度对中国AI计算力发展进行评估,并对行业用户和技术供应商给出可行性行动建议。
IDC中国副总裁周震刚与钛媒体等交流中指出,“从算力角度,中国相较于美国整体上还是会有一些差距。中国厂商在系统级方面的能力并不弱,如芯片集成方面,通过堆卡堆片,让系统发挥更大更有效的计算,同时进行能耗方面的控制,不一定需要付出特别大的代价。”
“服务商需要尽快构建核心竞争力,构建开放、多元的算力平台生态,以系统化方法应对智算需求。一是提供智算的基础架构,帮助客户提供智算加速,目前绝大部分的云厂商都有这个能力,但它们更多是在集中大量资源去训练自己的模型,释放出来的资源并不多,反倒是有些拿到了算力却没有自己做模型的企业会释放额外算力。其次是模型即服务,模型开源或以付费形式,提供给行业或企业客户进行模型微调。此外还有面向生态伙伴ISV,开放模型API,或者直接基于模型开发出的SaaS应用,提供给客户使用。”周震刚告诉钛媒体。
报告首先指出,在中国,芯片市场机遇与挑战并存。算力需求的提升给本土芯片厂商的发展提供了较大的空间,带来新的机遇。IDC预计,2023年中国AI芯片出货量将达到133.5万片,同比增长22.5%。
但中国芯片产业发展也面临着一些挑战,其中以技术突破、人才培养、知识产权保护等是方面的问题尤为突出。以封装技术为例,3D封装等技术的出现意味着高端芯片赛道上的竞争无须再仅围绕摩尔定律下的晶体管工艺能力展开,而是可以从新的角度切入,达成电路密度提升的目标,进而实现性能的升级,封装工艺突破正在成为中国芯片制造的新课题。
报告还指出,本土AI芯片仍需在发展、继承和竞争中成长。芯片产业发展不仅依赖硬件能力,还需要构建与硬件匹配的软件生态,包括操作系统、中间件和工具链等,当下诸多本土芯片技术储备和生态能力仍围绕小模型时代的识别式AI展开,难以匹配大模型和生成式AI发展所需的软件生态、模型框架、性能需求。
而在服务器方面,由于大模型对计算能力和数据的高需求,其所需要的服务器设施将在AI基础设施市场中占据越来越大的份额。IDC预计,全球AI硬件市场(服务器),将从2022年的195亿美元增长到2026年的347亿美元,五年年复合增长率达17.3%;其中,用于运行生成式AI的服务器市场规模在整体AI服务器市场的占比将从2023年的11.9%增长至2026年的31.7%。IDC还预计,2023年中国AI服务器市场规模将达91亿美元,同比增长82.5%,2027年将达到134亿美元,五年年复合增长率为21.8%。
整体来看,面对单芯片性能受限等局面,中国市场对于算力供给能力的评估指标将从硬件性能向应用效果转变,企业在获得算力服务的过程中,会更加以应用为导向进行综合考量,增加对于诸如单位时间可处理Token数量、可靠性、时延、训练时间和资金成本、数据集质量等指标的关注。
针对这一转变,报告建议,算力服务商需要“以应用为导向、系统为核心”,构建算力基础设施,提高算力利用率,提升诸如卡间互联、多节点间互联等水平,通过灵活可扩展的集群满足市场的需求。
同时,鉴于大模型训练,需要消耗大量计算资源,而且对算力的速度、精度、性能也提出更高要求,大模型的本地训练成本不菲,企业将更多地使用AI就绪的数据中心设施和AI服务器集群。未来算力服务需要能够提供定制化的、优化的基础设施服务能力,满足单个用户对训练和推理资源的独占式、大规模、长时间使用的诉求,从而缩短部署时间,帮助企业实现成本的控制。
中国AI产业“形象”
在此背景下,中国AI产业实践和应用投入具备自身的特征趋势。
地域性方面,可以看到,北京、杭州、上海、深圳、广州、合肥、苏州、重庆等城市在AI领域具有较为突出的表现。其中,北京,拥有大量的人才和成熟的企业,同时政策扶持也非常有力,一直稳居AI算力发展城市排名前列,上海、深圳、杭州等城市不断加速技术积累,拓展应用场景,构建具有特色的AI发展路线。目前,北京在大模型领域表现突出,聚集了大批大模型企业,推出诸多具有代表性的大模型及应用产品。
报告指出,排名靠前的城市因具有更好的政策、资金和技术支持,稳定吸引更多的人才和企业聚集,形成更强的AI产业集群,排名相对靠后的城市保持着对AI产业的热忱,挖掘具有地方特色的发展路径。另外,智算中心的建设是拉动地区实现AI发展的重要驱动力,如南京、天津、西安等城市对智算中心的建设也已走到前列。
行业性方面,互联网、电信、政府、金融、制造行业对AI的探索和应用在过去五年一直处于高位。其中,在电信行业,运营商加速云数据中心建设,积极部署云上智能化能力,同时也在加速基础设施的智能化建设,支持电信网络的建设和优化。
从企业和行业应用价值角度,IDC调研显示,企业在未来三年由AI所产生的价值将大幅提升,尤其在提高资产利用率、降低人力成本、提升洞察力、提升决策速度和优化用户体验等。
结合IDC最新调研数据,在企业对AI的单点技术应用方面,计算机视觉仍为最主要的应用技术类型,以生物识别和图像技术为主,语音技术应用程度紧随其后,自然语言处理仍处在相对早期的发展阶段。同时,调研还发现,自然语言处理对企业IT资源占用最大,未来随着这一应用普及度的提高,该特征将更为显著。除此之外,图像技术、知识图谱和AR/VR是参与调研样本企业中另外三个高算力消耗的单点技术。
《2023-2024年中国人工智能计算力发展评估报告》
生成式AI的转折一年
2023年,生成式AI应用的行业落地正快速发展。并且由于它对实际应用注入了增强功能,也得到商业领域的广泛关注。通过把大模型能力和应用需求结合,结合场景或业务数据,可加速生成式AI向行业领域的渗透。IDC认为,知识管理、对话式应用、销售和营销、代码生成等是企业应用生成式AI的主要领域。
例如,通过将一个模型(或多个模型)与企业数据集成,可供特定业务部门或职能部门(营销、销售、采购等)使用,满足职能场景的业务需求;通过具体工作任务设计,如生成文案、图片、视频等内容,加速软件开发,可将生成式AI功能注入现有应用,提高生产力;基于足够大的训练数据集或与行业生态伙伴合作,共享数据,围绕具体模型,以定制化方式构建特定集成架构,满足行业需求。
报告指出,相较于其他行业,金融和制造业对生成式AI的投入和使用阶段更靠前。
在金融行业,IDC全球一项调研结果显示,样本中超过半数的金融机构计划在2023年在生成式AI技术上进行投入,只有10%的金融机构表示,他们目前没有试验计划,或者目前没有使用生成式AI的计划。在金融行业脱颖而出并最容易实现的用例多数围绕用户体验、知识管理和应用开发,如智能投顾、自动化客服(如聊天机器人和语音机器人)、风险评估、报告自动化生成、代码生成应用等。
生成式AI在金融行业有着巨大的前景,但金融作为监管最为严格的行业之一,对数据安全和隐私有极高的要求,本次参与调研的金融机构表示,对数据安全和隐私的顾虑是他们采用生成式AI时的最大阻碍,如何解决这一问题,对未来技术的应用发展至关重要。
在制造业,尽管生成式AI处于应用早期,但由于其能够为客户生成个性化内容和营销体验,在改善客户体验方面具有巨大潜力。目前主要用例涉及潜在客户开发、生产流程优化、产品设计辅助、设备预测性维护、供应链管理等。在制造行业应用过程中,生成式AI需要解决的关键挑战包括:数据的可用性和质量,客户对销售人员参与度的期望,以及数据和隐私法的要求。
此外,在医疗(临床文档和数据管理、患者服务、工作流程和资源优化、员工支持、医疗保健)、能源(能源消费趋势预测、能源存储和分发、环境监测)、零售(库存管理和预测、个性化推荐、客户行为)、教育(语言学习、教学辅助、学习评估)等领域,生成式AI与大模型也在实现推进。
最后,报告建议行业用户应及早从生成式AI潮流中受益,如何实现这一过程,需要根据自身条件进行:其中包括评估企业生成式AI的基础准备情况,根据业务转型需求、技术能力以及预算等调整AI投资组合,对技术栈各层的能力评估,数据准备工作等。
(本文首发钛媒体APP,作者 | 杨丽)