作者:石亚琼
**
大模型为代表的生成式AI技术正如何影响中国的千行百业?
这从中兴通讯的业务数据中就可见一斑。其以服务器及存储、数据中心、汽车电子等为代表的第二曲线业务,服务了包括百度在内的客户,去年增速超过40%,也可以作为行业的风向标之一。
这家公司2019年-2022年营收的年复合增长率超过10%,归母净利润的年复合增长率超过16%。今年上半年,实现了超600亿营收、54.7亿净利润,且市值最高时一度超过2100亿元。
在这波生成式AI带动的小高潮之下,中兴通讯内部也在开展相关研发部署和工程实践,包括基础大模型和研发提效大模型、电信大模型、行业大模型等领域大模型,同时也在进一步加强智算基础设施、智算效率优化、大模型训推工具链等关键能力。
中兴将大量高质量的领域数据以及Know-How知识积累注入到大模型中,希望在多个场景中使用大模型替代辅助甚至替代人工,从而大幅降本增效。
其中,研发提效大模型已经在辅助开发人员进行需求分析、产品设计、编程、测试以及产品文档编写,提升研发效率;电信大模型,已在运营商网络智能运维和部分增值业务中应用;行业大模型,初步在城市治理行业试用,预计2023年底至2024年初实现商用;基础大模型2.0版本已经在迭代中,预计年内自用和商用领域大模型都将迁移到新版基础大模型上。
作为中兴的CDO(首席发展官),除了关注这波AI新技术的发展趋势和研发实践,崔丽也将大量的时间花在与客户、外部合作伙伴探讨沟通。今年上半年,崔丽走访了不少电信、政府、大企业、金融服务、媒体、供应链管理等重点领域的客户,崔丽发现在创意生成、客户关系管理、客户服务、文档生成、专家咨询等数字化应用场景,已经有了生成式AI和行业和企业数字化转型结合的初步应用。
崔丽认为,生成式AI已迎来奇点时刻,也将打开未来8-10年的新一轮技术和产业变革。相对电力带来的蓝领工作的解放,此次算力和智力带来的生成式AI,则可能充当基础“白领”或助理的角色,进一步大幅提升企业经营效率和社会的生产效率,甚至催生新型数字化创新业务模式。
作为数字基础设施的重要提供方,崔丽主张,即便对于大模型或生成式AI而言,“高效和绿色”依然是自始至终都需要关注的重点,具体到应用场景,适合的才是最好的。对于某些特定领域,要完成特定的任务,不一定非要使用万亿或千亿参数的基础大模型,除非希望它能在泛化和解决复杂问题方面发挥更大作用。与此同时,目前大模型仍处于发展的初级阶段,行业大模型应用需要综合考虑行业专业性、准确度、数据安全、系统部署等因素,仍存在着不少挑战。但不能忽略的是,跟任何一次重要的技术变革类似,这波AI大模型的浪潮也会加速企业的优胜劣汰。
在这个时间节点,36氪数字时氪也采访了中兴首席发展官崔丽,以下是本次采访的节选。
中兴通讯CDO崔丽
崔丽:
AIGC的本质,是作为数字经济下的新型生产工具,将算力这一生产力与数据要素相结合,充分释放数据要素价值。
在这一产业链上,主要包含了四类产业链主成员(数据基础设施与技术服务商、数据产品供给方、数据流通与交易方、数据产品应用方)+两类全程辅助成员(行业监管者与数据要素生态伙伴)。
对于中兴通讯来说,我们的客户由于所处的角色不同,需求及投入也有所差异。
(1)运营商、互联网头部厂商
对于运营商、互联网头部厂商,更多处于数据基础设商,以及数据产品供给方的角色,因此在代表着“硬实力”的智能算力和数据存储的基础设施建设上,有着更多的需求和投入。特别是由于智能算力的能耗较高,结合国家的东数西算战略,高效绿色智算中心的建设将成为重点需求之一,这里面就包含了AI智算服务器/存储、高性能数据中心交换机、液冷等技术和产品。
此外,对于运营商来说,由于还担负着建设数据枢纽之间的骨干网络的职责,需要满足枢纽间算力的精准、海量、低时延和安全的调度和传输需求,因此对于400G光网络、大容量核心路由器等算力网络基础设施也成为重点需求。
这些需求也反映到客户的投资预算中,比如中国三大运营商在算力方面的投资,23年相比22年就增长了30%以上。中国移动总经理董昕在3月份业绩说明会上就明确表示,中国移动预计将在2023年新增投产云服务器超过24万台、新增投产对外可用IDC机架超4万架。
(2)技术服务商
除基础设施外,技术服务商在搭建核心AI技术平台以及数据治理、场景应用等方面的“软实力”上的需求和投入预期也会持续增加,主要包括:
第一,自研大模型的投入力度。特别是面向行业的大模型平台,由于对准确性和安全性的更高要求,在高质量、多元化的行业训练数据获取和治理上,以及对训练、精调、推理等方面的关键算法和工程实践调优,将直接决定了大模型是否能在行业细分领域充分发挥价值。
第二,云边端融合成为重点。许多AI应用需云边端协同,因此云边端一体化投入成为重点,以实现AI应用的快速交付。
第三,应用创新。当前更聚焦以AI驱动业务创新的投入,如智能客服、辅助决策、自智网络、新业务孵化等。与垂直行业伙伴的深入合作,获得场景数据、快速孵化创新应用。l
第四,数据安全、隐私保护等方面的投入。
( 3 ) 政企行业客户
对于我们的政企行业客户,则主要作为数据产品应用方的角色,迫切希望技术服务商能将此次AIGC的技术发展做深做实,与企业自身生产经营快速结合,为自身的数字化转型,生产经营提质降本增效带来切实效益。这一需求对通用大模型与行业数据的结合、AI技术与应用平台和场景的结合、集中训练与边缘推理决策的结合都提出了更高的要求,目前看仍有赖于产业链各方持续的协作推进。
崔丽:
尽管从学术和技术角度考量,生成式AI并非全新的革命性技术。但是,随着数字基础设施的高速建设,使用更多参数、海量数据、更强异构算力,基于大模型的AIGC迎来了爆炸式的突破,某种意义上已经来到了生成式AI的奇点时刻。
由于生成式的通用AI具有认知式、多模态、跨场景等特征,具备了非常广泛的应用前景,可能会引发人类生活和生产方式的巨大变化,并将深刻地改变科学技术体系、产业布局及社会治理模式,这基本已经成为行业共识。
另一方面,生成式AI目前尚存在一些问题和挑战,比如可解释性和确定性、信息更新及时性,行业领域数据不足等,除此之外,它的内容生成和应用与知识产权保护、隐私保护、数据安全、偏见规避等方面均有关联,需要同时考虑相关应用规则的不断完善。
除此之外,在大模型热度的背后,我们还需要把技术创新转化为实实在在的经济和社会价值,实现商业闭环。
特别把大模型从创意场景延展到行业细分场景的过程中,看清楚问题,找到解决方案,再进行实践迭代,也成为当下行业的重要探索方向。
崔丽:
实际上AI技术在行业的数字化转型中一直发挥着作用。而此次AI的进阶式发展,则会加速企业数字化转型的浪潮,也会进一步加速数字化时代企业的优胜劣汰。
生成式AI由于具备了多模态、跨场景、内容生成等特点,因此能够与垂直行业和企业经营深度结合,形成差异化优势,创造出更大的商业价值和社会效益,从而形成产业发展的正向循环。如:推动办公、研发等领域从数字化向智能化转变,利用大模型技术辅助开发人员进行需求分析、编程、测试以及产品文档编写。
可以说,相对电力带来的蓝领工作的解放,此次算力和智力带来的生成式AI,则可能充当基础“白领”或助理的角色,进一步大幅提升公司经营效率,比如
(1)催生新型数字化创新业务模式。基于语言模型的AI能够理解语义,为客户服务、销售营销、产品设计等创造了新的数字化应用场景,也将催生新的数字化业务模式。
(2)提升流程自动化和决策智能化水平。AI可广泛应用于企业内部流程的自动化,大幅提升运营效率;也可以支持更智能的业务决策,提升决策质量。
(3)构建交互式的智能用户界面。多模态模型使得智能交互成为可能,企业可以构建语音助手、智能客服等新的用户交互模式。
(4)促进产品和服务的智能化升级。通过AI赋能,可以实现更个性化的用户推荐、更智能的产品功能等,推动产品与服务的智能化升级。
崔丽:
在广告创意、教育、代码写作等领域,生成式AI已大幅提升了效率。目前我们已经可以看到一些应用成果。
我们也看到,目前在广告、教育、城市治理、医疗健康、金融服务、供应链管理等重点领域,在客户关系管理,客户服务,文档生成,专家咨询等数字化应用场景,已经有了生成式AI和行业和企业数字化转型结合的初步应用。
然而,并不是说有了大模型和生成式AI,我们才开始使用AI。实际上,在此之前,产业已经使用AI来做一些事情了。
举个例子,即使现在Transformer已经出现,对于部分机器视觉领域应用,CNN仍然是最有效率的算法。Transformer最初主要用于自然语言处理方面,现在开始进入多模态。实际上,OpenAI也提到过,在多模态接入后,他们可能会牺牲一部分原有的性能。对于不同类型的任务,不同AI算法它们之间的差异仍然很大。还有有着成千上万亿参数的大模型,往往需要大约20倍的高质量、多元化的数据,Scaling Law才能发挥效果。
因此,对于某些特定领域,如果真的可以完成特定的任务目标,不一定非要训练一个千亿甚至万亿参数的大模型,除非你希望它能在泛化和解决复杂问题方面发挥作用。对于某些特定领域,此前已经有许多AI技术发挥了重要作用。我不认为这些技术是替代关系,而是互补关系。
同样,现在的AI各方面,包括Transformer、生成式AI等,都不是独立的。它们依赖于数据、算法和算力,缺一不可。
我认为未来可能是多种组合的混合使用,而且大家都会不断尝试结合不同的技术来获得更大的进步和发展。
崔丽:
目前仍然处于大模型的发展的初级阶段,行业大模型应用需要综合考虑行业专业性、数据安全、系统部署等因素,仍存在着不少挑战。
首先,在行业专业性上,不同于基础通用大模型(核心在自然语言理解/生成、世界通识封装),行业所要求的内容生成涉及到生产运营和商业服务,对专业性尤其是准确性要求更为严格,从而对数据来源、数据准确性、参数调优、精准训练等一系列技术环节有更高要求。而在内容应用上,更是不仅仅涉及到AI本身,也涉及到行业专家和AI的协同。
其次,数据安全与治理上,行业数据可能分散于各个企业当中,而每一个商业企业都会对核心的知识产权和核心数据进行保护。所以知识和数据的可获得度,以及生成内容和商业机密、数据安全之间的平衡,可能会存在一定的壁垒。而即使在企业内部,当前多数企业内部数据治理架构按照业务、部门展开,部门之间数据无法做到安全共享,限制了企业内部训练、应用大模型的深度和广度。因此,智能化需要企业的数据治理迈向更高级的层次,也就是说,智能化是以数字化为基础。
再次,在系统部署上,由于对自身业务、数据的保密要求,大企业对私有化部署的大模型有强烈需求。企业对于具备专业知识的领域大模型的需求胜过仅具备公共基础知识的通识大模型。由于大模型在训练、推理成本很高,企业在部署大模型时优先考虑尽可能使用规模较小、更具专业性模型,如百亿级参数的领域模型。在垂直场景等方面,迭代更快、成本更低的开源模型也完全有机会做出优势。
因此,大模型和行业数字化转型的融合,仍需要技术供应商、企业、行业组织、政府监管等多部门多角色的紧密协同和持续探索。特别是大模型的效果,在算力规模、训练数据量、调优、部署以及团队的工程经验等一系列环节,都存在极高要求。而行业头部企业和中小企业之间,在这部分的资金投入、数据积累、技术能力也有非常大的差异。因此,如何避免在大模型的行业应用上出现“智能鸿沟”,真正把这项技术普惠到全行业的数字化转型,也是值得思考的问题。
中兴通讯
崔丽:
此次基于大模型的发展热潮,也结合自身特长和客户期望,中兴通讯会着重发力以下方面。首先就是聚焦电信领域大模型,大幅提升中兴数字基础设施及端到端ICT解决方案的竞争优势,进一步提升通信网络的自智和自治程度,加速向L4级别迈进。
中兴通讯正在研发电信领域大模型,将大量高质量的领域数据以及Know-How知识积累注入到大模型中,可在多个场景中使用大模型替代辅助甚至替代人工,从而大幅提升运营效率降低运营成本。
大模型等新一波AI技术发展,将有利于中兴通讯更快速的推出智能化和自治化全套网络解决方案,并挖掘全新的网络价值,包括:
(1)网络优化和维护。大模型可以分析海量的网络数据,实现网络流量预测、故障预警、网络优化等,提高运维效率。
(2)网络安全。利用AI进行网络入侵检测、异常行为分析,提高网络安全性。
(3)自动化测试。使用AI自动生成测试用例,进行网络设备的自动化测试,缩短测试时间。
(4)个性化网络。利用AI分析用户Usage,提供个性化的网络裁剪和业务部署方案。
(5)客户服务。Chatbot和语音助手可以提供更智能的客户服务和技术支持。
(6)数据价值挖掘。从海量数据中提取价值,开发出新的业务模式。
崔丽:
从对于中兴本身的影响来看,大模型和AI技术在公司自身的快速应用,可以提升产品竞争力,并推动公司研发和运营效率持续提升。
大模型在办公、研发等领域大模型技术具备大量的应用场景,可以明显提升办公及研发效率。中兴通讯正在从数字化转型走向智能化转型,已开始开发和部署研发提效大模型,利用大模型技术辅助开发人员进行需求分析、产品设计、编程、测试以及产品文档编写,智能化转型对提升公司研发和经营效率具有巨大潜力。
从对中兴的具体对外业务来看,一是,在智算基础设施领域,依托公司全栈能力,提供全系列高效智算中心产品,如系列GPU服务器、硬件加速、高速无损网络、低碳数据中心等,并可提供高性能、定制化产品及解决方案。二是,前面已经提及的电信大模型和行业大模型,可以对外赋能,加速行业数智化转型升级,三是,当前大模型的热潮使AI技术进入了一个新的空间,存在着无限的想象力和一定的不确定性。因此,我们也期望和客户一起,从具象的技术与产品,到前瞻的联合创新孵化,进行更紧密的合作,共建AI新时代的能力链条。
此外,在AI的安全与伦理治理方面,如安全防护、隐私保护等,也将协同政府、产业和生态一起进行联合探索。
崔丽:
以5G为代表的连接和以AI为代表的智能算力,是近年来数字技术高速发展的典型代表。
一方面,5G网络的高带宽、低时延和万物互联的特性可以极大地增强AI的实时数据来源,并释放云端AI的能力,让云端的强大AI能力赋能到每个人和每个物联网终端,特别是随着5G持续演进,5G-Advanced相关创新的加速应用,将持续推动物联网的深度和广度的发展,从而为AI提供更多的实时的数据来源,AI在云/边缘训练推理后,又可以通过高速通道及时触达神经末梢,协同构建实时、高效的智能化分析、决策和控制循环系统。这为全社会进一步向数智化转型升级提供了基础。与此同时,当前以5G、算力为代表数字基础设施建设中,已部署了大量边缘算力,再辅以云、边、端算力高效协同,提升AI训练和推理效率,降低AI部署和使用成本,也将成为重要发展方向之一。
另一方面,AI的最新发展也可以帮助5G自智网络进一步向L4迈进。结合通用基础大模型和领域大模型,涵盖感知、分析、决策、执行各环节,全面推进业务闭环落地,实现网络高度自治,具体来说主要体现在:
(1)网络优化和配置:构建实时数字孪生网络,利用AI的预测分析能力,可以根据流量变化、业务需求等,智能优化网络切片、资源调度等, 意图驱动提供更多高价值决策建议,实现动态网络优化和配置。
(2)故障预测和治理:AI可以通过深度学习分析大量网络运维数据,实现对网络故障的预测和定位,通过及时治理来保障网络质量。
(3)网络安全防护:AI可以辅助进行实时的网络安全态势感知,进行流量检测和风险评估,有效防范网络攻击和恶意行为。
(4)服务体验优化:AI可以智能分析用户反馈和网络指标,主动发现服务质量下降区域,实时体验优化。
中兴通讯
崔丽:
中兴通讯在IT技术领域上有多年积累,具备包括芯片、产品和方案的ICT全栈核心能力,目前在包括通用服务器、AI服务器、存储、数据中心交换机、数据中心等在内的算力领域有全面的产品布局,服务器及存储产品有着超200件的自主研发专利,具备自身的差异化优势。
AI服务器目前主要涉及高性能计算、计算机视觉(CV)、自然语言处理、数据分析、自动驾驶等应用,但随着AI大模型技术的兴起,逐渐从分析式AI过渡到生成式AI应用;特别是随着ChatGPT应用推出后受到全球的关注和热捧,也带动了头部客户都关注到基于大模型训练&推理技术的生成式AI应用场景。
中兴通讯作为国内主流的服务器厂商,一直积极应对AI领域的应用需求,并及时推出了满足各种AI应用场景的服务器产品。比如:
(1) 面向中小模型的训练&推理需求,中兴通讯今年1月份推出的G5系列服务器中包含了3款AI应用的服务器产品,其中2款2U2S全场景通用服务器(R5300 G5和R5350 G5),支持4个双宽GPU插卡或6~8个单宽GPU插卡;还有1款专用4U10GPU服务器(R6500 G5),该产品支持8~10个双宽GPU插卡或16~20个单宽GPU插卡。
(2)面向AI大模型训练&推理应用场景,中兴通讯将重点投入新一代智算中心基础设施产品,面支持大模型训练和推理,包括高性能AI服务器、DPU等。其中,年内将发布支持大模型训练的最新AI服务器,能够为头部客户的AIGC应用提供强大的大模型训练和推理能力。
此外,AI智算是一个涵盖了数据中心、算、存、网、管、用等方面的系统性方案,除了服务器及存储产品外,中兴通讯在液冷数据中心、节点内和节点间的高速无损网络、DPU硬件加速、多样化算力管理和调度等方面,也具备完整的解决方案,可以帮助客户一站式的部署智算基础设施。
还计划发布训推一体机,将计算、网络、存储以及训练推理平台甚至模型及应用打包交付,开箱即用,快速上手,减去软硬件集成的复杂技术要求,快速开展大模型应用。
崔丽:
中兴通讯与百度双方合作广泛,在服务器产品方面,中兴通讯服务器产品全面满足百度定制化要求,已规模应用于百度智能云,充分满足百度智能云不同业务场景差异化配置需求、资源分配和上云服务。
针对百度智能云AI、深度学习的需求,中兴通讯服务器产品采用高密度、模块化、精细化设计,具有高性能、高可靠、易扩展、易管理等优势,在AI、云计算、大数据等领域具有出色的表现,适用于百度大脑、飞桨深度学习平台。
我们始终保持着产品高水准的技术创新力,并在应用中持续迭代,夯实硬实力,赢得客户信任,拓展服务边界,不仅仅在互联网领域,更是在电信、金融、政务、电力、教育、交通等十多个重点行业中赢得了一批稳定客户,多点开花,全面突破,形成了强有力的生态聚合力。
崔丽:
近年来,国产GPU、AI加速卡取得了长足的发展,国内厂商持续发力,相关新产品陆续发布,算力性能、缓存容量、P2P互联带宽都有提升,覆盖了AI推理和AI训练需求。国产服务器虽然目前在服务器市场的整体占比相对还不高,但增长是比较迅速的。
客观说,国产AI服务器在产品性能和软件生态等方面与国际领先水平还存在一些差距,尤其是百卡、千卡大模型预训练场景下计算节点软硬件的稳定性和可靠性还需进一步提升。中国的CPU/GPU等核心产业起步相对较晚,加之CPU/GPU等技术高度复杂,涉及到微电子、材料科学、架构指令、封装技术等,需要长期积累、不断创新实践和商业反哺。但从另外一个角度讲,逆全球化势头萌芽也是倒逼国内相关领域自力更生、众志成城、加速发展的关键力量。我个人看法,追赶乃至超越有几个重要的有利因素,也是我们全产业链条需要共同把握并将其发挥到极致:一是可以结合最先进的技术创新成果;二是中国产业的长期积累,以及巨大的市场红利和人才红利;三是当下技术创新更需要跨域协同,个人赛、组合赛加团体赛均可以同场竞技。事实上,全产业也正在正确的路上努力加速奔跑。
崔丽:
ChatGPT引爆了大模型和生成式AI的热潮,但最核心的基础依然是“算据(数据)、算法和算力”,而且缺一不可。因此,“高效低碳的算力或服务”、“更多可复用的算法”、“便捷经济的领域模型构建和部署”、以及“数据的资产化和交易化”始终是企业数智化转型的核心诉求。
目前,国内的行业数字化转型进展已经如火如荼,然而数字化转型过程中各领域普遍面临烟囱式系统、数据孤岛、技术成本投入高、应用开发效率低等痛点,其根本上还是数据、技术、应用系统没有做好连通、流通、复用,要解决这些挑战,规范的技术架构、统一的数字平台至关重要。
数字星云2.0针对数智时代三大要素——数据、算法、算力做了全面的升级,在数字资产交易、敏捷开发、集成使能以及技术领域能力四个方面更智慧、更聪明,从而使AI技术、智能算力与行业场景应用能够更紧密结合,持续提升交易效率,进一步加速全行业数字化转型。可以说,数字星云2.0就如同一个更强大的“胃”,为用户在数字化转型过程中引入AI大模型提供了更强大的“消化和吸收”能力。
以青岛地铁大数据项目为例,数字星云2.0通过为青岛地铁集团构建一个统一的、可共享的数字底座,使得原来分散在地铁生产网和管理网等多个系统的海量数据得以顺畅流通,并且通过提供接入、开发、治理服务等能力,使得零散的数据成为数据资产,进而支撑了包括“智能运维、智能运营等”等数据应用,帮助青岛地铁通过数据分析和优化来有效提升乘客的服务体验以及企业的运营效率和安全服务水平。
这波AI浪潮正处于高速迭代期,后续,我们也将结合大模型和生成式AI等技术的最新发展,持续增加更多能力组件,在代码生成、办公智能化、运营智能化等领域展开研究,助力促进产业转型升级,提高社会生产效率。