AI大模型是指在机器学习和人工智能领域中,具有庞大参数量和复杂结构的模型,这些模型通常由大量的神经网络层组成,具有数百万或数十亿的参数,需要大量的计算资源和存储空间进行训练和推理。其中,通用大模型能够综合多种领域的数据和知识,进行全局性的分析和预测;行业大模型则针对于某个行业进行优化和训练,提供更加精准的解决方案。AI大模型不仅能够提高企业的工作效率,还能够推动整个行业的创新和发展。此外,AI大模型的应用场景也越来越广泛,从智能家居到智慧医疗,从智慧城市到智能制造大模型已经成为了人工智能技术的重要组成部分,随着数字技术的不断发展,AI大模型的应用前景将更加广阔。
一、AI大模型产业发展概况
近年来,在技术迭代升级和市场需求扩大的推动下,AI大模型产业快速发展,众多科技领军企业纷纷推出了自研的通用大模型及垂类行业大模型。与此同时,行业应用不断拓展,从原来的知识服务、智能对话等场景逐渐演进至智能生活消费、行业应用、公共服务等多个维度的细分领域。根据研究预测,当前中国AI大模型产业蓬勃发展,创新成果不断涌现,预计2023年中国AI大模型产业规模将达到147亿元,并在2028年达到1179亿元,当前国内已出现“百模大战”的发展态势。
二、AI大模型产业链结构
人工智能大模型产业链是一个庞大而复杂的系统,涵盖了从硬件设施到软件算法的各个环节,主要包括基础层、模型层和应用层。其中,基础层又主要包括算力和数据,模型层主要包括通用大模型和行业大模型,应用层主要包括生活消费应用、产业经济应用和公共服务应用等。
图1:AI大模型产业链框架图
在基础层,人工智能需要大量的计算和存储空间,因此需要高性能的AI芯片,AI芯片供应商主要是国际知名企业,如英特尔、英伟达、华为等,AI芯片实际投入使用又派生出AI服务器,进而派生出智算中心,构成AI大模型算力基础设施。
另外,AI大模型的训练需要大量数据支撑,其中数据加工根据用户需求,对有关数据进行包括清洗、转换和分析等操作,并将得到的数据加工产品或分析处理结果以合适的方式提供给用户;数据标注是对非结构化的数据进行标注处理,使其转化为机器可以识别的结构化数据,这些被标注过的数据样本是人工智能大模型的“养料”,人工智能大模型通过不断地学习这些数据的特征,进而实现自主识别;数据训练是指使用标注好的数据来训练机器学习算法,以使算法能够对新数据进行准确的预测或分类。数据训练与数据标注是密切相关的两个环节。
在模型层,单模态AI大模型又分为文本大模型、语音大模型、视频大模型等,而多模态AI大模型则可以通过协同语文本识别、声纹识别、图像识别等功能,实现跨模态检测以及实现感知信息能力的显著提升。随着AI大模型产业的进一步发展,目标定位于应用场景的行业大模型正在不断涌现,行业大模型在通用大模型的基础上利用细分行业特有的数据进行针对训练,最后创造出针对于特定领域的AI“专家”。
在应用层,人工智能的应用场景非常广泛,在生活消费方面,智能服务提供商将人工智能应用到各种智能服务中,如智能客服、智能语音助手、智能推荐等。在产业经济应用方面,AI大模型将应用到各个行业中,如金融、教育、生物制药等。在公共服务方面,AI大模型将广泛应用于交通、气象与政务服务等领域。
三、中国AI大模型产业链图谱
图2:中国AI大模型产业链图谱
(一)基础层
1、AI芯片
AI芯片主要包括GPU、FPGA、ASIC和CPU。其中,中国GPU产业规模相对较小,目前国内主要的GPU厂商有景嘉微、芯动科技、摩尔线程、沐曦科技、龙芯中科、芯瞳半导体等;FPGA方面,国内厂商有紫光同创、复旦微电子、华微电子等,虽然积累了一定的技术和产业基础,在FPGA国产化方面有所突破,但产品还未能进入主流市场,与国际巨头还存在较大差距;ASIC与通用集成电路相比功耗更低、性能提高、成本更低,基于ASIC在数据处理时的优势,国内外龙头企业纷纷布局,我国ASIC芯片行业发展迅速,ASIC芯片企业主要有华为海思、阿里巴巴、百度、寒武纪、比特大陆、燧原科技等;CPU领域,目前国产CPU正处于快速增长阶段,为了逆转芯片卡脖子的困境,我国正在加强芯片自主研发,其中上海兆芯、海光信息等为代表的企业使用IP内核授权模式进行研发,华为鲲鹏、天津飞腾采用指令集授权模式进行研发,龙芯中科、申威科技依据授权自主研制指令集模式进行研发,其中申威科技已基本实现完全自主可控。
2、AI服务器
当前,中国主流算力服务来源于四大阵营。一是华为系,核心公司包括拓维信息、四川长虹、神州数码、同方股份以及广电运通;二是中科院系,核心公司是中科曙光;三是英特尔系,龙头企业包括浪潮信息、紫光股份、中兴通讯等;四是英伟达系,核心公司是工业富联。
3、智算中心
根据中国信通院发布的《中国算力服务研究报告(2023年)》,中国算力服务目前以“任务式”交付为核心,通过云计算相关技术整合不同硬件来源间的算力,完成多样性算力资源的统一管理与调用,实现算力市场化、普惠化。当前,我国正大力推进“东数西算”工程,在贵州、内蒙古、成渝、宁夏等利于发展数据中心产业的西部地区建立算力枢纽,承接后台加工、离线分析、存储备份等非实时算力需求,将东部算力需求有序引导到西部,缓解东部算力压力。我国智算中心企业主要有腾讯、阿里、华为和商汤科技等。
4、数据加工
数据加工处理服务指的是根据用户需求,对有关数据进行包括清洗、转换和分析等操作,并将得到的数据加工产品或分析处理结果以合适的方式提供给用户。数据加工是AI大模型产业上游必不可少的一环,因为AI大模型需要用大量数据进行训练。同时,AI大模型训练所需的数据在质量方面的要求较高,未经加工处理的“粗糙”原始数据一般会对大模型训练精度造成负面影响。在数据加工方面,除阿里云、华为云、腾讯云等互联网巨头外,表现突出的企业还有星环科技、海天瑞声、山大地纬等。
5、数据标注
数据标注是对非结构化的语音、图片、文本、视频等数据进行标注处理,使其转化为机器可以识别的结构化数据,数据标注的类型主要有图像标注、语音标注、3D点云标注和文本标注等。这些被标注过的数据样本是AI大模型的“养料”,AI大模型通过不断地学习这些数据的特征,进而实现自主识别,因此数据标注的精准度对AI大模型的“水平”有重要影响。当前数据标注业务主要以人工标注为主,属于劳动力密集型产业,可对一些地区的经济发展起到显著促进作用。数据标注重点企业主要包括澳鹏科技、星尘纪元、曼孚科技、云测、菲利信等。另外,阿里云、腾讯云、华为云等互联网巨头多采取外包策略开展数据标注业务。
6、数据训练
数据训练是指使用标注好的数据来训练机器学习算法,以使算法能够对新数据进行准确的预测或分类。数据训练与数据标注是密切相关的两个环节。数据标注提供了结构化数据,是数据训练上游的必要环节。专注于数据训练领域的国内领先服务商有海天瑞声、慧听科技、标贝科技等。
(二)模型层
1、通用AI大模型
单模态AI大模型又分为文本大模型、语音大模型、视频大模型等。针对场景应用,单模态AI大模型赋能后的操作系统比传统的人机交互模式响应更为智能,同时也使数据流通更加广泛。如今,单模态AI大模型基于自身的专项特点已逐步向行业细分领域渗透,主要以提供智能服务为主。我国单模态AI大模型企业主要有智源人工智能研究院、第四范式、新壹科技等。
自今年年初以来,多模态通用AI大模型红极一时,如百度文心一言、华为盘古、360智脑、商汤日日新、阿里通义千问、京东灵犀、昆仑万维天工、科大讯飞星火、腾讯混元等先后登场。但目前人工智能大模型的概念红利逐渐消失,技术演进的重点方向已经不再是盲目追求大模型,而是转向实用性和可持续性的发展。越来越多的企业和非企业机构开始关注如何将大模型与实际应用场景相结合,实现商业化应用。
2、行业AI大模型
由于通用AI大模型成本过高,训练一个“全知全能”的通用大模型的算力成本、数据成本及模型迭代升级所需成本都较高,性价比较低。相比较而言,垂类行业大模型研发成本更低,更实用。垂类模型,即行业AI大模型是在通用大模型的基础上,利用细分行业特有的数据进行针对训练,同时进一步迭代算法而产生的针对于特定领域的AI“专家”。由于近年来数据要素市场化、价值化发展趋势,行业AI大模型逐渐具备了核心的数据壁垒,因此也获得了较大的商业应用价值,可以广泛的应用在政务、医疗、金融等数据成规模聚集的领域。我国行业AI大模型企业主要有网易有道、京东健康、度小满、中工互联等。
(三)应用层
1、生活消费应用
AI大模型与游戏应用的结合可以使NPC更鲜活,与玩家的对话更真实,如网易伏羲的”玉言“大模型曾在中文语言理解领域最权威评测CLUE的1.1分类任务排行榜中登顶第一;AI大模型与文学相结合可以激发创作灵感,提高创作效率的同时引领全新的创作思路,掀起AI电子书热潮。AI大模型与客服场景相结合可以提升智能客服的多轮对话能力与个性化回答能力,在给生产端赋能实现降本增效的同时也优化了广大消费者的消费体验。我国AI大模型生活消费应用企业主要有聆心智能、硅基智能、印象笔记、数说故事等。
2、产业经济应用
当前AI大模型已经可以应用到农业、工业、金融、教育、生物制药等多个领域。在工业领域,AI大模型的核心应用逻辑就是分析海量的底层数据,之后提供相应的方案,例如,资产设备可靠性管理、设备故障特征、维修保养建议、供应链管理等动态生成式的解决方案。在农业应用方面,AI大模型利用对气象、土壤、作物、肥料配比等数据进行分析和预测,帮助农业生产做出更准确的决策,提高农业生产效率。在金融行业应用方面,量化投资是关注的焦点,目前如中信证券等知名的头部券商已经开始采用AI技术来优化其投资策略,通过大量数据训练与模型迭代升级,AI可以产生更加理性、冷静的决策判断。自AI大模型进入教育领域,大量智能化课程产品涌现,如行业领军企业有道精品课,AI讲师、AI辅导师目前正广泛应用于各科目,已实质性取得降本增效成果。我国AI大模型行业应用企业主要有中科创达、清博、恒生电子、好未来等。
3、公共服务应用
AI大模型在公共服务领域主要应用于提升管理效率和提供更加便捷的服务。例如,AI大模型可以实时分析道路上的交通流量,进行更加精准的调度调控,缓解道路拥堵。AI大模型还可以使升防灾预警系统的准确性得到提升,通过分析过去的气象数据,AI可以预测未来可能出现的极端天气情况,从而让我们更好地做好防范。此外,AI大模型还可以应用于公共安全领域,例如美亚柏科的天擎在公安、监察、税务、海关、铁路和应急领域都可以提供系统的解决方案。在医疗服务方面,医疗行业AI大模型在互联网的加持下成规模的服务了各类患者,极大减轻了公共医疗当前所面临的巨大压力。我国AI大模型公共服务应用企业主要有佳都科技、大经中医、美亚柏科、维智科技等。
四、AI大模型产业面临的挑战
(一)技术层面
根据相关研究结果,当今顶尖AI大模型的推理能力不足,依旧不具备全方位解决问题的能力。在基础知识层面,AI大模型更擅长文字语言应用科目,而对逻辑思维、推理能力要求更高的数理化科目,现有技术还无法形成实际应用。纵观这一轮AI大模型“狂潮”,是Transformer架构的诞生,才使得大数据学习模型成为可能,不过以ChatGPT为代表的、基于数据训练的大语言模型其实并没有实质性的科学突破,各类AI大模型并没有物理直觉。从底层技术角度看,大模型并不具备真正的智慧,它们无法代替人类的工作,也无法解决所有的问题,尽管大模型在某些领域能够取得令人瞩目的成绩,但它们仍然是工具而非创造者。不过随着技术的演进,下一轮的“技术爆炸”蕴藏着怎样的潜能还未可知。
(二)实践层面
1、算力资源短缺
当前算力资源是最大的短板,各行各业都面临底层算力资源缺乏的困境。伴随着AI大模型技术的不断演进,其对算力的要求也不断提高,以1750亿参数的GPT-3为例,每生成一次1000字回答,所需算力资源约为4PFLOP/s,随着未来大模型进入普及应用,其算力需求将飞速增长。然而,令人尴尬的是,我国目前正遭遇美国的高端GPU芯片的出口禁令,同时华为、寒武纪、壁仞科技等国内算力芯片领先企业也被美国列入实体清单,令大模型算力需求“雪上加霜”。
2、算力成本高
虽然我国当前正在加紧实施“东数西算”工程,但是东部地区的算力需求依旧无法全面满足。同时由于高昂的电力成本,即使在政策支持的加持下,一些西部算力部署区位也面临企业流失。
3、高质量数据稀缺
高质量数据属于稀缺资源,因此十分昂贵,以GPT为例,OpenAI公司在数据标注上已投入数千万美金,在全球雇佣上千名外包人员进行数据处理,标注一个强化学习数据成本高达50美元。同时,高质量数据的安全维护成本也是一大笔开销。
关键词:人工智能,AI,大模型
本文来源:本文摘自赛智产业研究院人工智能大模型研究团队吴明达(咨询顾问)、邓道正(副院长)完成的研究报告,转载请标明出处。