图源:摄图网
人工智能产业已经发展许多年,但一直并未出现“杀手级”的应用,直至2022年OpenAI公司发布ChatGPT,这款产品带来了震撼的产品体验,引领生成式技术浪潮,人工智能拉开了新一轮技术和产业革命。
语言大模型能够模仿人类的对话和决策能力,是率先实现技术突破和应用落地的大模型,也是当下人工智能的“主赛道”。目前,语言大模型在金融、医疗、教育、工业、游戏、法律等多个行业得到了广泛的应用。
大语言模型的发展历程虽然只有短短六年的时间,但是发展速度相当惊人,迄今为止,国内外有超过百种大模型相继发布。
2023年末,根据我国工信部数据,2023年全年我国语言大模型市场规模实现较快提升,应用场景不断丰富,增长率突破100%。据统计,2023年,我国大语言模型市场规模为147亿元。
根据SuperCLUE最新发布的大语言模型排行榜,国内大模型中,百川3、GLM-4、通义千问2.1以综合得分73.32、72.58、72.45依此居于行业第一、二、三名。腾讯混元-pro、文心一言4.0、MoonShot(Kimichat)紧随其后。
注:SuperCLUE是国内权威的通用大模型综合性测评基准,一直致力于提供科学、客观、中立的语言模型评测,为AI技术的发展树立了重要标杆。该评分体系包括代表性的数据集、基准(预训练)模型、语料库、排行榜。评分体系会选择一系列有一定代表性的任务对应的数据集,做为测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。
从产业链各环节的参与者来看,核心环节大语言模型平台的建设由于技术密集程度较高、训练成本巨大,因此,仅有部分少数互联网巨头可参与其中,搭建自研大语言模型凭条。产业链上游技术层面中,包括芯片生产、云平台搭建以及数据要素收集等,这些领域技术壁垒同样较高,参与者均为互联网、计算机行业头部公司。
根据前瞻产业研究院报告《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》整理得出,2024年中国大语言模型行业十大代表性研发企业汇总如下(注:排名不分先后):
综合来看,我国大语言模型行业主要参与者有百川智能、智谱AI、阿里巴巴、腾讯、百度等。
百川3
——北京百川智能技术有限公司
百川智能于2024年1月29日发布了Baichuan 3,这是一款拥有超千亿参数的大语言模型。在CMMLU、GAOKAO和AGI-Eval等评测中,Baichuan 3宣称在中文任务上超过了GPT-4。 值得一提的是,不同于其他的大模型企业,百川智能是国内唯一一家专注医疗的大模型公司,并在AI医疗技术和应用上均取得了阶段性进展,被称为是“中文医疗任务表现最佳的大模型”。
据了解,百川智能在Baichuan 3的训练过程中采用了多种技术手段和方案,包括“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”。这些措施稳定了训练时间达到一个月以上,并且故障恢复时间不超过10分钟。此外,Baichuan 3还突破了“迭代式强化学习”技术,进一步提升了语义理解和生成能力,在诗词创作方面也进行了改进。
根据企查猫数据显示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司的核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。
2024年7月28日,百川智能宣布完成了金额达50亿元人民币的A轮融资,并且公司还将以200亿元的估值开启B轮融资。
百川智能此轮融资的投资方有阿里、小米、腾讯、亚投资本、中金等头部大厂和市场化投资机构,也包括北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金。
GLM-4
——北京智谱华章科技有限公司
智谱AI是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。
2024年1月16日,智谱AI发布新一代基座大模型GLM-4。
据官网报道,GLM-4的整体性能相比GLM-3有了显著的60%提升,这一进步几乎可与GPT-4相媲美。具体表现上,GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本可以达到300页。同时在多模态能力方面,文生图和多模态理解都得到了增强。
据企查猫数据,智谱AI是一家专注于人工智能技术研发和应用的公司,成立于2019年6月,由清华大学的技术成果转化而来。智谱AI的创始团队来自清华大学计算机系KEG实验室,一直致力于人工智能技术的研发和产业落地。
在2024年6月智谱AI Open Day上,智谱AI披露已有企业级客户30万+,日均调用量达到 400 亿 Tokens。
通义千问2.1
——阿里云计算有限公司
阿里云是国内最早开源自研大模型的科技企业。
2023年12月1日,阿里云发布通义千问闭源模型2.1版,相比前序版本,通义千问2.1的代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。
2024年8月15日,阿里巴巴发布2025财年第一季度财报(截至2024年6月30日止三个月)。财报显示,阿里巴巴该季度营收2432.4亿元,上年同期营收2341.56亿元,同比增长4%。
除了电商之外,阿里云被视作阿里巴巴的另一核心业务。财报数据显示,阿里云本季度营收增长6%至265.49亿元,其中AI相关产品收入实现三位数增长,公共云业务实现两位数增长,经调整EBITA利润同比增长155%,单季度EBITA利润达到23.37亿元。具体来看,该季度阿里云的外部收入(不包含阿里巴巴关联公司用云收入)同比增长达到6%,阿里云AI平台百炼的付费用户数,比上一个季度增长超过200%。
根据企查猫介绍,阿里云创立于2008年,是全球领先的云计算及人工智能科技公司,为200多个国家和地区的企业、开发者和政府机构提供服务。
腾讯混元-pro
——深圳市腾讯计算机系统有限公司
腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,该模型基于Transformer神经网络架构,具有万亿参数规模,具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
截至2024年7月30日,混元生文已上线6个版本,分别为hunyuan-pro、hunyuan-standard、hunyuan-lite、hunyuan-role、hunyuan-functioncall、hunyuan-code。
据了解,腾讯,全称“深圳市腾讯计算机系统有限公司”,1998年11月由马化腾、张志东、许晨晔、陈一丹、曾李青共同创立,2023年总收入6090.15亿元。
2024年8月16日,腾讯控股发布2024年第二季度财报。2024年第二季度腾讯实现营收1611.17亿元,毛利858.95亿元,经营利润584.43亿元,毛利和经营利润增速分别达到21%和27%。
根据财报数据,目前腾讯混元大模型已在近700个腾讯内部业务和场景中落地;小游戏的月活用户达5亿人,小游戏总流水同比增长超30%等。
文心一言4.0
——北京百度网讯科技有限公司
文心一言是中国公众最早能够体验测试的AI大模型。2023年10月17日,在百度世界大会上,创始人、董事长兼首席执行官李彦宏正式发布文心大模型4.0。
8月22日,百度集团发布2024年第二季度财报,显示季度总营收339亿元,百度核心营收267亿元,百度核心经营利润56亿元,同比增长23%,超出市场预期。其中,百度云业务营收51亿元,同比增长14% ,AI收入占比9%。
据财报数据,百度文心大模型日调用量超6亿次,近半年来增长超10倍,文心大模型日均tokens使用量超1万亿。值得注意的是,当前,百度搜索上18%的搜索结果由AI生成。
从容大模型V1.5
——云从科技集团股份有限公司
2023年8月22日,云从科技正式发布从容大模型1.5版本。该版本包含十亿级、百亿级、千亿级多种模型规格。
据介绍,此次1.5版本模型上下文长度(Context length)实现了32K Tokens,同时,从容大模型对中文编码器进行了深度优化,一个中文汉字平均仅占0.7 Tokens,这使得从容大模型1.5版本支持的上下文长度超过4.5万字。
云从科技集团股份有限公司,简称“云从科技(Cloudwalk)”,与商汤科技、旷视科技、依图科技并称为“AI四小龙”,该公司总部位于广州,由周曦创立于2015年,孵化于中国科学院重庆绿色智能技术研究院,是一家人工智能科技企业。
2024年4月18日,云从科技集团股份有限公司发布2023年年度报告。数据显示,2023 年营收6.28亿(2022年5.26亿);2023 年亏损6.43亿(2022年亏损8.69亿)。
4月30日,云从科技发布2024年一季度业绩报告。从营收和利润方面看,公司本报告期实现营业总收入5440.35万元,同比增长19.99%,净亏损1.61亿元,亏损同比扩大11.62%,基本每股收益为-0.15元。
MiniMax-abab6.1
——上海稀宇极智科技有限公司
Minimax-abab6.5系列模型是MiniMax推出的万亿参数大语言模型,可以很好地满足复杂生产力以及多语言人设对话场景需求,最大支持245k上下文窗口,在知识、推理、数学、编程、指令遵循等各项测试中接近行业最领先的大模型水平。
MiniMax稀宇科技是2021年12月成立的大模型初创公司,该公司已自研出文本到视觉、文本到语音以及文本到文本三个基础模型。
2023年6月1日,MiniMax接近完成规模超2.5亿美元的一轮融资,其估值有望达到近12亿美元。MiniMax的最新一轮融资吸引到新的投资者,包括与腾讯有关联的实体。据悉,MiniMax在此前的融资中吸引到米哈游参投。其他早期投资者包括云启资本和明势资本等。
MoonShot(Kimichat)
——北京月之暗面科技有限公司
Kimi Chat(Kimi)是月之暗面(Moonshot AI)于2023年10月推出的一款智能助手,主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”6项功能,是全球首个支持输入20万汉字的智能助手产品。作为对比,Anthropic的Claude-100k模型支持约8万字,而OpenAI的GPT-4-32k只支持约2.5万字。
截至2024年3月19日,Kimi智能助手累计下载量突破50万次大关。
月之暗面(Moonshot AI),成立于2023年3月,迅速成为国内大模型领域的关键参与者。公司的核心团队成员曾参与Google Gemini、Google Bard、盘古NLP和悟道等多个重要大模型项目的研发。
2024年8月6日,有消息称腾讯参与国内大模型独角兽、Kimi智能助手开发公司月之暗面(Moonshot AI)3亿美元融资,这使得该公司估值提升至 33 亿美元。对此,有接近公司的知情人士表示,此次腾讯参投消息属实。而月之暗面则称,对该融资消息不予置评。
根据企查猫数据,自成立起,月之暗面经历了4轮融资,背后的股东阵营豪华,包括红杉中国、真格基金、美团龙珠、蓝驰创投、阿里巴巴、招商局中国基金、小红书、腾讯以及高榕资本等一系列知名投资平台。
山海大模型
——云知声智能科技股份有限公司
山海是云知声于2023年5月24日正式发布的AGI领域大模型,其基于自建的300P算力Atlas智算平台,构建起语言生成、语言理解、数理能力、代码能力、知识问答、逻辑推理、安全合规、领域增强等十大能力,并逐步拓展出文生图、文生视频、图片问答等多模态能力。目前,山海大模型已全面接入并重塑各类人工智能应用场景,在智慧医疗、智慧交通、智慧座舱等诸多场景实现落地应用。
2024年8月26日,云知声宣布正式推出山海多模态大模型。据介绍,山海多模态大模型通过整合跨模态信息,山海多模态大模型可接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。基于多模态交互能力,可根据不同的场景和需求,模拟出各种人物性格和对话风格。
据企查猫数据,云知声成立于 2012 年,是我国作为国内AGI技术产业化的先行者,该公司专注于物联网人工智能,拥有自主知识产权的智能语音人工智能企业。云知声业务主要覆盖智慧生活和智慧服务两大场景,在包括家居、车载、医疗、教育、政府、机器人等领域拥有广泛布局。
截至目前,云知声被曝再度向港交所更新招股书,继续其申请上市进程,中金公司与海通国际为联席保荐人。具体来看,报告期内,云知声的营业收入自2021年至2023年度,分别为4.56亿元、6.01亿元、7.27亿元。
讯飞星火V3.5
——科大讯飞股份有限公司
讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,该模型对标ChatGPT。
2024年1月30日,科大讯飞举行了讯飞星火认知大模型V3.5升级发布会,会上,讯飞星火V3.5版本正式发布,这是是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型。
科大讯飞董事长刘庆峰表示,讯飞星火V3.5整体已经接近GPT-4水平;其在数学、语言理解、语音交互能力超过GPT-4Turbo。代码能力方面达到了GPT-4 Turbo的96%,多模态理解能力也达到了GPT-4V的 91%。
截至发稿,讯飞星火仍在持续迭代。8月19日,科大讯飞股份有限公司发布星火语音大模型更新,推出对标GPT-4o的语音功能产品——星火极速超拟人交互。星火极速超拟人可实现随时打断、插话后实时回复,感知情绪变化,改变方言、情感和强度,还可以模仿不同角色进行交流。
根据科大讯飞2024年半年报,公司报告期内实现营业收入93.25亿元,同比增长18.91%,毛利增长19.08%,销售回款总额90亿元,较去年同期增长15亿元,增幅达20%。
其中,上半年,科大讯飞围绕大模型相关的总投入超过13亿,具体为围绕通用大模型研发投入增加4亿,围绕大模型训练推理平台工程化的研发投入增加1.6亿,围绕大模型推广和应用推广投入增加1.2亿,各BG、BU围绕大模型产品化的投入增加超过6亿。
大语言模型行业发展现状及前景趋势预测
大语言模型产业链区域分布热力图
我国大语言模型产业链分布主要集中在北京、上海、深圳、广州、杭州等经济发达的一线城市、新一线城市中,截至2023年11月,根据前瞻不完全统计,全国已有130个左右的大语言模型产品,其中,北京已有54个大语言模型公司,上海市有12个,深圳市11个,杭州市8个,广州4个,成都3个,南京3个,其他地区11个。总体来看,大语言模型产业链分布呈现明显的区域化特征,主要聚集在经济发达地区。
注:该图表数据截至2023年12月。
大语言模型市场规模预测
综合来看,前瞻初步测算,到2027年,我国大语言模型市场规模将达到600亿元,到2029年将达到1186亿元,年复合增速在40%以上。
大语言模型发展趋势预测
大型语言模型(LLMs)的发展趋势预示着向更大规模、多模态交互、行业定制化、增强的可解释性、强化的安全性与隐私保护、跨语言能力、开源协作、商业化服务、硬件协同优化,以及法规与伦理框架的构建方向发展。这些趋势将共同推动LLMs在提升性能、拓宽应用场景、增强用户信任、促进技术共享与创新、加快企业集成和部署,以及确保社会责任和伦理标准等方面的进步,从而更广泛地融入各行各业,实现AI技术的可持续和负责任的发展。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《》
同时前瞻产业研究院还提供、、、、、、、、、、等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在,性价比最高功能最全的企业查询平台。