2024年国产大模型行业十大代表性研发企业：百川智能、智谱AI、阿里巴巴、腾讯、百度……

作者：前瞻网发布时间：2024-08-27

图源：摄图网

人工智能产业已经发展许多年，但一直并未出现“杀手级”的应用，直至2022年OpenAI公司发布ChatGPT，这款产品带来了震撼的产品体验，引领生成式技术浪潮，人工智能拉开了新一轮技术和产业革命。

语言大模型能够模仿人类的对话和决策能力，是率先实现技术突破和应用落地的大模型，也是当下人工智能的“主赛道”。目前，语言大模型在金融、医疗、教育、工业、游戏、法律等多个行业得到了广泛的应用。

大语言模型的发展历程虽然只有短短六年的时间，但是发展速度相当惊人，迄今为止，国内外有超过百种大模型相继发布。

2023年末，根据我国工信部数据，2023年全年我国语言大模型市场规模实现较快提升，应用场景不断丰富，增长率突破100%。据统计，2023年，我国大语言模型市场规模为147亿元。

根据SuperCLUE最新发布的大语言模型排行榜，国内大模型中，百川3、GLM-4、通义千问2.1以综合得分73.32、72.58、72.45依此居于行业第一、二、三名。腾讯混元-pro、文心一言4.0、MoonShot(Kimichat)紧随其后。

注：SuperCLUE是国内权威的通用大模型综合性测评基准,一直致力于提供科学、客观、中立的语言模型评测,为AI技术的发展树立了重要标杆。该评分体系包括代表性的数据集、基准(预训练)模型、语料库、排行榜。评分体系会选择一系列有一定代表性的任务对应的数据集，做为测试基准的数据集。这些数据集会覆盖不同的任务、数据量、任务难度。

从产业链各环节的参与者来看，核心环节大语言模型平台的建设由于技术密集程度较高、训练成本巨大，因此，仅有部分少数互联网巨头可参与其中，搭建自研大语言模型凭条。产业链上游技术层面中，包括芯片生产、云平台搭建以及数据要素收集等，这些领域技术壁垒同样较高，参与者均为互联网、计算机行业头部公司。

根据前瞻产业研究院报告《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》整理得出，2024年中国大语言模型行业十大代表性研发企业汇总如下(注：排名不分先后)：

综合来看，我国大语言模型行业主要参与者有百川智能、智谱AI、阿里巴巴、腾讯、百度等。

百川3

——北京百川智能技术有限公司

百川智能于2024年1月29日发布了Baichuan 3，这是一款拥有超千亿参数的大语言模型。在CMMLU、GAOKAO和AGI-Eval等评测中，Baichuan 3宣称在中文任务上超过了GPT-4。值得一提的是，不同于其他的大模型企业，百川智能是国内唯一一家专注医疗的大模型公司，并在AI医疗技术和应用上均取得了阶段性进展，被称为是“中文医疗任务表现最佳的大模型”。

据了解，百川智能在Baichuan 3的训练过程中采用了多种技术手段和方案，包括“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”。这些措施稳定了训练时间达到一个月以上，并且故障恢复时间不超过10分钟。此外，Baichuan 3还突破了“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作方面也进行了改进。

根据企查猫数据显示，百川智能成立于2023年4月10日，由前搜狗公司CEO王小川创立。公司的核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。

2024年7月28日，百川智能宣布完成了金额达50亿元人民币的A轮融资，并且公司还将以200亿元的估值开启B轮融资。

百川智能此轮融资的投资方有阿里、小米、腾讯、亚投资本、中金等头部大厂和市场化投资机构，也包括北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金。

GLM-4

——北京智谱华章科技有限公司

智谱AI是国内最早入局大模型赛道的公司之一，也是目前国内头部大模型厂商代表之一。

2024年1月16日，智谱AI发布新一代基座大模型GLM-4。

据官网报道，GLM-4的整体性能相比GLM-3有了显著的60%提升，这一进步几乎可与GPT-4相媲美。具体表现上，GLM-4可以支持128k的上下文窗口长度，单次提示词可以处理的文本可以达到300页。同时在多模态能力方面，文生图和多模态理解都得到了增强。

据企查猫数据，智谱AI是一家专注于人工智能技术研发和应用的公司，成立于2019年6月，由清华大学的技术成果转化而来。智谱AI的创始团队来自清华大学计算机系KEG实验室，一直致力于人工智能技术的研发和产业落地。

在2024年6月智谱AI Open Day上，智谱AI披露已有企业级客户30万+，日均调用量达到 400 亿 Tokens。

通义千问2.1

——阿里云计算有限公司

阿里云是国内最早开源自研大模型的科技企业。

2023年12月1日，阿里云发布通义千问闭源模型2.1版，相比前序版本，通义千问2.1的代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。

2024年8月15日，阿里巴巴发布2025财年第一季度财报（截至2024年6月30日止三个月）。财报显示，阿里巴巴该季度营收2432.4亿元，上年同期营收2341.56亿元，同比增长4%。

除了电商之外，阿里云被视作阿里巴巴的另一核心业务。财报数据显示，阿里云本季度营收增长6%至265.49亿元，其中AI相关产品收入实现三位数增长，公共云业务实现两位数增长，经调整EBITA利润同比增长155%，单季度EBITA利润达到23.37亿元。具体来看，该季度阿里云的外部收入（不包含阿里巴巴关联公司用云收入）同比增长达到6%，阿里云AI平台百炼的付费用户数，比上一个季度增长超过200%。

根据企查猫介绍，阿里云创立于2008年，是全球领先的云计算及人工智能科技公司，为200多个国家和地区的企业、开发者和政府机构提供服务。

腾讯混元-pro

——深圳市腾讯计算机系统有限公司

腾讯混元大模型（Tencent Hunyuan）是由腾讯研发的大语言模型，该模型基于Transformer神经网络架构，具有万亿参数规模，具备强大的中文创作能力、复杂语境下的逻辑推理能力，以及可靠的任务执行能力。

截至2024年7月30日，混元生文已上线6个版本，分别为hunyuan-pro、hunyuan-standard、hunyuan-lite、hunyuan-role、hunyuan-functioncall、hunyuan-code。

据了解，腾讯，全称“深圳市腾讯计算机系统有限公司”，1998年11月由马化腾、张志东、许晨晔、陈一丹、曾李青共同创立，2023年总收入6090.15亿元。

2024年8月16日，腾讯控股发布2024年第二季度财报。2024年第二季度腾讯实现营收1611.17亿元，毛利858.95亿元，经营利润584.43亿元，毛利和经营利润增速分别达到21%和27%。

根据财报数据，目前腾讯混元大模型已在近700个腾讯内部业务和场景中落地；小游戏的月活用户达5亿人，小游戏总流水同比增长超30%等。

文心一言4.0

——北京百度网讯科技有限公司

文心一言是中国公众最早能够体验测试的AI大模型。2023年10月17日，在百度世界大会上，创始人、董事长兼首席执行官李彦宏正式发布文心大模型4.0。

8月22日，百度集团发布2024年第二季度财报，显示季度总营收339亿元，百度核心营收267亿元，百度核心经营利润56亿元，同比增长23%，超出市场预期。其中，百度云业务营收51亿元，同比增长14% ，AI收入占比9%。

据财报数据，百度文心大模型日调用量超6亿次，近半年来增长超10倍，文心大模型日均tokens使用量超1万亿。值得注意的是，当前，百度搜索上18%的搜索结果由AI生成。

从容大模型V1.5

——云从科技集团股份有限公司

2023年8月22日，云从科技正式发布从容大模型1.5版本。该版本包含十亿级、百亿级、千亿级多种模型规格。

据介绍，此次1.5版本模型上下文长度（Context length）实现了32K Tokens，同时，从容大模型对中文编码器进行了深度优化，一个中文汉字平均仅占0.7 Tokens，这使得从容大模型1.5版本支持的上下文长度超过4.5万字。

云从科技集团股份有限公司，简称“云从科技（Cloudwalk）”，与商汤科技、旷视科技、依图科技并称为“AI四小龙”，该公司总部位于广州，由周曦创立于2015年，孵化于中国科学院重庆绿色智能技术研究院，是一家人工智能科技企业。

2024年4月18日，云从科技集团股份有限公司发布2023年年度报告。数据显示，2023 年营收6.28亿（2022年5.26亿）；2023 年亏损6.43亿（2022年亏损8.69亿）。

4月30日，云从科技发布2024年一季度业绩报告。从营收和利润方面看，公司本报告期实现营业总收入5440.35万元，同比增长19.99%，净亏损1.61亿元，亏损同比扩大11.62%，基本每股收益为-0.15元。

MiniMax-abab6.1

——上海稀宇极智科技有限公司

Minimax-abab6.5系列模型是MiniMax推出的万亿参数大语言模型，可以很好地满足复杂生产力以及多语言人设对话场景需求，最大支持245k上下文窗口，在知识、推理、数学、编程、指令遵循等各项测试中接近行业最领先的大模型水平。

MiniMax稀宇科技是2021年12月成立的大模型初创公司，该公司已自研出文本到视觉、文本到语音以及文本到文本三个基础模型。

2023年6月1日，MiniMax接近完成规模超2.5亿美元的一轮融资，其估值有望达到近12亿美元。MiniMax的最新一轮融资吸引到新的投资者，包括与腾讯有关联的实体。据悉，MiniMax在此前的融资中吸引到米哈游参投。其他早期投资者包括云启资本和明势资本等。

MoonShot(Kimichat)

——北京月之暗面科技有限公司

Kimi Chat（Kimi）是月之暗面(Moonshot AI)于2023年10月推出的一款智能助手，主要有“长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译”6项功能，是全球首个支持输入20万汉字的智能助手产品。作为对比，Anthropic的Claude-100k模型支持约8万字，而OpenAI的GPT-4-32k只支持约2.5万字。

截至2024年3月19日，Kimi智能助手累计下载量突破50万次大关。

月之暗面（Moonshot AI），成立于2023年3月，迅速成为国内大模型领域的关键参与者。公司的核心团队成员曾参与Google Gemini、Google Bard、盘古NLP和悟道等多个重要大模型项目的研发。

2024年8月6日，有消息称腾讯参与国内大模型独角兽、Kimi智能助手开发公司月之暗面（Moonshot AI）3亿美元融资，这使得该公司估值提升至 33 亿美元。对此，有接近公司的知情人士表示，此次腾讯参投消息属实。而月之暗面则称，对该融资消息不予置评。

根据企查猫数据，自成立起，月之暗面经历了4轮融资，背后的股东阵营豪华，包括红杉中国、真格基金、美团龙珠、蓝驰创投、阿里巴巴、招商局中国基金、小红书、腾讯以及高榕资本等一系列知名投资平台。

山海大模型

——云知声智能科技股份有限公司

山海是云知声于2023年5月24日正式发布的AGI领域大模型，其基于自建的300P算力Atlas智算平台，构建起语言生成、语言理解、数理能力、代码能力、知识问答、逻辑推理、安全合规、领域增强等十大能力，并逐步拓展出文生图、文生视频、图片问答等多模态能力。目前，山海大模型已全面接入并重塑各类人工智能应用场景，在智慧医疗、智慧交通、智慧座舱等诸多场景实现落地应用。

2024年8月26日，云知声宣布正式推出山海多模态大模型。据介绍，山海多模态大模型通过整合跨模态信息，山海多模态大模型可接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。基于多模态交互能力，可根据不同的场景和需求，模拟出各种人物性格和对话风格。

据企查猫数据，云知声成立于 2012 年，是我国作为国内AGI技术产业化的先行者，该公司专注于物联网人工智能，拥有自主知识产权的智能语音人工智能企业。云知声业务主要覆盖智慧生活和智慧服务两大场景，在包括家居、车载、医疗、教育、政府、机器人等领域拥有广泛布局。

截至目前，云知声被曝再度向港交所更新招股书，继续其申请上市进程，中金公司与海通国际为联席保荐人。具体来看，报告期内，云知声的营业收入自2021年至2023年度，分别为4.56亿元、6.01亿元、7.27亿元。

讯飞星火V3.5

——科大讯飞股份有限公司

讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互，该模型对标ChatGPT。

2024年1月30日，科大讯飞举行了讯飞星火认知大模型V3.5升级发布会，会上，讯飞星火V3.5版本正式发布，这是是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型。

科大讯飞董事长刘庆峰表示，讯飞星火V3.5整体已经接近GPT-4水平；其在数学、语言理解、语音交互能力超过GPT-4Turbo。代码能力方面达到了GPT-4 Turbo的96%，多模态理解能力也达到了GPT-4V的 91%。

截至发稿，讯飞星火仍在持续迭代。8月19日，科大讯飞股份有限公司发布星火语音大模型更新，推出对标GPT-4o的语音功能产品——星火极速超拟人交互。星火极速超拟人可实现随时打断、插话后实时回复，感知情绪变化，改变方言、情感和强度，还可以模仿不同角色进行交流。

根据科大讯飞2024年半年报，公司报告期内实现营业收入93.25亿元，同比增长18.91%，毛利增长19.08%，销售回款总额90亿元，较去年同期增长15亿元，增幅达20%。

其中，上半年，科大讯飞围绕大模型相关的总投入超过13亿，具体为围绕通用大模型研发投入增加4亿，围绕大模型训练推理平台工程化的研发投入增加1.6亿，围绕大模型推广和应用推广投入增加1.2亿，各BG、BU围绕大模型产品化的投入增加超过6亿。

大语言模型行业发展现状及前景趋势预测

大语言模型产业链区域分布热力图

我国大语言模型产业链分布主要集中在北京、上海、深圳、广州、杭州等经济发达的一线城市、新一线城市中，截至2023年11月，根据前瞻不完全统计，全国已有130个左右的大语言模型产品，其中，北京已有54个大语言模型公司，上海市有12个，深圳市11个，杭州市8个，广州4个，成都3个，南京3个，其他地区11个。总体来看，大语言模型产业链分布呈现明显的区域化特征，主要聚集在经济发达地区。

注：该图表数据截至2023年12月。

大语言模型市场规模预测

综合来看，前瞻初步测算，到2027年，我国大语言模型市场规模将达到600亿元，到2029年将达到1186亿元，年复合增速在40%以上。

大语言模型发展趋势预测

大型语言模型(LLMs)的发展趋势预示着向更大规模、多模态交互、行业定制化、增强的可解释性、强化的安全性与隐私保护、跨语言能力、开源协作、商业化服务、硬件协同优化，以及法规与伦理框架的构建方向发展。这些趋势将共同推动LLMs在提升性能、拓宽应用场景、增强用户信任、促进技术共享与创新、加快企业集成和部署，以及确保社会责任和伦理标准等方面的进步，从而更广泛地融入各行各业，实现AI技术的可持续和负责任的发展。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《》

同时前瞻产业研究院还提供、、、、、、、、、、等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容，需要获取前瞻产业研究院的正规授权。

更多深度行业分析尽在，还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在，性价比最高功能最全的企业查询平台。