盘点190家国产大模型：发布速度趋缓，医学垂直领域最多

作者：南方都市报发布时间：2023-12-19

12月19日下午，南方都市报联合中国政法大学数据法治研究院在北京举办第七届“啄木鸟数据治理论坛”，主题为“数据为本，AI向善”。会上，南都数字经济治理研究中心发布了《生成式AI发展与治理观察报告（2023）》（下称《报告》）。

《报告》通过数据分析等方式，描摹了生成式AI2023年行业发展现状，并从国产大模型公开发布时间、类别、发布主体等多个维度展示了国内“百模大战”热潮的真实面貌，还呈现了与十余位从业者的深度访谈和思考。

··· 五大维度评测：垂直远超通用，推出速度趋缓

当前，国内部分大厂具有多条“大模型产品线”，因此，报告基于企业官方对外公开或宣传口径，选取其中一条最具代表性的大模型产品，同时参考GitHub已有的专门整理国产大模型榜单数据的项目，最终选取190个国产大模型的样本数据进一步的信息统计和分析。

从发布时间来看，2022年11月ChatGPT发布并爆火之后，仅时隔3个月，2023年2月便已有国产大模型推出，随后每月都不断有新的国产大模型面世，且数量逐月增高，直到2023年7月达到巅峰——当月共有39个大模型推出，此后大模型推出数量便开始逐月递减。

从发布主体的地域来看，这190个大模型分布于23个省级单位（包括自治区、直辖市和港澳台地区）。

其中，有5个省份，至少聚集了10个或以上的大模型发布主体，按数量排名依次为北京、广东、上海、浙江、江苏；有15个省份，至少有2个或以上的大模型发布主体，其中北京共有69家组织机构发布大模型，占比约36%，在数量上遥遥领先。

在大模型的发布主体上，目前国产大模型主要来自高校、企业、研究机构、医院、银行等五大主体；而190个国产大模型中，有151个由企业发布，数量最多。

从大模型的类别来看，通用领域的大模型共有45个，垂直领域的大模型则有145个。而垂直领域中又包含43个细分赛道，其中以医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多，均为10个及以上，也不乏城市规划、钢铁、林业、水利、心理健康等一个大模型开辟一条赛道的领域。

公开信息显示，截至目前，国内至少有23家大模型通过《生成式人工智能服务管理暂行办法》备案。这意味着算法备案已成为AIGC产品的向社会公众开放、进入商用市场的重要门槛。所谓大模型备案，是指大模型产品在向公众开放及商用之前，经过监管部门的备案审批。没有经过备案，就只能小范围内测，大部分人无法注册使用，而通过备案的大模型产品或服务即可面向社会全面开放服务。

目前已通过备案的大模型主要有四种公开方式：官方给出在线网址（公众可接入/邀测制）、移动端上线应用商店、大模型开源、赋能企业内部其他应用（大模型本身不公开）。

对于企业来说，大模型通过备案即可向全社会开放服务，这就意味着规模更加庞大的中文语料库和更加丰富的原生应用场景，而对于大众来说，通过备案也意味着可以用极低的门槛接触到最顶尖的AI原生应用之一。因此，大模型的备案制度不仅是国家出于保障数据安全、规范行业发展的目的，也在能在制度上推进大模型进入产业落地阶段，加速大模型C端应用的普及。

···

大模型不应仅局限于聊天工具

更是生产力工具

从生成式AI整体来看，其文本生成、图像生成、音频生成、视频生成等四大赛道最具有代表性。

其中文本生成领域由于底层架构，更易演化出大模型，也因此诞生了国内外大模型赛道的热潮，赛道中除了几家头部巨头，其他厂商多走私有化部署、企业定制的toB路线。而图像生成领域因开源工具繁多，入手门槛低、视觉效果明显，toC端应用极其广泛，也开始逐渐渗透进入影视游戏等垂直领域的工作流。

而视频生成仍处于早期探索阶段，现阶段算法层面的模型效果并不理解，能同时在视频长度、逼真度、连贯性三个维度上均达到商用水平的视频生成产品仍然欠缺。语音生成行业格局稳定，商用落地也较为成熟，原有格局难以打破，随着技术的发展和AI话题的火热，用户的需求更加多种多样，也将拓宽语音生成领域的商业化场景，并使部分细分赛道更加专业和清晰。

为了更深入地了解国内生成式AI的产业现状，南都数字经济治理研究中心也与12位生成式AI从业者进行了访谈。他们有的是AI公司创始人，如小冰公司CEO李笛、清博智能CEO郎清平、极态AI公司CEO王力等；也有的是头部互联网公司AI算法或数据合规的资深专家，如阿里巴巴高级算法专家威视等；还有如知乎、博特智能等推出大模型的企业，也通过书面回复等方式参与了此次调研。结合自身背景和工作实践，他们从商业、技术、法律和产业等角度分享了对生成式AI发展的看法。

在访谈中，有受访者提到大模型开发这个赛道分为三类：做通用大模型的、做垂直大模型的和基于模型做产品和解决方案开发。

第一类赛道的玩家是大厂和一些明星创业公司，他们专注于能够追赶ChatGPT的通用大模型的研发，也会积极建立并完善各种生态，是当前面向C端的大模型产品的主要发力者

第二类赛道的玩家是各领域的头部企业、数据服务商，其专注的是垂直大模型这个赛道。不追求参数量级，而是利用行业高质量数据及对行业深刻洞察，期望切实解决行业问题，追求行业结合度和准确度。

第三类赛道的玩家则基于通用或者开源模型做产品和解决方案开发。例如开发垂直领域SaaS服务、知识管理系统、智能客服机器人等AI产品和解决方案，辅以其他技术可实现快速迭代和交付。

在访谈中，从业者们普遍提到的一个观点是，对大模型的认知不应局限在聊天工具，它应该有更广泛的应用价值。有人称应该把大模型当成一个生产力工具，将其潜在性能释放出来，真正服务千行百业，助力产业升级。此前在接受南都记者专访时，360创始人周鸿祎也表示，尽管Open AI推出的ChatGPT至今仍遥遥领先，但AI发展的iPhone时刻还未到来，这场火热的大模型之争也远未结束。下一步竞争的关键在于，谁能把大模型的能力和用户场景更好地相结合。

但对于“百模大战”为了将会如何演变，从业者们有不同的看法：有人认为这是一个短暂的繁荣期，很快泡沫会消散；有人则认为竞争的下半场才刚刚开始。

统筹：南都记者李玲

采写：南都记者杨博雯吕虹胡耕硕

出品：南都数字经济治理研究中心