当前位置:首页|资讯|生成式AI

盘点190家国产大模型:发布速度趋缓,医学垂直领域最多

作者:南方都市报发布时间:2023-12-19

原标题:盘点190家国产大模型:发布速度趋缓,医学垂直领域最多

12月19日下午,南方都市报联合中国政法大学数据法治研究院在北京举办第七届“啄木鸟数据治理论坛”,主题为“数据为本,AI向善”。会上,南都数字经济治理研究中心发布了《生成式AI发展与治理观察报告(2023)》(下称《报告》)。

《报告》通过数据分析等方式,描摹了生成式AI2023年行业发展现状,并从国产大模型公开发布时间、类别、发布主体等多个维度展示了国内“百模大战”热潮的真实面貌,还呈现了与十余位从业者的深度访谈和思考。

··· 五大维度评测:垂直远超通用,推出速度趋缓

当前,国内部分大厂具有多条“大模型产品线”,因此,报告基于企业官方对外公开或宣传口径,选取其中一条最具代表性的大模型产品,同时参考GitHub已有的专门整理国产大模型榜单数据的项目,最终选取190个国产大模型的样本数据进一步的信息统计和分析。

从发布时间来看,2022年11月ChatGPT发布并爆火之后,仅时隔3个月,2023年2月便已有国产大模型推出,随后每月都不断有新的国产大模型面世,且数量逐月增高,直到2023年7月达到巅峰——当月共有39个大模型推出,此后大模型推出数量便开始逐月递减。

从发布主体的地域来看,这190个大模型分布于23个省级单位(包括自治区、直辖市和港澳台地区)。

其中,有5个省份,至少聚集了10个或以上的大模型发布主体,按数量排名依次为北京、广东、上海、浙江、江苏;有15个省份,至少有2个或以上的大模型发布主体,其中北京共有69家组织机构发布大模型,占比约36%,在数量上遥遥领先。

在大模型的发布主体上,目前国产大模型主要来自高校、企业、研究机构、医院、银行等五大主体;而190个国产大模型中,有151个由企业发布,数量最多。

从大模型的类别来看,通用领域的大模型共有45个,垂直领域的大模型则有145个。而垂直领域中又包含43个细分赛道,其中以医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多,均为10个及以上,也不乏城市规划、钢铁、林业、水利、心理健康等一个大模型开辟一条赛道的领域。

公开信息显示,截至目前,国内至少有23家大模型通过《生成式人工智能服务管理暂行办法》备案。这意味着算法备案已成为AIGC产品的向社会公众开放、进入商用市场的重要门槛。所谓大模型备案,是指大模型产品在向公众开放及商用之前,经过监管部门的备案审批。没有经过备案,就只能小范围内测,大部分人无法注册使用,而通过备案的大模型产品或服务即可面向社会全面开放服务。

目前已通过备案的大模型主要有四种公开方式:官方给出在线网址(公众可接入/邀测制)、移动端上线应用商店、大模型开源、赋能企业内部其他应用(大模型本身不公开)。

对于企业来说,大模型通过备案即可向全社会开放服务,这就意味着规模更加庞大的中文语料库和更加丰富的原生应用场景,而对于大众来说,通过备案也意味着可以用极低的门槛接触到最顶尖的AI原生应用之一。因此,大模型的备案制度不仅是国家出于保障数据安全、规范行业发展的目的,也在能在制度上推进大模型进入产业落地阶段,加速大模型C端应用的普及。

···

大模型不应仅局限于聊天工具

更是生产力工具

从生成式AI整体来看,其文本生成、图像生成、音频生成、视频生成等四大赛道最具有代表性。

其中文本生成领域由于底层架构,更易演化出大模型,也因此诞生了国内外大模型赛道的热潮,赛道中除了几家头部巨头,其他厂商多走私有化部署、企业定制的toB路线。而图像生成领域因开源工具繁多,入手门槛低、视觉效果明显,toC端应用极其广泛,也开始逐渐渗透进入影视游戏等垂直领域的工作流。

而视频生成仍处于早期探索阶段,现阶段算法层面的模型效果并不理解,能同时在视频长度、逼真度、连贯性三个维度上均达到商用水平的视频生成产品仍然欠缺。 语音生成行业格局稳定,商用落地也较为成熟,原有格局难以打破,随着技术的发展和AI话题的火热,用户的需求更加多种多样,也将拓宽语音生成领域的商业化场景,并使部分细分赛道更加专业和清晰。

为了更深入地了解国内生成式AI的产业现状,南都数字经济治理研究中心也与12位生成式AI从业者进行了访谈。他们有的是AI公司创始人,如小冰公司CEO李笛、清博智能CEO郎清平、极态AI公司CEO王力等;也有的是头部互联网公司AI算法或数据合规的资深专家,如阿里巴巴高级算法专家威视等;还有如知乎、博特智能等推出大模型的企业,也通过书面回复等方式参与了此次调研。结合自身背景和工作实践,他们从商业、技术、法律和产业等角度分享了对生成式AI发展的看法。

在访谈中,有受访者提到大模型开发这个赛道分为三类:做通用大模型的、做垂直大模型的和基于模型做产品和解决方案开发。

第一类赛道的玩家是大厂和一些明星创业公司,他们专注于能够追赶ChatGPT的通用大模型的研发,也会积极建立并完善各种生态,是当前面向C端的大模型产品的主要发力者

第二类赛道的玩家是各领域的头部企业、数据服务商,其专注的是垂直大模型这个赛道。不追求参数量级,而是利用行业高质量数据及对行业深刻洞察,期望切实解决行业问题,追求行业结合度和准确度。

第三类赛道的玩家则基于通用或者开源模型做产品和解决方案开发。例如开发垂直领域SaaS服务、知识管理系统、智能客服机器人等AI产品和解决方案,辅以其他技术可实现快速迭代和交付。

在访谈中,从业者们普遍提到的一个观点是,对大模型的认知不应局限在聊天工具,它应该有更广泛的应用价值。有人称应该把大模型当成一个生产力工具,将其潜在性能释放出来,真正服务千行百业,助力产业升级。此前在接受南都记者专访时,360创始人周鸿祎也表示,尽管Open AI推出的ChatGPT至今仍遥遥领先,但AI发展的iPhone时刻还未到来,这场火热的大模型之争也远未结束。下一步竞争的关键在于,谁能把大模型的能力和用户场景更好地相结合。

但对于“百模大战”为了将会如何演变,从业者们有不同的看法:有人认为这是一个短暂的繁荣期,很快泡沫会消散;有人则认为竞争的下半场才刚刚开始。

统筹:南都记者 李玲

采写:南都记者 杨博雯 吕虹 胡耕硕

出品:南都数字经济治理研究中心


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1