“百模大战” 星火大模型行业应用表现突出

作者：中国经济时报发布时间：2023-10-23

图片来源/摄图网授权

■中国经济时报记者王小霞

要问今年最热的科技热点是什么，许多人会脱口而出——大模型。从年初ChatGPT引发的大模型浪潮，到相关科技企业上线自家大模型产品，“百模大战”不断升级。

众所周知，AI大模型是“大数据+大算力+强算法”结合的产物，科技企业的技术底座决定了其AI大模型的应用价值，在技术进步和创新喷涌的热潮中，人们关注的焦点集中于，我国大模型行业应用能力究竟如何？与GPT-4等国外大模型相比还有哪些差距？大模型的应用又将为行业打开哪些成长空间？

PART1

科技公司逐鹿大模型

自ChatGPT问世以来，全球科技界掀起新一轮人工智能浪潮，人类正在加速迈进人工智能时代，中国科技企业也纷纷投入大量资源研发人工智能大模型，一些知名科技巨头、初创企业及科研院所纷纷围绕自身在数据要素、应用场景、技术装备、资金与人才等方面的优势研发并发布了基础大模型。

数据显示，截至2023年8月，我国已发布的大模型达156个，10亿级参数规模以上大模型已超80个，大模型数量已接近美国。我国已跻身全球大模型产业发展第一梯队。

更为关键的是，我国大模型发展不仅速度快且后劲足，大量的数据积累和丰富的应用场景，将为我国大模型应用按下了加速键。

根据IDC研究显示，中国数据量规模将从2022的23.88ZB增长至2027年的76.6ZB，复合年均增长速度（CAGR）达到26.3%，为全球第一，为大模型的持续优化提供了海量的数据来源。

与此同时，我国拥有超4亿中等收入群体以及全球最完整的产业体系，为大模型的落地应用提供了广阔的创新空间。

PART2

应用测评：星火大模型在医疗、

教育与法律行业应用中表现突出

决胜大模型，关键在应用。如此多的AI大模型，行业应用能力究竟如何？

为深入了解相关大模型的实际应用情况，国研经济研究院开展了一项大模型行业应用能力测评研究，旨在评估大模型不同行业下的表现情况，分析潜在的应用场景和模式，对比我国大模型与国际一流大模型的行业表现，并在此基础上提出我国大模型产业高水平发展的政策建议。

据了解，此次测评选取星火大模型3.0版、ChatGPT、GPT-4和国内某大模型为测评对象进行对比，测评行业方面选择了知识密集型的生产性服务业（法律服务与工业设计）、个性化需求高的生活性服务业（医疗、教育与零售）以及部分制造业（汽车工程、计算机），并基于临床执业医师资格考试、中医执业医师资格考试、国家统一法律职业资格考试、机动车检测维修专业技术人员执业资格、全国计算机技术与软件专业技术资格等权威职业资格考试构建了测评题目，以评估大模型在行业知识、技能掌握水平、生产经营场景理解能力等维度的表现。

从测评结果来看，星火大模型的综合能力达到国际一流水平，所有7个测评行业中表现均大幅超越ChatGPT，并在部分行业优于GPT-4，在与国内某大模型的比较中也表现优异。星火大模型3.0版在医学、法律、教育、零售、汽车工程、计算机和工业设计的综合准确率分别达到69.3%、71.4%、82.2%、61.2%、78.4%、76.9%和66.4%，平均准确率达72.3%，在所有测评行业中表现均优于GPT3.5版，并且与GPT4.0各有优劣，且相对落后项的差距也均在10%以内。星火大模型3.0版的知识储备与语言理解能力已具备独立完成部分行业任务和辅助人类完成复杂任务的能力。

图：各行业综合准确率对比

从优势领域来看，星火大模型在医疗、法律、教育行业表现格外突出。根据目前的测评方式，其在医疗、法律领域的中文领域知识和语言理解能力已分别超越GPT4表现5.3%和4.1%，在教育领域基础能力的表现与GPT4的表现差距小于1%。

从应用能力上看，星火大模型的行业知识掌握水平较高，且已经初步具备处理行业内复杂问题的能力。星火大模型在各行业基础知识与领域知识问答中的表现突出，在所有测评行业中准确率均超过GPT3.5。其中，医学临床诊断、法律案例判决和零售企业战略制定等考核领域属于较为复杂的题目，需要模型在具备行业知识的同时从给定场景中提取出关键信息，并作出判断。星火大模型在该类问题中的表现优异，正确率分别达到65.2%、63.0%、66.7%，均优于GPT3.5表现，在医学临床诊断、法律案例判决中的正确率与GPT4.0表现接近，仅在零售企业战略制定方面略弱于GPT4.0。

星火大模型3.0版的优异表现表明，中国在大模型技术研发和应用方面已经取得了重要进展，并且有可能在未来引领全球人工智能技术的发展。

PART3

大模型将为各行各业深度赋能

尽管中国的大模型在行业应用方面表现优异，但我们也必须看到，人工智能技术的发展是一个持续的过程，需要不断地进行技术研发和创新。

正如业内人士指出，探索赋能不同行业场景的落地方式将成为我国大模型企业快速发展的重要方向，而行业应用价值也将成为评判大模型的核心指标。

对于大多数企业而言，面向垂直场景、垂直行业、垂直领域探索基于大模型的应用创新，都将是未来重点攻克的方向。

从基础大模型到行业大模型，大模型要在落地之路上一步步快速推进。参照移动互联网的发展路径，唯有出现成千上万个解决生产、生活真实需求的AI原生应用，大模型才能真正由“样板间”变为“商品房”，深入社会经济的各个角落，助力各行各业的产业升级，推动中国经济的快速复苏，深刻改变人们的生活方式。

据公开数据，全球范围内人工智能将持续高速增长，市场规模持续扩大，预计到2032年，全球人工智能市场规模将达到1.3万亿美元。

在充满活力和机遇的时代背景下，人工智能大模型的兴起将持续引领科技进步，无论是在技术创新、商业应用还是在产业变革的推动方面，大模型都将发挥重要作用。伴随着应用领域的不断扩展，为各产业发展带来新的可能性。

本公众号版权归中国经济时报所有。如转载或引用本文内容须经许可，并注明转自中国经济时报。

热点链接‍

●把习近平文化思想贯彻落实到宣传思想文化工作各方面和全过程

●智观天下丨可信赖的清洁能源推动绿色技术改变世界

●“一带一路”这十年•述说丨擦亮“绿色名片”共建“绿色丝路”

●特别报道丨第三届“一带一路”国际合作高峰论坛再结丰硕成果

总监制丨王辉王继承

监制丨李丕光王彧刘卫民

主编丨毛晶慧编辑丨邹朵

【中国经济时报--中国经济新闻网 http://www.cet.com.cn】

“百模大战” 星火大模型行业应用表现突出

推荐体验

相关资讯

“百模大战”进阶，华知大模型何以“突出重围”？

“百模大战”之下，大模型应用“卷”向何方

百模大战，AI行业发展新趋势

“百模大战”，来了

百模大战愈演愈烈

近期资讯

长沙模拟重大交通事故陆空医疗转运

“探索三号”交付启航

38 位科学家在《科学》期刊联合发文，“镜像细菌”研究引发隐忧

超值补贴，松下Xtra蔓越莓电冰箱：超薄嵌入、风冷无霜，品质生活

人形机器人爆火巨头涌入千亿赛道

要买就买最好的这四款骁龙8至尊版新机不仅仅是性能强

全国首创“科漂驿站” 合肥加快打造“科漂乐园”

如何轻松查看电脑网速，提升网络体验的实用技巧与方法

广西强强碳素股份有限公司深耕预焙阳极产业——绿色智造降碳减污

铝土矿里炼出新镓值（这些豫企相当潮）

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响