今天分享的是AI 大模型系列深度研究报告:《AI大模型专题:大语言模型能力测评报告2024》。
(报告出品方:极客传媒)
报告共计:43页
海量/完整电子版/报告下载方式:公众号《人工智能学派》
在诞生阶段,以Transformer为代表的全新神经网络架构,莫定了大模型的算法架构基础,使大模型技术的性能得到了显著提升。在探索期,基于人类反馈的强化学习(RHLF)、代码预训练、指令微调等开始出现,被用于进一步提高推理能力和任务泛化。在爆发期,大数据、大算力和大算法完美结合,具备了多模态理解与多类型内容生成能力。
百度、阿⾥、腾讯、智谱AI、百川智能等多家企业和机构,按照《互联⽹信息服务算法推荐管理规定》履⾏算法备案和变更、注销备案⼿续,获得备案批准,对公众全⾯开放,标志着⼤模型发展进⼊新阶段,加速推动⼤模型产业化应⽤。 截⽌到2023年12⽉31⽇,已有两批超过20个⼤模型获得备案,⾯向公众开放。应⽤范围涵盖⾃然语⾔处理、图像识别、语⾳识别等多个领域,可应⽤于⾦融、医疗、教育等各个领域。
• 2023年公布的中国⼤模型产品中,84.57%的⼤模型产品为⾮通⽤⾏业模型。其中⼯商业经济、教育医疗占⽐均⾼于通⽤模型占⽐。
• 数据结果统计显示中国⼤模型产品发布时间集中于Q2和Q3,占⽐达全年的80.32%。
2023年国内主要科技公司在推出通⽤⼤模型的同时,也正在根据企业资源特征、⽤户使⽤场景、⽣态圈层需求等将通⽤⼤模型产品逐渐扩展成为覆盖多个应⽤场景的产品家族。⼤模型头部⼚商逐渐形成。
• 2023年9⽉起, 中国⼤模型产品开始陆续开放公众注册和使⽤功能。
• 以开发者为例,⽤户⼤模型产品开始使⽤时间67.17%集中在2023年下半年。
报告共计:43页
海量/完整电子版/报告下载方式:公众号《人工智能学派》