图片来源:摄图网
10月24日,2023科大讯飞全球1024开发者节在合肥开幕。会上,科大讯飞董事长刘庆峰表示,星火认知大模型V3.0已经超越了ChatGPT(GPT3.5)。他进一步解释称,根据《通用认知智能大模型评测体系》构建测试集,在10月16日至20日的测试中,星火认知大模型V3.0的中文能力客观测评超越ChatGPT,而根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标ChatGPT48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。
根据测评结果显示,星火大模型3.0版在医学、法律、教育、零售、汽车工程、计算机和工业设计行业的综合准确率均优于GPT3.5版,并且与GPT4.0各有优劣。尤其是在教育、医疗、法律行业表现突出,在医疗、法律行业分别超越GPT4 5.3%和4.1%,在教育行业的表现与GPT4差距小于1%。刘庆峰表示,和GPT4相比,科大讯飞“还有一个学习的过程”。
据介绍,根据国务院发展研究中心国研经济研究院的横评报告,讯飞星火大模型综合能力超越ChatGPT,甚至在部分行业优于GPT-4,处于国内领先、国际一流的地位。
——AI大模型是一种新的智能计算范式
超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。
——预训练大模型成为人工智能领导者的竞争焦点
预训练大模型是人工智能产业发展的必然选择,基于海量行业数据和知识,通过强大算力集群,预先训练基础模型,并结合应用场景的数据和各类需求,通过“预训练大模型+任务微调”的方式,进行“工业化”的高效率开发。开发者利用预训练大模型,只需要少量数据,就可以快速开发出精度更高、泛化能力更强的行业模型。预训练大模型可以提升人工智能项目开发效率,降低研发成本,缩短研发时间,解决人工智能项目碎片化的问题。
根据Omdia的数据,中国开发者对基于昇思MindSpore打造的盘古NLP大模型最感兴趣。首先,盘古NLP大模型在技术上处于领先地位,千亿参数模型,学习了40TB的中文文本数据,在中文领域有天生优势;其次,盘古NLP大模型可覆盖多个场景下语言处理的任务和需求,泛化能力强,在知识问答、知识检索、知识推理等文本生成领域有广泛应用前景;另外,盘古NLP大模型对开发者友好,可以让开发者能用拖拉拽的方式使用大模型,开发和生产成本低。这也从另外一个角度验证了盘古大模型的开放性,开发者可以跨平台快速调用盘古大模型,与其他工具和应用结合使用。
——市场份额分析
目前,中国AIGC行业互联网等大厂具有明显优势,纷纷将资源投入与主营业务结合,打造自己的大模型掌握行业定价权,实现自身生态更好的发展。故挑选了华为、百度、腾讯以及新晋独角兽企业小冰进行市场份额分析。
未来大模型和生成式AI往哪个方向走?在中国工程院外籍院士,清华大学智能产业研究院讲席教授兼院长张亚勤看来,现在差不多有200多个大模型,估计200多个其中190多个都会死掉,剩下的10个会扮演很重要的角色,哪个会生存、哪个会被淘汰,需要市场化的因素,要靠市场的竞争。但整体来讲,这是一个大的趋势。
张亚勤指出,我们的AI以后要更可控、更可信、更安全,因为大模型不仅仅有我们现在目前信安科技问题,可能还会有幻觉、也可以被人滥用,甚至对生存带来一些风险,所以必须在发展技术的同时要兼顾到风险。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《》。
同时前瞻产业研究院还提供、、、、、、、、、咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。