今天分享的是【中文大模型基准测评报告2023-ChatGPT发布一周年特别报告】 报告出品方:SuperCLUE
自2022年11月30日ChaPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为二个阶段。即准各期 1ChaGPT发布后国内产学研讯速形成大德型共识),成长期 国内大部型数量和质量开始逐渐增长)、煤发期1各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势) .
中文语言理解测评基准CLUE (The Chinese LanguageUnderstanding Evaluation) 是致力于科学、客观、中立的语言模型评测恭准,发起于2019年。陆续推出CLUE、FewCLUE、KgCLUEDataCLUE等广为引用的测评基准.
SuperCLUE是大模型时代CLUE基准的发展和延续。聚焦于通用大模型的综合性测评,传统语言模型测评往往局限于学术范围的单轮选择题SuperCLUE根据多年的测评经验,基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。
免责声明:以上报告均系本平台通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权,请联系删除 ;资料为推荐阅读,仅供参考学习,如对内容存疑,请与原撰写/发布机构联系