【CNMO新闻】大模型的热潮正席卷各行各业,据CNMO了解,近日,行业领先的人工智能软件公司商汤科技与上海AI实验室等发布了“书生·浦语”大模型。
商汤科技
据媒体报道,商汤科技、上海AI实验室联合香港中文大学、复旦大学和上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。据悉,“书生·浦语”具有1040亿参数,基于“包含1.6万亿token的多语种高质量数据集”训练而成。
从全面评测结果来看,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力。其在综合性考试中更是表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各个科目的数据集。
CNMO获悉,早在今年3月,商汤科技便发布了多模态多任务通用大模型“书生(INTERN)2.5”。据官方介绍,“书生2.5”实现了通过文本来定义任务,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。此外,其还可根据用户提出的文本创作需求,利用扩散模型生成算法,生成写实图像。
据悉,“书生2.5”在图文跨模态领域的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合。此次最新发布的千亿级参数大语言模型“书生·浦语”,想必和“书生2.5”大模型有一定联系。