当前位置:首页|资讯|AIGC|商汤

AIGC专题:商汤SenseNova5.0发布,全面接近GPT_4 Turbo水平

作者:好车友发布时间:2024-05-03

原标题:AIGC专题:商汤SenseNova5.0发布,全面接近GPT_4 Turbo水平

今天分享的是AIGC专题系列深度研究报告:《AIGC专题:商汤SenseNova5.0发布,全面接近GPT_4 Turbo水平》

(报告出品方:申万宏源研究院

报告共计:8

海量/完整电子版/报告下载方式:公众号《人工智能学派》

要点

2024年4月 23 日,商汤科技技术交流日上发布日日新 SenseNova5.0 大模型体系,完成云、端、边全栈布局,大模型综合能力全面对标 GPT-4 Turbo,聚焦数学、推理、编程和多模态能力上的提升。

持续探索知识-推理-执行的三层大模型能力架构。模型架构上:商汤日日新 5.0 采用了GPT4 等万亿参数模型试用的 MoE 机制。数据上:超 10TB tokens 中英文预训练数据结合数千亿 tokens 逻辑型合成数据,解决大模型对客观知识和世界初级认知的基础上提升高阶知识推理能力。

基础模型能力升级:综合、语言、常识能力超 GPT-4 Turbo。此前国内大模型在复杂逻辑、数学等能力上较海外仍有差距,日日新 5.0 的发布聚焦于这类高阶知识能力的提升,数学.代码能力在 GSM8K、GPQA、HumanEval 测试集上有所超越。多模态能力升级:国内大模型在“文生图”能力上均有迭代,但“图生文”能力展示较少,此前主流模型中仅阿里Qwen-VL 暂时能力位居前列。日日新 5.0 展现了图文感知能力的提升,在多模态大模型权威综合基准测试 MMBench 中综合得分排名首位,且在 OpenCompass 多模态大模型榜单中位居第二,仅次于 GPT-4V。

云、端、边全栈大模型布局。商汤端侧大模型能够用于手机、车载等终端设备,端侧大语言模型推理速度在中端平台能够实现 18.3 字/秒的平均生成速度,旗舰平台能够实现 78.3字/秒;扩散模型推理速度现场演示小于 1.5 秒,支持输出 1200 万像素及以上的高清图片边缘产品则推出了面向金融、医疗、政务、代码等垂类领域的商汤企业级大模型一体机支持企业级干亿模型加速和知识检索硬件加速。

根据我们内部测评:日日新 5.0 中文文字能力达 GPT-4 Turbo 水平;推理能力提升,但国产大模型的复杂推理能力整体较 GPT4 仍有差距;多模态能力上展现较强图生文能力,属于国内领先水平;办公助手产品定位数据分析能力,非常适用于非技术人士进行无代码数据分析。

此次发布启示:1)国内中文文字模型生成能力水平、上下文长度已经达到 GPT-4 Turbo水平,复杂推理能力上较 GPT-4 仍有差距。2)国内模型多模态能力正在来临。3)2024大模型在垂直场景的应用将持续深入。

整体来看,市场可能认为海外大模型选代放缓,但我们认为 2024 年模型能力仍然快速选代,包括 Open Al以外的其他模型能力追赶、Lama3 多模态等开源大模型发布、下半年OpenAl 的新模型迭代等。市场可能认为国产大模型能力与海外差距极大,无法支撑任何应用,我们认为商汤日日新、kimmi 等热度表明了国产大模型能力在文字方面已经达到GPT4 水平,高阶推理、多模态能力正在进行。

2024年4月23日,商汤科技技术交流日上发布日日新SenseNova5.0大模型体系完成云、端、边全栈布局,大模型综合能力全面对标 GPT-4 Turbo,聚焦数学、推理、编程和多模态能力上的提升。

持续探索知识-推理-执行的三层大模型能力架构。模型架构上:商汤日日新 5.0 采用了GPT4 等万亿参数模型试用的 MoE 机制。数据上:超 10TB tokens 中英文预训练数据结合数干亿 tokens 逻辑型合成数据,解决大模型对客观知识和世界初级认知的基础上提升高阶知识推理能力。

基础模型能力升级:综合、语言、常识能力超 GPT-4 Turbo。此前国内大模型在复杂逻辑、数学等能力上较海外仍有差距,日日新 5.0 的发布聚焦于这类高阶知识能力的提升数学、代码能力在 GSM8K、GPQA、HumanEval 测试集上有所超越。

报告共计:8页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1