AI光年｜商汤日日新大模型升级，官宣赶超 GPT-4 Turbo

作者：腾讯新闻深网发布时间：2024-04-23

作者｜薛芳

编辑｜康晓

出品｜深网·腾讯小满工作室

2024年4月23日，上海商汤科技SenseTime举办技术交流日活动，发布行业首个“云、端、边”全栈大模型产品矩阵，以满足不同规模场景的应用需求，并且升级“日日新SenseNova 5.0”大模型体系，其综合能力全面对标GPT-4 Turbo，加速生成式AI向产业落地。

在人工智能发展的最基本法则——尺度定律（Scaling Law）的准则下，商汤持续寻求最有数据配比并建立数据质量评价体系，推动自身大模型研发的同时，也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

商汤科技董事长兼CEO徐立表示：“商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”

自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据，全新的“日日新SenseNova 5.0”（以下简称：日日新5.0）采用混合专家架构，推理时上下文窗口可以有效到 200K 左右。

本次更新主要聚集增强了知识、数学、推理及代码能力，全面对标 GPT-4 Turbo，主流客观评测上达到或超越 GPT-4 Turbo。

本次“日日新5.0”另一大核心指标就是多模态能力，商汤多模态大模型的图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多个知名多模态榜单MathVista，AI2D，ChartQA，TextVQA，DocVQA，MMMU 取得领先成绩。

“日日新SenseNova5.0”在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力。

商汤科技首次推出“云、端、边”全栈大模型产品矩阵，其中包括应用于终端设备的“商汤端侧大模型”，以及面向金融、代码、医疗、政务等多个领域的边缘产此次品“商汤企业级大模型一体机”。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求，商汤正式推出企业级大模型一体机，可同时支持企业级千亿模型加速和知识检索硬件加速，实现本地化部署，即买即用，降低企业应用大模型的门槛。相比行业同类产品，推理成本节约80%，检索大大加速，CPU工作负载50%。

此外，今天商汤还发布了基于昇腾原生的行业大模型，共同打造面向金融、医疗、政务、代码等大模型产业生态。在自身应用方面，商汤“日日新SenseNova5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。

推荐体验