商汤“大模型超市”日日新4.0上新语言大模型比肩GPT-4

作者：IT时报发布时间：2024-02-05

来源：IT时报作者：孙妍

近日，商汤科技发布“日日新SenseNova 4.0”，升级了知识覆盖、推理能⼒、长⽂本理解力、数字推理能⼒和代码⽣成能⼒，并⽀持跨模态交互。日日新·商量大语言模型-通用版本（SenseChat V4），支持128K语境窗口长度，综合评测成绩比肩 GPT-4 ，已经全⾯超越GPT-3.5。

商汤还率先推出⽇⽇新·商量大语言模型Function call & Assistants API 版本，支持不同模态工具调用，降低开发者使用大模型的门槛。同时，商汤也将大模型能力落地，基于⽇⽇新·商量大语言模型Function call & Assistants API 完成开发并发布数据分析工具“办公小浣熊”。

商汤“日日新Sense Nova”宛如一个大模型超市，包括面向办公场景的商汤⽇⽇新·商量语⾔⼤模型-数据分析版本、面向医疗场景的日日新·商量语言大模型-医疗版本“大医”、面向自动驾驶及工业场景的日日新·商量多模态大模型，以及面向创作创意场景的日日新·秒画文生图大模型等应用。

商汤想以“大模型+”拓宽边界，让AI能力能够随取随用。其中，商汤“⽇⽇新·商量大语言模型”在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等垂直行业，已与超过500家客户合作。

“大模型超市”上新，AI随取随用

“日日新SenseNova 4.0”提供了多种API接口和服务，开发人员可以根据实际应用需求调用各项AI技术能力，成本更低、效率更高。

那么“日日新SenseNova 4.0”到底有多大能力？其中，日日新·商量大语言模型-通用版本（SenseChat V4）代表了其语言建模能力，目前支持4k、32k、128k tokens不同窗口，拓展了模型应用范围。

SenseChat V4 综合评测成绩水平比肩GPT-4 ，其中推理和代码编程的测评表现更是超越了GPT-4。在权威测试集HumanEval Coding的测试中，一次通过率达到75.6%（GPT-4此项数据为74.4%）。

在数据测试集的1000多道题目中，商汤⽇⽇新·商量语⾔⼤模型-数据分析版本以85.71%的正确率超过GPT-4，支持复杂表格、多表格、多文件的理解，实现数据清洗、数据运算、比较分析、趋势分析、预测性分析、可视化等常见数据分析任务，适用于财务分析、商业分析、销售预测、市场分析、宏观分析等多个应用场景。

商汤推出的日日新·商量语言大模型-医疗版本“大医”升级了多轮对话与上下文理解能力、工具调用能力，有效实现专业医学问答及复杂医学任务推理，并支持更多模态医学文件的智能解读和交互问答。“大医”在两项行业权威评测——2023年职业药剂师考试大模型评测、中文医疗大语言模型开放评测平台MedBench中，均实现综合评分排名第二，性能逼近GPT-4，其中职业药剂师考试大模型评测中的两个细分方向性能已超越GPT-4。

2024年，人工智能大模型重要的技术演进方向是多模态，日日新·商量多模态大模型拥有300亿参数，图文理解能力处于全球领先水平，在权威评测基准测试集MME Benchmark上综合得分排名首位，得分达2199.5（超过GPT-4V的1926.57），已在智能驾驶、智能车舱、电力行业等多个实际场景落地应用。

商汤自研的日日新·秒画文生图大模型的参数量提升至百亿量级，通过算法优化，语义理解能力与图像质感细节表现显著增强，可以生成电影级海报。秒画SenseMirage-Turbo V4版本对外发布，相较于V4基础版本，可达到10倍推理加速效果。

大模型时代的专属开发助手

令开发者兴奋的一大更新是，⽇⽇新·商量大语言模型Function call & Assistants API 版本发布，为开发人员提供一个灵活、高度可定制的工具调用框架，提供了联网搜索、代码解释、图文问答、⽂⽣图等多种⼯具调⽤，⽀持商汤⽇⽇新⼤模型体系。

与其他同类产品相比，⽇⽇新·商量大语言模型Function call & Assistants API 版本率先支持不同模态的工具调用，能够支持图文结合的多模态交互和数据分析代码执行结果的直观呈现，让各种应⽤程序中集成AI功能变得更加简单和⾼效。

重塑办公应用

大模型的出现带来了人机交互范式的巨大变革，商汤“日日新Sensenova”小浣熊家族再添新成员——数据分析工具 “办公小浣熊”，重塑大模型时代的办公应用。

输入表格，向办公小浣熊说一句“请用箱型图展示不同类型App的平均使用时长”，无需编程或复杂操作，它就能自动将数据转化为有意义的分析结果和可视化图表，更适应中国的数据分析需求。

自2023年4月10日商汤“日日新SenseNova”问世以来，企业用户超过3000家，覆盖行业包括互联网、游戏、文旅、教育、医疗健康、金融和编程等，“日日新”也被称为“大模型超市”，它大大降低了千行百业使用大模型的门槛，也正在从B端走向C端，让每个人都能走向AI大模型时代。