近3000道题，商汤大模型拿了金牌

作者：商汤科技SenseTime发布时间：2024-11-08

模型表现好，金牌少不了。

刚刚，中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》：

商汤日日新·商量大模型（SenseChat5.5）凭借出色的能力表现，总得分位列国内大模型第一梯队，获得金牌。

本次SuperCLUE10月报告覆盖23个国内模型，聚焦语言大模型的通用能力评估，分为三大维度：除了考察“文科”、“理科”基础能力外，还有考察模型更高阶能力的“Hard”附加任务，总共2900+道题：

【理科任务】分为计算、逻辑推理、代码、工具使用测评集；

【文科任务】分为知识百科、语言理解、长文本、角色扮演、生成与创作、安全六大测评集；

【Hard任务】分为精确指令遵循测评集，复杂任务高阶推理测评集。

商汤SenseChat5.5在多项评测任务中均位列第一梯队，文科中语言理解、安全等维度表现突出，也是理科中逻辑推理、代码学科的“尖子生”。

值得注意的是，在【Hard】的两项任务——精准指令遵循和高阶推理中，商汤SenseChat5.5是唯一两项任务均位于国内第一梯队的大模型，体现了模型优秀的复杂推理智能。

未来，商汤将继续坚持基础大模型的持续研发与投入，不断提升真正高阶推理及“慢思考”能力。

近期资讯

中国首富新面孔！80后“狠人”张一鸣，用算法优化人生

资本的变化，普通人难以想象。 10月29日，胡润研究院发布《2024衡昌烧坊·胡润百富榜》，字节跳动41岁的创始人张一鸣财富比去年增长1050亿元，以3500亿元人民币第一次成为中国首富。 [图片] 而70岁的农夫山泉创始人钟睒睒此前已连续三年位居中国首富，此次他则以3400亿元的财富，位列胡润百富榜第二位。53岁的腾讯创始人马化腾财富比去年增长350亿元，以3150亿元位列第三。在前十榜单中，拼多多黄峥以2450亿元位列第四；美的何享健及其家族以2350亿元位列第五；宁德时代曾毓群、网易丁磊和长江实业

萌解创投 2024-11-02

皇天惊虞 2024-11-02

聚氨酯（PU）模具发泡的优势

聚氨酯（PU）模具发泡材料的优势一、物理性能方面高强度聚氨酯PU模具发泡材料的抗拉强度很高，是普通材料的两倍之上，这使其在承受拉力的情况下不易断裂或损坏，在需要一定强度支撑的模具应用场景中表现良好。比如在一些对结构强度有要求的大型模具部件中，它能较好地维持形状和功能。轻质特性由于其内部的气孔结构，聚氨酯发泡材料具有很轻的密度，这一特性使得在模具制作中可以减轻整体重量。例如在一些需要移动或者对重量有特殊要求的模具应用中，采用这种轻质的发泡材料就比较合适，它有助于提高使用便捷性。柔软与弹性该发泡

聚氨酯PU发泡 2024-11-02

库尔斯克难道比顿巴斯重要？

入侵俄罗斯库尔斯克州的战略目标究竟是什么，这里到底值不值得乌克兰倾尽全力去攻打，难道库尔斯克真的比顿巴斯还重要吗？日前，一名乌军上将向泽连斯基和瑟尔斯基们的“灵魂”发问，不禁让人联想到乌军被困库尔斯克战役的窘境，也让人联想到二战中的“阿登反击战”，纳粹德国的垂死挣扎，最终却加速了自己的灭亡。库尔斯克，这个曾经在二战中见证了苏联红军辉煌胜利的地方，如今却成了乌军的一场噩梦。历史不会重复，却有惊人的相似，那么乌军是否也在重蹈当年德军的覆辙呢？当年，希特勒认为，只要在西线搞一次大的“突袭”，就能逼迫盟军坐下来谈

俞洁讲武堂 2024-11-02

食堂采购系统源码：实现供应链管理平台功能模块的技术实践

在当前数字化转型浪潮中，餐饮和食堂管理的需求越来越高，食堂采购系统逐渐成为企业和组织优化管理、降低成本的关键工具。一、食堂采购系统的核心功能概述一个完善的食堂采购系统不仅需要具备传统的订单管理、库存管理、供应商管理功能，还应融入智能化的供应链管理模块，以提升整体管理效率。主要功能模块包括： 1.订单管理 2.库存管理 3.供应商管理 4.财务管理 5.数据分析这些功能模块是食堂采购系统源码的基础架构，也是实现供应链管理的核心支撑。 [图片] 二、实现食堂采购系统的技术选型在开发食堂采购系统时，

万岳软件开发小城 2024-11-02

新手入行废旧光伏板回收处理行业该如何做

废旧光伏板的回收处理是一个具有重要意义和挑战性的课题。废旧光伏板回收处理行业不得不说的那些事，新手入行废旧光伏板回收处理行业该如何做？废旧光伏板破碎分选设备多少钱？投资废旧光伏板回收处理生产线需要多少费用？带着这些疑问，小编总结了以下几点，希望可以给大家一些借鉴。 [图片] 一、回收渠道回收渠道是基础，也是重中之重，没有回收来源，后面的一切就是一纸空谈，所以必须有大量的物料支持，可以和光伏板厂家合作，或者从个人手中进行回收。在这里要说的是，大量的现金支持是非常必要的。二、场地需要回收来

仟川废家电拆解设备 2024-11-02

近3000道题，商汤大模型拿了金牌

推荐体验

相关资讯

大模型落地卡在哪？讯飞星火解出三道题

AI抢攻人类奥赛金牌，DeepMind数学模型做对25道IMO几何题，GPT-4惨败得0分

测试了9家大模型，做不出一道小学奥数题

10道数学题，讯飞星火V3.5升级版和商汤商量5.0的得分亮了

Google Bard 大更新！我们用 GPT-4 给它出了 20 道题

近期资讯

中国首富新面孔！80后“狠人”张一鸣，用算法优化人生

基于 FMEA 的智能制造质量控制策略_SunFMEA软件

昂科烧录器支持Cmsemicon中微半导体的专用芯片CMS32M6510GE24SS

熬了8晚，我将高中生物三年重点知识汇成16张图，建议收藏打印！

高中英语完形填空答题规律！10页纸！一次性搞定

计算机新路程@

聚氨酯（PU）模具发泡的优势

库尔斯克难道比顿巴斯重要？

食堂采购系统源码：实现供应链管理平台功能模块的技术实践

新手入行废旧光伏板回收处理行业该如何做

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响