4月24日消息,商汤科技SenseTime昨日举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,“日日新SenseNova 5.0”综合能力全面对标GPT-4 Turbo。受此消息影响,商汤科技今日开盘股价即上涨近35%,最高冲至0.82港元。截至上午10时22分,商汤股价为0.8港元,成交额超8亿港元。
据悉,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到200K左右。
本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。
同时,“日日新5.0”在多模态能力方面实现领先。商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。
应用产品层面,“日日新5.0”也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。
此外,此次商汤科技领先业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。
本次活动现场,商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景,凸显在大模型落地层面的先发优势。
来源:金融界