当前位置:首页|资讯|商汤|GPT-4

商汤发布“日日新5.0”全面超越GPT-4,小米SU7团队都来登门道谢,股价暴涨30%

作者:陈斯达发布时间:2024-04-24

文 | 李然

编辑 | 苏建勋

大模型时代依然活跃在舞台中央的“AI 1.0时代四小龙”之一的商汤科技,在昨天召开的技术交流会上,官宣了他们“云端边”的全栈产品矩阵。

在参加完发布会,和产品以及技术线的负责人聊了几个小时,试用了每一款发布会的产品,参观了商汤的算力中心之后,36氪最强烈的感受是:

在AI领域深耕了10年的商汤,终于在大模型这棵树上结出了行业中最丰硕的成果。它集合了大厂的深度和广度,创业公司的速度,成为了全国,甚至全世界范围内都独一无二的“AI综合体”公司。

一句话概括商汤新发布的内容:模型能力上打GPT-4,落地应用下接千行百业。

商汤发布的产品线,几乎覆盖了国内外主流AI大厂和头部公司的核心业务:

  • 对标OpenAI,Anthropic以及谷歌的基座大模型日日新大模型5.0

来源:商汤

  • Midjourney和Stability AI这样公司的开源/闭源的文生图模型和社区;

来源:商汤

  • 国内其他AI大厂和巨型独角兽相似的基于基座模型的行业应用落地能力。

来源:商汤

小米SU7团队专门来发布会上感谢商汤提供的支持

而在初创公司瞄准的赛道上,商汤也卷出了自己的一片天:

  • 端侧模型让手机一秒就生图;

来源:官方

  • 代码/办公小浣熊等实用功能继续更新,造福几十万辛苦打工人;

来源:官方

  • 推出AI边缘硬件,让需要低成本本地化AI解决方案的组织,也能享受定制化AI带来的效率提升。

来源:官方

纵观商汤在发布会上亮相的这一系列产品和服务,它的业务可以理解为两条线,一条线是遵照“Scaling Law”,不断扩充基础模型的能力;另一条线是以强大的基础模型能力为根基,将模型能力尽可能的落地到任何能够提升效率,体现价值的场景。

商汤用业内几乎最长的产品线,把自己的客户横跨的行业范围从西二旗拉到了金融街;同时也让竞争对手名单,从硅谷的科技大厂排到了孵化器里的初创公司。

而就在发布会之后,商汤的股价也应声大涨,今日开盘即上涨超30%,最高冲至0.82港元。截至上午10时40分,商汤股价为0.8港元,成交额超10亿港元,涨幅31.15%。

来源:公开资料

以“Scaling Law”为尺,日日新5.0能力全面对标GPT-4-Turbo

发布会一开始,商汤没有着急给大家介绍自家的产品,反而是先科普了一条AI行业的基本原理——“Scaling Law”。

来源:官方

它之所以这么做,在36氪看来,商汤是想用“Scaling Law”说明,大模型的能力是可以不断提升并且预测的,。

在这个逻辑之下,GPT-4被祛魅。

而它所代表的行业天花板就不再是不可触碰的——只要不断提升模型参数,优化数据集,积累算力,模型能力就能稳步提升。

达到甚至超越GPT-4就不再是遥不可及的目标以及自欺欺人的自嗨,而是一个客观的现实。

而最新版的日日新SenseChat 5.0也在商汤不断努力之下,确实做到了各方面能力都可以对标GPT-4。

来源:官方

除了性能之外,他的主要亮点还体现在下面几个方面:

第一,采用混合专家架构(MoE),能够完成6000亿的参数,并且激活少量参数就能完成推理,保持推理效率。第二,基于超过10TB tokens的训练数据,并具有几千亿的合成数据。第三,推理上下文窗口达到200K 。第四,增强知识、推理、数学、代码能力,全面对标 GPT-4 Turbo。

在模型输出与GPT-4-Turbo的横评对比中,我们印象最深的一个例子是:

有13个小朋友玩老鹰抓小鸡,1人扮演老鹰,12个扮演小鸡,已经抓了5只小鸡,还剩几只?

GPT-4给出答案是抓了5只当然还剩8只,商汤模型给的答案还减掉1只老鹰,所以还有7只没有被抓住。

来源:官方

可以看出商汤的日日新大模型5.0在对中文语料的理解上,确实是比GPT-4更接近于现实世界的情况。

超越GPT-4V的多模态能力

根据商汤技术测负责人透露,商汤日日新大模型的多模态能力是和谷歌Gemini类似,采用了原生的多模态技术,而业界包括很多GPT-4V在内,很多模型的多模态能力还是基于在语言模型上嫁接其他模态的能力而达到的。

因为采用了一个更加高级多模态实现方式,所以“日日新5.0”的图文感知能力达到全球领先水平。

在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU取得领先成绩。

来源:官方

而在图像生成方面,商汤模型的效果和行业内其他3个最常用模型比起来也非常惊艳。

来源:官方

由于跟新了业内最新的技术,商汤生图模型“秒画”的文字表现能力明显强于其他3家。

而已经造福了几十万打工人的小浣熊工具,也获得了强力更新,能够在用户使用过程中不断自己迭代和学习,产生符合用户需求的输出。

发布会上,商汤演示了将F1赛车手周冠宇三年的参赛记录输入到系统中,并让它绘制出参与比赛数量的柱状图。

来源:官方

任务看似简单,但实际上牵涉到复杂的识别难题。办公小浣熊在和用户的交互过程中,不断克服识别障碍,最终成功获取到了用户的需求数据,按照用户要求进行了输出。

率先完成“云端边”全栈布局

前瞻洞察中心化算力需求向端侧扩展的未来趋势及企业级在边缘侧的AI需求,商汤在业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

端侧大模型实现行业SOTA

今年是端侧大模型应用的元年,为了满足移动终端用户对大模型技术的应用需求,商汤推出日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。

来源:官方

商汤还推出端云协同解决方案,可通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而显著降低推理成本。

商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。

来源:官方

扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端app快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

来源:官方

边侧推出大模型一体机,本地部署,降低大模型应用门槛

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤推出了企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。

来源:官方

相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

来源:官方

丰富的行业落地案例是商汤大模型综合能力的最强背书

发布会现场,商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

自2023年起,商汤与金山办公达成深度合作,基于“日日新”大模型的代码生成及工具调用能力,助力WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。

来源:官方

金山办公CEO章庆元表示:“在办公应用场景内,商汤大模型的表现十分出色,能够帮助我们的用户解决办公中的复杂问题,提升效率。”

金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。

海通证券副总经理兼首席信息官毛宇星谈到:“通过与商汤合作,我们利用大模型技术实现了海通证券数智化转型,未来,我们将结合全栈式AI能力进行业务流程、交互变革与数智化业务系统重构。”

来源:官方

在个人出行场景,小米汽车SU7的智能车舱中就应用了商汤的大模型技术,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。

来源:官方

小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”

此外,商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。商汤的所有行业大模型都是在华为昇腾原生生态上训练完成。

来源:官方

有了华为的支持,商汤就真的有底气,向各行各业提供软硬件一体的AI解决方案。

而这次发布会,商汤向世人展现了它在AI 2.0时代的野心——成为大模型时代集合硬件,行业服务,C端产品的“全栈供应商”。

商汤不仅要通过不断的技术迭代追逐AGI,还要在通向AGI的道路上让AI赋能每个行业,每个普通人。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1