当前位置:首页|资讯|商汤|生成式AI

商汤进入2.0时代:“日日新”大模型驱动生成式AI业务收入率先突破10亿

作者:每日经济新闻发布时间:2024-03-27

商汤进入2.0时代:“日日新”大模型驱动生成式AI业务收入率先突破10亿

3月26日,商汤科技发布了2023年度财务报告,展现出其在生成式AI领域的强劲增长势头。

2023年,商汤实现营收34亿元,毛利润为15亿元,毛利率44%。其中,“日日新”大模型+大装置驱动生成式AI业务爆发式增长200%,收入已达12亿元,为集团贡献35%的营收。

得益于“大装置+大模型”战略的前瞻性布局,商汤科技不仅在AI基础设施建设上取得了显著成就,更在生成式AI业务上实现了突破性进展。2023年的成绩单,展示出其在生成式AI领域的强大实力和广阔前景。随着AI技术的不断进步和应用场景的日益拓展,商汤科技将继续聚焦生成式AI核心业务,推动公司的持续高速增长。商汤科技的成功,不仅为行业树立了标杆,也为AI 2.0时代的来临奠定了坚实的基础。

生成式AI业务成增长新引擎

年报显示,2023年,商汤生成式AI业务收入达12亿元,这是商汤成立十年以来,以最快速度从无到有、超过10亿元收入体量的新业务。

此外,大装置的总算力规模实现突破性增长达12000petaFLOPS,运营GPU数量达45000卡,由此支持“日日新”大模型体系高速迭代至4.0版本,在多个场景中达到与GPT-4相匹配的能力水平。

商汤科技董事长兼CEO徐立博士表示:“生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求,这预示着中国硬科技投资的新周期正式开启。商汤通过在各业务层面深入融合生成式AI能力,正在赢得新客户,并推动效率和生产力的全面提升。”

回顾2023年,商汤“日日新”大模型系列不断经历重要的技术升级,每一次升级都稳居行业前沿,显示了商汤深厚的技术底蕴。到2024年2月,商汤推出“日日新4.0”,在不增加参数量的基础上,通过提高训练数据质量,实现了大模型性能的显著提升。在代码编写、数据分析和医疗问答等多个场景中,达到了与GPT-4相匹配的能力水平。

在坚实的技术基座支撑下,商汤的“日日新”大模型已在多个行业中确立了应用价值,广泛应用于金融、医疗、智能终端等多个领域。

大模型浪潮继续,生成式AI正逐渐成为各行各业的新宠,而商汤科技凭借其在大语言模型(LLMs)领域的深厚积累,成功将这一前沿技术转化为实际的商业应用,从而在激烈的市场竞争中占据先机。

2023年,商汤集团明确了新的三大业务板块:生成式AI、传统AI和智能汽车;以生成式AI业务为重点发展方向,同时保持传统AI业务和智能汽车的优势。商汤的这一调整背后,不仅标志着其在技术领域的变革性创新,更展现了公司在AI商业化道路上的坚定步伐。

“大装置+大模型”

构筑AI核心竞争力

竞逐人工智能,技术是最大的底气。在生成式人工智能迅速为商汤带来显著收入背后,实则是商汤在技术层面数次超前布局带来的收获。

在新一轮人工智能潮起前,商汤凭借其前瞻式布局,早早搭建起“大装置+大模型”协同战略,率先完成“模型即服务”。

商汤是较早投入人工智能基础设施的公司,自2018年起便开始大力投入人工智能基础设施建设,特别是在SenseCore大装置上的持续投资,为公司在AI领域的长远发展奠定了坚实的基础。此外,商汤科技此前顶住亏损压力大力建设的临港AIDC,作为亚洲规模领先的AI计算中心,如今不仅提供了强大的算力支持,也为大模型的研发和迭代提供了有力保障。

商汤也是国内较早研发大模型,且是较早发布大模型系列产品的厂商。其预训练基模型InternLM-104B(1040亿参数)在35个评测集上性能超越OpenAI的GPT-3.5-turbo。

基于“大装置+大模型”的协同,在过去一年的“百模大战”中,商汤已成为少有的能够保持大模型高速迭代的公司。

基于业界性能领先的AI基础设施和模型服务,商汤的客户模型训练、微调和推理等业务都在爆发式增长。该业务中超过70%的客户在过去12个月内是商汤的新客户,而剩下的30%的存量客户客单价也录得了约50%的增长。典型客户来自各行各业,比如三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,清华大学、上海交通大学等学术机构。

此外,在大模型时代,商汤的前瞻性布局还在继续。此前,商汤率先推出“模型即服务”商业模式,重点关注软件调用能力,使客户能够轻松地进行大装置微调和调用各类生成式AI能力,而无需管理底层基础设施。

在弗若斯特沙利文发布的《2023年中国AI开发平台市场报告》中,商汤在增长指数和创新指数两大评估维度的综合评分中位居国内首位。这一成绩不仅展示了商汤在生成式AI领域的领先地位,也表达了对其创新能力和市场扩张速度的认可。

技术创新

推动业务持续增长

商汤也在年报中提到,目前的生成式AI模型能力远未达到上限,“日日新”大模型的能力每隔三个月就会显著提升,从而在企业中的应用也会随之升级。

目前,商汤正致力于“日日新5.0”版本的研发,该版本计划4月份发布,将全面达到GPT-4-turbo的标准,同时支持百万字无损上下文,并且它的多模态模型能力也将全面对标GPT4V。

商汤“日日新”大模型的持续迭代和优化,不仅反映了公司在人工智能领域的技术追求与创新,也持续体现了其将前沿科技转化为实际应用价值上的决心和能力。

举例而言,在金融行业中,商汤通过精进模型的检索增强生成(RAG)技术,显著提升了模型的数据处理和问题回答能力。利用RAG技术,金融数据被高效地映射到矢量数据库中,强化了模型的金融知识储备,有效降低了错误信息生成(俗称“幻觉”现象)的发生率。这一突破使得模型能够精准回应专业的金融查询,因此,包括中国银行、招商银行、中国工商银行和上海银行等在内的诸多知名银行已纷纷采用“日日新”大模型,以构建其“数字员工”和“数字客服”系统,以期提供更加智能化的客户服务体验。

在智能终端领域,商汤也提到,2024年是端侧大模型应用的爆发之年。商汤基于在智能终端的多年积累,构建了行业领先的、不同规格的小模型。例如,同样是7B模型,商汤的性能领先于Meta的Llama2和谷歌的Gemma。2023年,高通、MTK在发布会上展示了商汤子公司慧鲤生成式AI端侧模型在其旗舰芯片上的应用成果;商汤的7B级小型模型在高通最新款芯片上,实现了业界领先的16tokens/秒的推理速度。

这些智能终端模型对于AI手机来说至关重要,它们能够听取用户的指令,并调用手机上的各类应用程序完成复杂任务。商汤已与小米、荣耀等手机品牌合作,共同研发这些创新的功能特性。

2024年,“技术领先”依旧是商汤的关键词。

商汤方面也表示,将进一步发挥“大裝置+大模型”的深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力。将持续投入“日日新”大模型体系的迭代,让模型能力保持业界领先。同时,还将致力于实现大模型推理效率提升的“摩尔定律”,通过云+端结合等创新优化策略,让模型推理成本迅速降低,从而打开更广阔的应用前景。

基于技术领先优势,商汤的业务增长提速也有望提上日程。商汤方面表示,将加快生成式AI的商业化进程和市场渗透,为用户提供具有最优性价比的生成式AI解决方案。

商汤在年报中表示,“在我们迈向通用人工智能(AGI)的征途上,尺度定律(Scaling Law)扮演着至关重要的角色。我们所见证的大装置和大模型在过去一年所取得的突破性进展,仅仅标志着这一旅程的开始。当前生成式AI模型的能力尚未触及其潜能的顶峰,我们预期这些模型的能力将持续增强,并在企业中实现更高级别的应用。”

(本文不构成任何投资建议,信息披露内容以公司公告为准。投资者据此操作,风险自担。)

编辑|蒙锦涛

每日经济新闻


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1