商汤在生成式AI上确立正向曲线。
作者 | 贝壳XY
编辑 | 小白
AI迈入2.0,意味着要打破1.0时代单领域、多模型的限制,用无需人工标注的海量数据训练跨领域知识的基础大模型,高泛化地适配和执行各种各样的任务,真正实现“赋能”千行百业,这也是AI2.0的关键价值。
第一个爆款应用是生成式AI,也就是国内流行的AIGC(人工智能内容生成),初步实现了从“辅助”人类到“替代”人类的进阶,而这仅仅只是AI2.0的开端。
在此当中,商汤成为了快速摘到果实的企业。
2023年,商汤的生成式AI收入达11.84亿元,实现了同比200%的飞速增长,是业界快速突破10亿的公司之一。商汤称:“这是商汤成立十年以来,以最快速度从无到有、超过10亿收入体量的新业务。”
在此带动下,2023年全年商汤实现收入34.06亿元,其中生成式AI收入占比达34.8%,相较2022年提升了24个百分点。
(来源:商汤2023财报)
商汤是如何做的呢?
前瞻性布局“大装置+大模型”,抢市场先机
早在2014年,商汤就以人脸识别技术起家了。但其目标绝不仅限于视觉AI,而是做全能型的AI选手。
01率先自建SenseCore大装置,算力居亚洲前列
在生成式AI世界的中心,以GPU为代表的智能算力是根本基石,它支撑着庞大的系统和训练、推理任务。
特别在当前全球追逐AI大模型的浪潮之下,算力需求集中爆发,近乎影响着整个人工智能时代的发展演进,这就好似工业时代的电力先行,甚至成为大国博弈的核心竞争力。
而当下,算力供给却相对有限,算力成为一种稀缺性资源,近一年更被直接看做“钱袋子”。
但对于商汤科技而言,算力似乎与“稀缺”搭不上边,这就不得不提及其前瞻性布局的算力中心。
2018年起,商汤在自建算力中心的基础上,着手打造了SenseCore AI大装置;2020年斥资56亿元在上海临港建设了AIDC智算中心,并于2022年正式运营;2023年又在上海、深圳、广州、福州、济南、重庆等地拓展了新的计算节点。
(来源:商汤官方微信)
商汤的SenseCoreAI大装置以AIaaS的模式面向行业伙伴提供服务,具体包括计算基础设施服务(Iaas)、深度学习平台服务(Paas)、模型部署及推理服务(Maas)三大部分。
在Iaas层面提供高性能计算资源,截至2023年底共上线GPU4.5万块,相较2023年3月底增加1.8万块。在复杂的国际形势和地缘政治危机下,总算力实现了翻倍增长,目前达到12,000 petaFLOPS。
在Paas层面提供深度学习平台和大模型训练服务,现已在最大程度实现了万卡的超大集群互联,保持90%的加速效率,达到了30天稳定训练不间断的能力,并将出现训练间断时的诊断恢复时长也优化到了半小时。
同时,商汤现已开源了InternLM2-7B(70亿参数)与20B(200亿参数)两种基模型,性能超越了Meta的Llama2和谷歌的Gemma等同级别的开源模型,被认为是性能最好的轻量级基模型。
在Maas层面针对30多款芯片、100多个平台进行了常规模型的适配和优化,并在2023年增加对华为昇腾、寒武纪等主流国产芯片的适配,一年内将推理服务的性价比提升3倍,以此为客户提供业界性价比最优的大规模弹性推理服务。
实现这一点的关键,在于商汤联合开发的DeepLink开放计算体系,其是目前国内并行计算平台里的佼佼者,有300多个标准化算子接口,基本上CUDA能够支持的AI大模型计算需求,DeepLink也完全能够支持,覆盖率在99.5%以上。
有了DeepLink,各类国产芯片就可以轻松适配主流的大模型训练框架和算法库,比如PyTorch、DeepSpeed等常见的开源训练框架,还有商汤推出的OpenMMLab、OpenDILab、OpenGVLab等开源算法库,充分发挥国产芯片的性能。
目前,商汤的SenseCore大装置可有效支持20个亿参数量超大模型(以千卡并行)并行训练,最高可支持万亿参数超大模型的训练,并新增了对多模态模型和混合专家模型的支持。
2023年以来,已有上千个参数量数十亿至上千亿的大模型在SenseCore大装置上完成训练,实现了领跑行业的技术迭代速度,服务客户不乏小米、阅文、微博等行业领军企业,以及HiDream.AI、澜舟科技、Tiamat等AI初创公司。
放眼国内乃至亚洲市场,商汤的智算中心在算力质量上基本稳居第一梯队。
(来源:国资委官网、国际科技创新中心官网、各公司公告等)
截至目前,商汤的SenseCore大装置仍处于持续升级中,商汤表示预计在2024年将会更大面积地拓展全国算力节点,辅以国产算力芯片的配置,持续输出丰厚的新质生产力,为后续规模化获客以及生成式AI发展提供基础。
02“日日新”大模型高速迭代,性能居国内第一梯队
正是基于SenseCore大装置的强大算力,商汤建立了“日日新”大模型体系,不仅包括通用能力更加强大的基础模型,还高效融合了不同垂直领域的专业知识,以实现模型在不同行业的落地应用。
商汤也借此成为国内首个发布超过千亿参数级大模型的厂商,国内首个具备训练性能超越GPT3.5基模型的厂商。
以日日新•商量SenseChat为例,是一款基于自然语言处理技术的人工智能大语言模型,商汤在2023年4月发布后,一年内又迭代升级了3个版本。
日日新•商量3.0版,在全球51个知名评测集共计30万道问题集合上测试成绩排名第二,超越GPT-3.5-turbo以及Meta的LLaMA-2-70B等模型,在中文通用大模型综合性评测基准SuperCLUE总排行榜中,位列中文大模型榜单第一。
(来源:SuperCLUE官网)
2024年2月,商汤又快速迭代出日日新4.0版本,在代码编写、数据分析和医疗问答等多场景中达到了与GPT-4相匹配的能力。目前正致力于研发能够全面对标GPT4V的5.0版本,预计于今年4月发布。
还有日日新•秒画SenseMirage,是一款融合了超10亿参数的自研文生图生成模型,在历经约2,000张GPU的投入训练后,已于2023年7月迭代到4.0版本。
这一版本的基模型参数量提升至百亿,采用全新的生成模型架构,实现专业摄影级的图片细节刻画,叠加十倍级推理加速的优化,成为国内最好用的文生图产品。
基于此,商汤还要进一步创建文生视频大模型,达到电影级流畅画质。
此外,商汤还推出了“模型即服务”商业模式,使客户能够轻松地在大装置微调和调用各类生成式AI能力,无需自己建设和管理底层基础设施。
“日日新”模型的代码生成及工具调用能力也在赋能数字化办公的领域中取得了不错的成绩,特别是在赋能金山办公WPS的Copilot应用中展现了显著的技术优势。
该模型在SuperClue代码评测中荣获榜首,其HumanEval测试集的一次通过率高达76%,超越了GPT-4的74%的成绩。
总的来说,根据弗若斯特沙利文发布的《AI大模型市场研究报告(2023)》,商汤的AI大模型在产品技术、战略愿景、生态开放构建等综合竞争力,在2023年位列国内第一。
更为重要的是,大模型的研发并非一次性成果,而是需要连续不断的迭代升级,目前商汤的“日日新”大模型基本每季度迭代一次,国内能做到这一频率的大模型厂商实际上并不多。
时至今日,商汤“大装置+大模型”的前瞻性战略价值和管理层长远眼光已然得到证明,筑牢了领先于其他同业的科研实力与技术底蕴。
以传统式AI为基,聚焦生成式AI
“大装置+大模型”只是第一步,商汤进一步的目标是完成大模型业务闭环,让生成式AI真正商业化,实现价值的有效循环。
01过往商业化经验为生成式AI赋能
谈及商业化,除了具备强大的算力和模型外,丰富的实战经验同样不可或缺。
一方面,商汤深耕AI多年,在AI1.0时代就赋能了不少垂直行业,并在智慧城市、智慧商业、智能汽车和智慧生活四大板块的20多个场景中实现落地。
(来源:商汤微信公众号)
而这每一次场景赋能,背后都有丰富的高质量数据做支撑,数据背后更是蕴含着多年的行业实践以及完整的客户服务体系。
正是凭借着商汤过去十年在实践经验上的积累、在多模态数据上的储备、以及在感知智能、决策智能上的积淀,有效强化其基础模型对物理世界的理解和多模态能力,才使得商汤能够推出最满足客户需求、具有性价比的生成式AI解决方案。
02传统AI客户带来虹吸效应
另一方面,在于传统AI业务客户带来的虹吸效应。
商汤在AI 1.0时代就积累了来自各行各业的优质客户,过往的这些优势客户,会由此背书产生虹吸效应,迅速转换为生成式AI客户,并吸引更多优质客户选择商汤大模型服务。
根据2023财报,在生成时AI业务中超过70%的客户在过去12个月内是商汤的新客户,而余下30%的存量客户的客单价也取得了约50%的增速。
商汤生成式AI的典型客户就包括三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,清华大学、上海交通大学等学术机构等。
拿智能终端的客户来说,自2015年起商汤便与全球几乎所有头部安卓手机厂商展开合作,由商汤的传感器、AISDK软件、AIISP芯片赋能的手机数量已经超过20亿台,这无疑都是商汤端侧生成式AI的潜在客户。
商汤基于AI 1.0时代在智能终端领域多年的积累,搭建了行业领先的、不同规格的小模型。
2023年,高通、MTK在其发布会上展示了商汤子公司慧鲤生成式AI端侧模型在其旗舰芯片上的应用成果;商汤7B级小型模型在高通最新款芯片上,实现了业界领先的16tokens/秒的推理速度。
这些智能终端模型对于AI手机来说至关重要,它们能够听取用户的指令,并调用手机上的各类应用程序完成复杂任务。目前,商汤已与小米、荣耀等手机品牌合作,共同研发这些创新的功能特性。
凭借着业界性能最好和推理速度领先的端侧小模型,有望打通这超过20亿台的已赋能客户群,或将在2024年实现端侧生成式AI业务的爆发。
智能汽车领域亦然,商汤推出的绝影平台是国内第一批率先激活L2++级别自动驾驶量产的服务商,截至2023年末,已累计交付195万辆智能汽车,覆盖90多款车型。
单是2023年,绝影便又新增了1,600余万台的定点订单,并扩充了41款车型,实现收入3.84亿,同比增长31.1%。
这些已经赋能的汽车客户,也有望搭载上商汤端侧小模型,为生成式AI打开新的应用场景。
总结:打通AI商业闭环,会帮助商汤实现业绩放量
商汤2023财报显示,其正迎来越来越多的規模更大、战略意义更深的客户合作。截至目前,其订单金额超过千万人民币的客户达到数十家,商汤日日新大模型赋能C端的调用量呈现近120倍的增长。
商汤科技前瞻布局的“大装置+大模型”,辅以丰富的商业化经验和客户资源,是商汤率先打通“大模型业务闭环”、在生成式AI业务上取得领先的关键所在。
接下来,商汤将把生成式AI作为核心业务持续深耕,进一步发挥“大装置+大模型”的深度协同优势,持续扩充算力规模,提升基础设施和大模型的综合服务能力,并带来高计算密度、高能效芯片的协同发展,为行业伙伴提供优质的算力和模型服务,推动业绩持续放量。
免责声明:本报告(文章)是基于上市公司的公众公司属性、以上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)为核心依据的独立第三方研究;市值风云力求报告(文章)所载内容及观点客观公正,但不保证其准确性、完整性、及时性等;本报告(文章)中的信息或所表述的意见不构成任何投资建议,市值风云不对因使用本报告所采取的任何行动承担任何责任。
以上内容为市值风云APP原创
未获授权 转载必究