作为中国最早一批投入人工智能基础设施的公司之一,在成立的第十个年头,商汤迎来了自家生成式AI业务的爆发式增长。
3月26日,商汤在港交所披露其2023年业绩。财报显示,2023年商汤实现总收入34亿元,借助“大装置+大模型”的协同布局,其生成式AI业务在去年创造出11.8亿元的收入,增速近200%,营收贡献率达到35%。
在大模型遍地开花,呈现井喷式发展的契机下,生成式AI业务成为商汤以最快速度从无到有并超过10亿元收入体量的新业务。
“生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。”商汤科技董事长兼CEO徐立如是说。
前不久,徐立在2024全球开发者先锋大会(GDC)上曾发表主旨演讲。他表示:“最近,‘新质生产力’成为热议话题,尤其在开发者领域,生成式AI被视为引领生产力突破的技术,也标志着人工智能进入了一个新的发展阶段,我们称之为AI 2.0时代。”
与AI 1.0相比,AI 2.0标志着从基于规则的自动化处理向深度学习和自主学习能力的飞跃。这一跃进不仅提高了AI的理解能力,更赋予了机器创造性思考的可能性,从根本上改变了AI在社会各领域中的应用景象。
《新一代人工智能基础设施白皮书》认为,新一代人工智能基础设施将会通过支持大模型的爆发式发展,带来知识工程的生产力变革,重构软件生态,颠覆原有数字经济霸主,并随着本身的技术革新和突破,实现边际成本持续下降,边际效益持续增长等特征,进而实现AI算力成本的持续下降,真正带来普惠AI。
换言之,AI 2.0时代,人工智能将不仅仅只是效率的提升者,更成为推动未来社会进步和产业革新的关键力量。在这样一个关键节点,商汤凭借其"大模型+大装置"的协同策略突围而出。
查阅官方资料显示,不足一年时间,“日日新”大模型已升级至4.0版本,且其能力每隔三个月就会显著提升,迭代速度之快不仅揭示了生成式AI模型潜在的巨大发展潜力,也指向了其作为新营收支柱的可能性。
然而,标志着技术快速前进的道路并非全是平坦,挑战亦随之浮现。
相关数据显示,过去四年,大模型参数量以年均400%的复合增长率增长,AI算力需求的增长也超过15倍。如此庞大的数据量,以CPU为中心的传统计算基础设施已经无法满足需求。在这一背景下,必然需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地。
打铁仍需自身硬,因此,要想搭高楼,前提是要夯实地基。此时,算法、算力和数据的整合显得尤为重要,而商汤的前瞻布局则在此刻适时发挥了作用。
2018年前后,商汤开始每年数十亿投入到专为AI原生打造的智算云服务平台——SenseCore商汤大装置,并建设上海临港超算中心。五年时间里,商汤大装置的总算力规模突破性增长至12,000 petaFLOPS,上线GPU数量高达45,000卡。SenseCore商汤大装置已成为国内稀缺的大模型基础设施。
在算力和数据规模支持下,"日日新"大模型得以持续优化。以“日日新”4.0版本为例,其在代码编写、数据分析和医疗问答等多个场景中展现的能力,已与GPT-4不相上下。
立于AI 2.0的最前沿,商汤进一步率先推出“模型即服务”商业模式,使客户能够轻松微调和使用各类生成式AI功能,无需承担建设和管理底层基础设施的负担,为商汤在市场中带来众多正面评价。
作为国内首批符合《生成式人工智能服务管理暂行办法》的企业,商汤在生成式AI领域的爆发式增长并非一蹴而就,也绝非一日之功。
首先,过去十年间,商汤在感知智能、决策智能领域的积累,多模态数据的储备,强化了商汤基础模型对物理世界的理解和多模态能力,为其在生成式AI的发展和实践中打下良好基础。
其次,“大装置+大模型”的协同优势进一步提升,其大装置平台显著提升了大模型训练的支撑能力。除了万卡算力的加持,商汤还维持了高达90%的加速效率并实现了超过30天的稳定训练,训练中断恢复时间更是优化至半小时内。
第三,在实现从AI 1.0到AI 2.0的跃迁过程中,端侧部署的积累必不可少。自2015年起,商汤便开始同全球主要的安卓手机厂商和主流车企合作,将感知与决策类的AI模型植入至超过20亿台手机和数百万台汽车中,实现端侧推理的极致优化。
商汤的服务范围广泛,据财报披露,商汤已与包括全球科技巨头高通、国内三大电信运营商、金融领域的领军企业如招商银行、海通证券以及互联网行业的重要玩家如京东、小米、荣耀在内的广泛行业领域建立合作。
基于这一深厚积累,商汤率先推出了业界性能最优、推理速度最快的端侧小模型,例如,同样是7B模型,商汤的性能领先于Meta的Llama2和谷歌的Gemma。这一举措不仅帮助商汤有效地满足市场对高效、低成本AI解决方案的需求。
值得关注的是,在过去一年内,商汤生成式AI业务超过70%的客户为新客户,这不仅彰显了市场对商汤技术的广泛认可,也为公司业务增长注入了强劲动力。
商汤在端侧部署领域的成功实践,增强了商汤在技术竞争中的议价能力和市场影响力,为其在端侧生成式AI业务领域的未来扩张提供了广阔的空间。
最后,大模型“花样百出”,但最终仍需“落在实处”,商汤始终将AI技术在实际应用场景中的落地作为重点。“日日新”大模型已在金融、医疗、智能终端等多个行业展现出显著的应用价值,证明了其广泛的适用性和强大的业务推动能力。
在金融行业,商汤通过检索增强生成(RAG)技术,显著提升了 模型的数据处理和问题回答能力,中国银行、招商银行、中国工商银行等均采用“日日新”大模型构建其“数字员工”和“数字客服”系统。在医疗领域,其“商量 •大医”大模型能够提供专业的医疗知识问答服务,并具备医学图像的识别能力,已应用于多家顶级医疗机构,有效提升了医疗服务质量和效率。
综上所述,商汤在生成式AI领域的成功,归因于其在技术开发和商业应用方面的紧密集成。
从"大模型+大装置"战略,到感知智能、决策智能以及端侧部署的积累,再到AI落地应用场景,商汤完成了从研发到商业化应用的闭环,形成驱动商汤在该领域业务持续增长的关键动力。
下半场的竞争早已不限于技术本身,而在于生态拓展。
随着ChatGPT引发的大模型热潮和日益增长的大模型开发需求,在推进公司业务成长的同时,商汤也在驱动整个AI产业的的升级和质变的过程中,扮演着举足轻重的角色。
商汤科技董事长兼CEO徐立曾强调,AI大装置是商汤长线核心竞争力的标志,是公司持续经营和更大规模跃迁的护城河,以及推动AI时代生产要素降低的关键一步。
国际知名调研机构弗若斯特沙利文《2023年中国AI开发平台市场报告》显示,SenseCore商汤大装置可实现大模型推理效率提升600%,大模型增量训练降低90%。
依托SenseCore商汤大装置这一强大的AI开发平台,商汤正在为越来越多的企业提供算力支持,最新财报显示,商汤订单金额超过千万元人民币的客户数已达到数十家。从客户名单看,商汤的典型客户来自各行各业,比如三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,HiDream.ai、澜舟科技等创业公司、清华大学、上海交通大学等学术机构,,商汤已然成为大模型产业的推动者。
业内共识是,作为培育新质生产力的重要工具,生成式AI具有带来生产力突破的潜力。
在这一趋势下,通过开发先进的生成式AI工具,商汤正在重新定义生产力工具的边界,其秒画文生图模型的参数量已经升级至百亿参数级别;即将在4月推出的“日日新5.0”将支持百万字无损上下文。
过去一年,大模型赛道神仙打架,但能否真正实现应用落地,则成为检验大模型能力的关键。正因此,商汤的脚步并未完全停留于模型与平台开发上,在应用和基础设施层上的深耕,正在让商汤成为连接不同产业需求与AI技术能力的桥梁。
具体来看,在应用层面,商汤推出“日日新全家桶”“小浣熊”等一系列创新性生成式AI工具,为不同行业提供了新质生产力解决方案。在基础设施层面,商汤的大装置平台也成为了芯片验证的重要场所,SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型都已成功通过与华为Atlas系列服务器的相互兼容性测试。
尤其值得一提的,是商汤基于商汤的“日日新SenseNova”大语言模型打造的AI Native生产力系列工具“小浣熊家族”。
其中,AI编程助手“代码小浣熊”可提升编程效率超50%,在权威测试中,一次通过率达到75.6%,超过GPT-4的74.4%。AI数据分析工具“办公小浣熊”则能够通过自然语言输入,自动将数据转化为有意义的分析和可视化结果,其底层技术商汤日日新·商量语言大模型-数据分析版本,在测试中也以85.71%的正确率胜过GPT-4。
通过两款工具,商汤展示出其在大模型技术在实际工作场景中的高效性和创新性,标志着商汤在AI的商业化落地方面上走在了前列。
AI 2.0时代的序幕已然拉开,商汤管理层认为,生成式AI业务在2024年预计将继续保持高速增长。
十年淬炼,商汤又站在新的起点上,走向属于自己的2.0时代。