当前位置:首页|资讯|商汤|生成式AI|人工智能

中国式现代化奋进者|商汤生成式AI业务收入达12亿 让大模型跑起来的背后动能竟是它

作者:东方网发布时间:2024-04-01

原标题:中国式现代化奋进者|商汤生成式AI业务收入达12亿 让大模型跑起来的背后动能竟是它

东方网记者王佳妮4月1日报道:人工智能行业无疑是“新质生产力”的代表之一,生成式AI的支柱价值更是在大模型上得以体现。在炙手可热的“变现王”大模型背后,AI开发平台却显得有些默默无闻。事实上,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。

深谙此道的商汤科技早在2018年便开始布局,以每年数十亿的“雄心”投入到SenseCore商汤大装置。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一。如今,SenseCore商汤大装置管理的总算力到了何种程度?又如何赋能“日日新”大模型体系?近日,东方网记者走近位于临港的AIDC,聆听商汤这位长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”的故事。

万卡并联,输出丰厚的“新质生产力”

根据《2023年中国AI开发平台市场报告》显示,商汤在增长指数和创新指数两大评估维度的综合评分中位居国内首位。而商汤亮眼的成绩单还远不止于此。最早于国内业界研发和发布大模型产品、国内首个发布超过千亿参数级大模型和性能超越GPT3.5模型的厂商,成功研发320亿参数量的全球最大的通用视觉模型,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用……这些成绩,都让商汤成为业内发展的“领军选手”。

2023年,商汤科技生成式AI业务收入达12亿人民币,这是商汤成立十年以来,以最快速度从无到有、超过10亿收入体量的新业务。“生成式AI业务若要长期发展,离不开算力的持续增长。换而言之,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。”商汤科技董秘办董事总经理盛世伟在接受东方网记者采访时介绍,

目前商汤管理的算力已实现全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,总运营算力达到12000petaFLOPS,上线GPU数量达到45000张。其中临港AIDC为8100 petaFLOPS,远远超出立项规划的3740 petaFLOPS算力总量。

“根据计划,商汤在2024年将会更大面积地拓展全国的算力节点,输出丰厚的‘新质生产力’。”盛世伟说,同时,出于更全面、长远的考虑,商汤增加了对华为昇腾、寒武纪等主流国产芯片的适配,以全国产的技术栈,支持大模型的训练、微调和推理。

而实现这一点的关键,是商汤参与联合开发的DeepLink开放计算体系。 DeepLink是连接国产硬件和主流深度学习算法框架的桥梁和纽带。DeepLink有300多个标准化算子接口;基本上CUDA能够支持的AI大模型计算需求,DeepLink也完全能够支持,覆盖率在99.5%以上。有了DeepLink,各类国产芯片就可以轻松适配主流的大模型训练框架和算法库,比如PyTorch、DeepSpeed等常见的开源训练框架,还有商汤推出的OpenMMLab、OpenDILab、OpenGVLab等开源算法库,充分发挥国产芯片的性能。

值得一提的是,目前,商汤大装置已最大实现了万卡的超大集群互联,并保持90%的加速效率。在训练稳定性上,实现超30天稳定训练不间断的能力,而出现训练间断时的诊断恢复时长也优化到了半小时。

168天刷新纪录,打造国内AIDC“样板间”

强大的算力让商汤在大模型发展上充满底气,而这基础设施方面的先发优势离不开商汤的前瞻性布局。早在2018年,商汤就已开始每年数十亿投入到SenseCore大装置,并建设了上海临港超算中心。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一,堪称国内AIDC建设的“样板间”。

项目占地87亩,整体规划建筑面积13万平方米,这么一栋建筑建成需要多久?从2020年7月7日奠基,到9天后桩基开工,再到12月31日主体结构封顶仪式,整个过程只用了168天,创下新纪录,彰显上海服务、临港速度。

“商汤大装置团队规模约400人,上海这里有100多人,其余有分布在北京和深圳。在没有大装置前,商汤的所有算力或服务器都是分散在上海、北京、深圳等若干个机房内。”商汤科技大装置事业群智算中心总经理林海介绍,临港AIDC投运后,园区内纳管了超4万张卡,并实现万卡并联。

商汤科技大装置事业群智算中心技术总监宋祎寓告诉记者,临港AIDC的整体规模为13万平方米,目前一期已投运了大约7万平方米的规模。“在2022年规划园区时,算力的输出规划值是3740P,如今已超出了两倍以上,达到甚至超过8100P。但我们的发展脚步并不会停止,因为无论是应对自身需求还是外部商业化和合作伙伴的需求,算力仍有些供不应求。”

充满前瞻性的商业目光,让商汤赢得了AI2.0时代发展的先机。就在本月,商汤将公布日日新5.0大模型。展望未来,盛世伟表示,商汤会继续聚焦生成式AI业务,保持业务的持续高速增长和行业领先地位。通过进一步发挥“大装置+大模型”深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力,为行业伙伴提供优质的算力和模型服务。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1