在被誉为“科技企业营销圣经”的《跨越鸿沟》一书中,杰弗里·摩尔写道:
“高科技产品面世过程中,最危险、最关键的一点,就是由少数有远见者所主宰的早期市场,向实用主义者占支配地位的主流市场过渡。”
此刻,狂飙突进已半年有余的国内生成式人工智能(AIGC)市场正面临着这个关键的过渡。
8月31日,首批8家AI大模型企业通过备案。市场普遍认为,随着未来不断有新的企业通过备案,“大模型+”的应用拐点即将到来。
不过尽管政策已经落地,大模型企业们仍面临挑战。
多位AI大模型行业的从业者对「市界」表示:行业需要的模型要由客户来定义,市场将在自然选择的过程中完成披沙沥金。
换句话说,大模型企业的商业化实力最终要用业绩来说话。那么市场究竟需要什么样的模型?怎样才能做出市场需要的模型?
在大模型市场狂飙突进半年有余之后,我们发现行业的先行者早已摸索出了一条道路。
01、商汤科技做对了什么?
8月31日,商汤科技官宣旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。
“商量SenseChat”于今年4月正式推出,是国内最早推出的基于千亿参数的大语言模型之一,并在过去几个月中不断迭代更新。
在通过备案之前,商汤科技已经就大模型落地应用进行了诸多探索并取得了阶段性成果。
据商汤官方信息,发布至今,商量SenseChat已经在金融、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作,通过提供多种灵活的API(应用程序编程接口)和服务,为客户提供大模型的各项AI技术和服务,帮助后者低门槛、低成本、高效率地实现各类生成式AI应用。
而从2023半年度财报中也可以看到,商汤科技在上半年中实现了AIGC相关营收的迅猛攀升,涨幅高达670.4%,相关业务对集团营收的贡献从2022年的10.4%提升至20.3%。
业绩飙涨背后是客户对商汤AIGC产品的认同和选择,而其基础则在于,商汤科技作为国内最早一批成立的AI企业,对大模型应用范式的探索已有多年历史。
厚积薄发之下,2023年上半年,商汤科技顺应潮流,发布了“日日新SenseNova”大模型体系和生成式AI产品系列,其中包括商量、秒画、如影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。
在上述各大AIGC应用市场中,商汤科技都展现出了领先的技术水平。
举例来说,最新的商量SenseChat的基模型(Foundation Model,预训练模型)为商汤联合多家国内顶级科研机构发布的书生·浦语InternLM-123B,后者拥有1230亿参数,在语言、知识、理解、推理和学科五大能力上均处于行业领先水平。
在全球51个知名评测集共计30万道问题集合上,商量SenseChat测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型,在主要评测中12项成绩超越GPT-4,排名第一。
而在AI文生图领域,商汤科技于2023年7月升级了妙画3.0版本。秒画3.0算法在COCO benchmark(评测集名称)上超过了谷歌发布的ImagenOpenAI发布的DALL•E 2。出图效果跻身全球前三。
02、九年如一日的AI探索
2022年11月30日ChatGPT的发布,快速在全球范围内掀起了一场大模型研发的“飓风”,至今已经过去9个多月的时间。
一位业内人士曾对「市界」分析道,在国内大模型市场的早期竞争阶段,速度意味着胜利,越早集齐人才、算力、资金等资源进行攻关研发,推出大模型产品,就意味着卡住了市场的黄金窗口期。
而商汤科技在极短的时间内发布了成体系的大模型产品,无疑精准地把握住了市场的脉动。
在这背后,是它长达9年的技术积累与探索。
2014年公司成立之时,对大模型及相关技术的押注就写进了商汤科技的“公司基因”之中。2015年,商汤科技开始研发深度学习训练框架SenseParrots,并逐渐以此为核心,持续研发攻坚,逐渐搭建起AI基础设施“SenseCore AI大装置”。
SenseCore AI大装置打通了算力、算法和平台这三大要素,是一个能够支持AI模型生产全部流程的架构体系,也是对商汤科技研发能力储备的最佳证明。
大模型走红以来,业界普遍认为具有1万块高端GPU(图像处理单元,常用的AI训练芯片之一)的算力规模,是AI大模型市场入场券。而截至2023年3月底,SenseCore上线的GPU数量高达2.7万块。
2023以来,共有超过1000个参数量数十亿至上千亿的大模型在SenseCore完成了训练,商汤科技共投入了上万块GPU用于大语言模型的研发,其中就包括“商汤日日新SenseNova”大模型。
以文生图模型为例,“秒画”大模型在7个月完成了三个版本的迭代,这背后是SenseCore提供的约2000块GPU的支持。
至今SenseCore仍在持续升级,日前上线的GPU数量已提升至约3万块,相当于算力规模提升了20%、达到了6 ExaFLOPS(算力单位,每秒浮点运算次数)。
商汤科技董事会执行主席兼首席执行官徐立曾表示,商汤科技对大模型市场还有更加高远的追求,公司将持续贯彻“大模型+大装置”的AGI战略布局,希望能够“从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中绽放”。
调研机构AllTheResearch预计,2026年全球AGI市场规模将达到1442亿美元,2016-2026年复合增速达到41.6%,堪称一片广阔的蓝海。作为国内乃至全球AI行业的领军者,商汤科技的未来值得期待。
(作者|董温淑,编辑|孙春芳)