文|至野
ChatGPT爆火,大家看到了AI在语义理解上的潜力,很多尝鲜者借助它实现了生产力的大突破。
美国ResumeBuilder.com调查了1000名美国企业家,针对就ChatGPT对就业产生的影响这一话题。48%使用ChatGPT的公司表示它已经替代了工人,93%使用了ChatGPT的公司表示他们计划扩大对ChatGPT的使用。
当大家意识到AI势不可挡的时候,那么它可能在更早前就已经被塔尖的大佬盯上,并且着手推进。
就前段时间,马一龙前脚还在呼吁暂停ChatGPT5的开发,后脚就曝出买了10000张英伟达A100,同步要开始搞大模型训练。这种“两面三刀”骚操作,更激发了大家对AI的神往。
这里面最重磅的信息点,不是那个价值近百亿的显卡采购,而是后面的“大模型训练”,这个其实和特斯拉之前搭建FSD自动驾驶超算中心——Dojo类似,马一龙早就坚定了要通过大模型+大算力的方式,训练出更加智能的AI,买显卡做超算中心,仅仅是花钱就能快速实现的“大算力”的部分。
“大模型+大算力”这个方向在行业内早就是共识了。就前段时间,商汤科技的SenseTime技术交流日上,他们就正式归纳发布了“商汤日日新SenseNova”大模型体系,宣布要通过“大模型+大算力”的战略快速推进AGI(通用人工智能)的发展。
而这个国内AI领域的领头羊,现在已经拥有了应该会让马一龙都羡慕的“大模型+大算力”平台优势以及驾、舱、云三位一体的产品体系。
深耕汽车行业多年
这家公司要爆发了
在上海跑过中环的朋友,在路过漕河泾开发区地铁站附近时,不知道有没有注意过一个奇怪的建筑:像两个“桥墩”支起来的大船。没错了,这就是商汤科技在上海的总部。
我几次路过都会好奇,这是一家什么公司呢?没错,正经八百的AI公司。
提到AI大家都觉得非常虚无,毕竟这东西他看不见摸不到。商汤的基本盘是从图像识别做起的,国内的小米、华为、美图秀秀等等全部是商汤早期的客户,这下我相信可以激活大部分人的记忆了吧?
当然,以识别为基础,商汤陆续开发了人脸解锁、智能美颜、智能滤镜、背景虚化、智能相册等功能,并且为几乎国内全部的智能手机厂家提供支持。虽然我们没有看到商汤的logo,但我们一直有使用商汤的技术。
所以商汤科技董事长兼CEO徐立总是反复强调“我们是拥有原创技术的人工智能软件公司”。
作为AI领域的龙头企业,我想我有必要更近一步介绍一下商汤的业务线,主要是四大板块:智慧生活、智慧商业、智慧城市、智能汽车。
单独看智能汽车业务板块,它的收入增长明显,2022年收入近3亿元,同比增长59%。占商汤集团总收入的比例由2021年的4%大幅提升至8%。
根据多家机构的乐观估计,2025年中国智能汽车的年销量有望突破千万,这带来了市场对于智能驾驶、智能座舱需求的同步爆发。
这肉给谁不眼馋?2022年商汤集合了整个集团的优势资源,成立绝影智能汽车事业群,将总部设立在了上海临港。
啧啧啧,2022年才正式成建制的进入汽车领域,这对于商汤来说是不是有些晚了?
事实上,商汤与汽车的缘分要从创业初期开始,早在2017年,商汤就与本田建立了长期战略合作,与本田一道开发自动驾驶技术,到如今已经有6年的汽车行业经验和技术积累。
而在2021年,商汤正式推出“SenseAuto绝影”智能汽车平台,搭建起了SenseAuto Cabin绝影智能车舱、SenseAuto ADAS绝影量产智能驾驶、SenseAuto V2X绝影车路协同三个完整的业务板块,基本辐射全了智能汽车未来发展的主要路径。
虽然从正式推出产品到成立事业群的时间并不多,但从2017年与本田的合作算起,汽车业务已经根植于商汤早期创业的历程中,而现在商汤的客户群几乎已经遍布整个汽车市场。
我们来具体看看商汤在智舱和智驾两个板块的业务布局是怎样的。
商汤的绝影智能车舱,由驾驶员感知系统(DMS)、车舱感知系统(OMS)、智能进入系统及车舱APP等产品组成。通过视线追踪、头部姿态、动作识别、物体识别技术实现无感进入、儿童感知、健康检测、智能相册、虚拟伴侣、AR小巴、管柱摄像头移动自标定等功能,在2023上海国际车展上,还会发布唇语唇动识别、哨兵模式、智能救援、Air Touch、AR K歌、智能屏保六大全新功能。
目前商汤的绝影智能车舱已经落地超过20多个量产车型,涵盖了新势力的明星车型蔚来ET7/ET5、高合HiPhi Z/HiPhi X还有奇瑞捷途X50、比亚迪汉/唐、广汽传祺影速/影酷/GS8换代/M8/E9、长安逸达、极氪X、东风猛士917等等。
值得一提的是,商汤绝影还在高工智能汽车2022年H1座舱AI软件供应商市场份额排行榜上斩获第一名。
而在商汤的绝影智能驾驶板块,目前有套不同的平台,分别是:
到2022年底,已经有多款车型采用并量产了绝影智能驾驶全栈解决方案。比如广汽AION LX Plus就是采用了绝影智驾的相机感知、激光雷达感知及融合感知在内的全套智能驾驶感知解决方案,实现了高速和城区NDA。
截止2022年年内,绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付,量产交付数超50万辆,新增定点数超800万辆,覆盖30多家车企的80多款车型。
从商汤在智能座舱和智能驾驶的产品和目前已经取得的客户群体来看,商汤有点东西。而商汤智能车业务的的核心优势并非仅限于这些已有的产品线和配套,而是他们已经组建完成了马一龙心心念念的“大算力”+“大模型”闭环,这是一个螺旋正向上升的飞轮,会在未来的竞争中带来更快的发展增速。
别人比你优秀,别人还在更快得成长,这已经不是别人家的好孩子了,这是超人的孩子。
大模型+大算力
我们看到ChatGPT也好,还是上面提到的绝商汤影智舱、智驾也好,他们本身都是AI进行训练后一个产品输出。AI本身是需要数据、模型、算力,三者不间断的进行投喂运算,才能获得能力的增长。
所以不管是智能座舱内的语音、图像识别、追踪,还是智能驾驶能力的进步,全部要依赖数据的反复训练,才能变得更加聪明、更加无人。
现在的问题是,数据的收录入口异常丰富,比如我们车舱内有众多麦克风、摄像头、按键都可以输入数据,而辅助驾驶也有摄像头、毫米波雷达甚至是激光雷达收集数据,但怎么把这些数据善加利用训练好,看的就是模型与算力了。
首先是模型。AIGC和辅助驾驶AI的数据需求种类复杂、数量庞大,这也意味着简单的模型已经无法输出精度更高的结果,讲人话就是模型你得够大、够复杂,结果才能更智能。
用商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚的话说就是:“优秀的大模型,就像非常有天赋的运动员”,这个时候教练只需要进行方法论的输出还有一些引导,勤奋的且有天赋的运动员很快就能来到一个夸张的水平。
商汤的大模型极度夸张,在计算机视觉方面已经成功研发了320亿参数量通用视觉模型,所以这个定语是“全球最大”!
基于这个有些变态的超大模型,商汤可以实现高性能的目标检测、图像分割和多物体识别算法,主要可以应用在自动驾驶、工业质检、医疗影像等方向。
商汤在多模态多任务领域,发布了拥有30亿参数的通用大模型“书生(INTERN)2.5”。是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。
针对AIGC、语音识别和合成商汤都针对性的开发了大模型,在自然语言处理领域甚至安排了千亿参数量预训练大模型。
在4月10日发布的“商汤日日新SenseNova”大模型带来了全新的思路,徐立把它比喻成是一个“模型超市”,有数据、模型训练以及部署的三位一体的飞轮,能够完成自然语言的生成工具、图片生成的服务工具,所有的感知类任务的工具,以及模型的增量研发、服务工具。讲人话就是,这个商汤日日新SenseNova超大模型,可以自己产生越来越多大模型!
大模型有了,这同时意味着需要有足够的算力去支持。还记得开头马一龙打算买多少块A100吗?1万张?这在商汤的大算力装置面前,其实不算什么。
SenseCore商汤AI大装置目前已经完成2.7万块GPU的部署,实现了5.0 exaFLOPS的算力输出能力,目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练,是亚洲目前最大的智能计算平台之一!作为对比,特斯拉去年去年AI Day上采用D1芯片的Dojo超算中心,整个算力是1.1 exaFLOPS。
所以,我想马一龙应该是羡慕商汤在大算力超算中心上的庞大资产的。
大模型+大算力已经成为了商汤的商业模型的良性闭环,对于所有AI业务的加成与提速非常明显。而不管是大算力和大模型,都需要研发人员的产能,目前商汤拥有研发人员超过4000人,其中拥有博士及博士候选人超过250人,教授40位,并与全球52所顶级院校合作,在全球建立了15个联合实验室。这些研发人才,才是商汤的核心资产。
赋能智舱与智驾
赋能这个词儿确实有些虚,但用在AI上它真得很恰当。上文我们提到的大算力+大模型优势如何体现呢?就是在赋能这个词儿上。
通用人工智能可以让辅助驾驶的AI具有一个基础的空间环境的理解、用户状态的感知,以及对多模态的指令可输入得能力,场景可以覆盖到上车、行车、停车、离车等等。简而言之,就是可以让车机的语音助手更聪明、更具情感。
同时由于商汤在智慧城市、手机等业务线的经验,还可以把更多基于AI技术的业务与座舱进行融合,比如互联、元宇宙等等。
而大模型+大算力对于智驾的帮助,同样非常巨大。绝影基于多模态大模型可以做到数据的感知的闭环和决策的闭环,从前端自动的去采集高质量的数据,利用大模型自动的数据的标注,可以高效的实现自动驾驶模型的迭代。
我们还是来看具体的例子,现在头部自动驾驶企业都在追逐BEV感知算法。而绝影已经将BEVFormer++感知算法实现了大规模量产落地。并且在2022年Waymo挑战赛当中,绝影获得了感知算法的冠军。
商汤还主导了OpenMMLab智能感知算法框架平台的开源,里面有超过200种算法,上千种的预训练的模型,已经有超过100多个国家和地区的开发者参与和使用OpenMMLab。
而BEV也可以向多模态、通用人工智能的方向发展。通过商汤绝影的AIGC去生成困难的样本,给模型输入多模态的数据。
在决策上,商汤联合上海人工智能实验室推出了OpenDILab决策AI平台,其中的DI-drive工业级生态应用,是一套自动驾驶仿真训练平台,可通过决策AI在仿真器中构建训练和评测场景,让AI在自动驾驶的复杂交互环境中实现更加精准的决策、规划和控制。
结尾
商汤作为国内AI领域的龙头企业,在数年数百亿资金的投入下获得的大模型+大算力平台还有优秀的人才,让其在智驾、智舱上的底层开发上,具有很强的优势。
那么新的问题出现了,车企都说智能驾驶、智能座舱是“灵魂”需要实现全栈自研,而商汤的产品,不正是踩在“灵魂红线”上吗?
这个问题的答案过于简约:一是车企投不起,二是车企没时间。王晓刚提到,车企会在智能化进程加深的节奏中,同步感受到这些基础硬件投资在时间、金钱维度的深入。而在数据的归属问题上,商汤不拥有数据,在合作时会把工具链打包给车企,帮助车企实现数据的闭环。
所以很多车企也乐得选择借助商汤的AI能力,快速搭建起一整套体验优秀的智舱与智驾平台。
截至目前,商汤绝影已与30家车企合作,拥有超50个生态合作伙伴,商汤绝影智能驾驶和智能座舱产品累计前装定点数量超3100万台。
在今年上海车展还有近30款合作车型亮相。商汤发布的“商汤日日新”大模型体系,相关应用如“商量SenseChat”、“秒画SenseMirage”也将在绝影展台登上“商汤绝影未来展示舱2.0”,带来极智的驾乘体验。
此外,商汤绝影10余项创新展品,如:商汤绝影行泊一体量产解决方案,全能感知及BEV 3D感知等前沿技术的量产应用;绝影在头部车企的最佳实践案例等。有兴趣的小伙伴可以上海车展期间去到商汤的展台(5.1馆5A10)进行了解。
时尚科技风潮 2023-04-10