4月21至23日,由中国图象图形学学会(CSIG)主办,CSIG三维视觉专委会承办的“2023年中国三维视觉大会(China3DV 2023)”在北京举办。毫末智行技术副总裁艾锐博士受邀出席活动,并在“自动驾驶与空间智能论坛”上,以《走向大数据、大算力、大模型——毫末的自动驾驶3.0时代》为主题,发表了演讲,分享了毫末在自动驾驶AI大模型领域的最新实践和成果。
(毫末技术副总裁艾锐博士)
China3DV是国内三维视觉领域最高规格的学术研讨盛会,本届China3DV包含具身智能与机器人论坛、国家重大需求论坛、自动驾驶与空间智能论坛等环节,邀请了学术界、产业界以及国家重点行业的顶尖专家学者相聚北京,深度探讨空间智能交互领域的核心问题,分析大模型时代下智能交互技术的新问题新机遇,并共同讨论重大需求牵引的三维视觉研究前沿。
在艾锐看来,自动驾驶发展多年,已经经历了以硬件驱动为主的1.0时代和以软件驱动的2.0时代,正在进入将持续发展的由数据驱动的自动驾驶3.0时代。“自动驾驶3.0时代,大模型、大数据会是关键,毫末在很认真地积累数据,并且非常努力地持续降低数据成本。3年来,毫末已经积累了10亿帧、超过1100万段的感知数据以及1.2亿段的认知数据。”
利用成本和规模的优势,毫末正在持续落地自动驾驶产品。艾锐介绍,作为中国量产自动驾驶第一名,毫末HPilot整体已搭载近20款车型,其中15款车型已量产。用户辅助驾驶行驶里程突破4100万公里,末端物流自动配送车小魔驼的配送订单量也已突破16万单。中国首款可大规模量产落地、重感知城市NOH,将首批落地北京、保定、上海等城市,并开启泛化测试,到2024年有序落地100城。
“毫末在很严肃地走大模型路线。毫末做技术选型第一性原理就是:数据规模到能力水平的转化效率越高,这个技术路线越好,为此我们一直积极拥抱新技术。”4月11日,毫末正式推出行业首个自动驾驶生成式大模型DriveGPT,中文名雪湖·海若。毫末DriveGPT雪湖·海若,通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。目前,毫末DriveGPT雪湖·海若实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据,RLHF 阶段引入5万段人工精选的困难场景接管 Clips。
大模型落地应用的同时,毫末的大数据和大算力也在持续进化。2023年1月,毫末和火山引擎联合打造了国内自动驾驶行业最大的智算中心——雪湖·绿洲(MANA OASIS),算力可达每秒浮点运算达67亿亿次。
有了智算中心以及训练框架的持续迭代保障,才能让大模型连续、稳定、高效地训练出来。艾锐透露,如今,MANA OASIS也已从底层算子、训练稳定性、训练资源弹性调度等层面进行了优化升级,进一步支持 DriveGPT 雪湖·海若的算力。“毫末在很认真地准备算力,并且非常努力的持续提升算力利用效率。智算中心一直在建设的路上。”
无论是工业智造领域的数字化、无人化和智能化转型升级,还是自动驾驶、数字城市、数字经济,都有需要对复杂动态的真实场景世界进行三维数字化表达、理解和交互。“毫末始终以开放的姿态欢迎学界和业界各方展开合作,不论是数据还是算力还是算法,同时也欢迎更多的AI人才加入毫末。”
最后,艾锐表示,毫末希望与业界进行更多思想碰撞,不断迸发出新方法、新技术和新需求,共同推动实现“重塑和全面升级整个社会出行及物流方式”这一使命目标。