2023年10月26日,由中国汽车工程学会、清华大学、北京大学联合举办的“生成式人工智能与自动驾驶”专题分会在北京亦创国际会展中心成功召开。作为2023年中国汽车工程协会年会暨博览会(SAECCE2023)在“智能网联汽车技术”领域的重要专题分会之一,此次会议聚焦生成式人工智能技术与自动驾驶汽车的交叉领域,涵盖感知、定位、决策、控制、车路协同、算法安全等应用方面。主题包括但不限于:人工智能算法安全性加固、端到端自动驾驶、强化学习、车路协同感知、最优控制的分布式行为-批判算法、智驾AGI等。
清华大学车辆与运载学院副院长李升波教授担任本次会议主席,并主持会议。北京大学工学院研究员刘畅博士担任会议联合主席。会上,来自清华大学、上海人工智能实验室、上海交通大学、北京科技大学、商汤研究院的6名专家学者发表精彩主题演讲,论坛互动气氛热烈活跃。
清华大学车辆与运载学院副院长李升波
清华大学长聘副教授崔鹏老师从自动驾驶算法安全的角度出发,对当前自动驾驶算法的安全性瓶颈进行分析,并提出提升自动驾驶算法安全的重要技术途径为提升自动驾驶人工智能算法的分布外泛化能力。以人工智能算法分布外泛化(Out of Distribution)问题为基础,强调了应用于自动驾驶的人工智能算法泛化的重要性,并在此基础之上提出了两种方案,分别从基于因果推断的外推和基于数据的内推寻找不变性来解决OOD问题。随后,崔鹏教授介绍了其团队近期的研究成果,通过实验表明其方法相对传统的自动驾驶算法有更强的泛化性能。最后,崔鹏教授为现有自动驾驶算法泛化的“沿途下蛋”提供了新的发展方向。他认为,可以通过对AI算法进行泛化边界评测,从而使算法朝着更加理想的状态发展。
清华大学长聘副教授崔鹏
来自上海人工智能实验室OpenDrive团队的青年研究员曹晓旭博士基于现有发展状况分享了当前端到端技术(End to End, E2E)赋能自动驾驶的研发进展。首先,曹博士回顾了自动驾驶领域的发展历程,然后对大模型赋能自动驾驶领域进行了分析,最后对自动驾驶行业进行展望。他认为,E2E技术的核心应该是决策导向,并在此基础上将各个子模块进行统一。然后,曹博士认为当前技术的核心挑战主要有三点,分别为策略争夺问题,世界模型的研发和算法泛化问题,并在此问题上提出了OpenDrive团队的DriveAGI架构,通过将车辆视为一个智能体,并将推理、决策、执行和泛化整合在一起,从而开发一个真正的自动驾驶大模型。最后,曹博士对第三代数据集进行了展望,他认为,未来的数据集应该具有多样性,在大小提升的前提下,还应具有任务多样性和场景多样性,并且应该在传感器配置上具备多模态和高复杂度的特点。
上海人工智能实验室OpenDrive团队青年研究员曹晓旭
清华大学交叉信息研究院的助理教授许华哲博士则对当前的强化学习技术发展现状进行了反思。他认为,应用于工业界,特别是自动驾驶领域的强化学习算法目前都存在一定的缺点。这是因为智能体在环境中学习存在延迟,而且深度强化学习产生的数据与智能体的动作存在强相关。在此基础上,许华哲博士总结了当前强化学习算法的两大问题:样本效率低和泛化能力低。他认为,当务之急是改善样本效率低导致的欠估计的问题,避免因为多次任务失败从而导致智能体失去了对正确策略的探索。同时,许华哲博士认为强化学习算法也存在泛化问题,并基于现状联合其团队提出了一种名为“RL-ViGen”的算法,经过实验证明该算法具有较好的性能和泛化能力。
清华大学交叉信息研究院的助理教授许华哲
上海交通大学长聘副教授陈思衡博士介绍了一种通信便捷的车路协同感知方法。自动驾驶是群智感知的重要应用场景,通过关键信息的自主分享,能够解决单体难以克服的感知难题。面对群智感知中通信链路负荷巨大且时变的挑战,陈思衡博士团队首创了以“语用驱动的感知供需”牵引“多智能体自主交互”的机器学习框架,能够自适应于任意通信带宽和轮数,降低通信消耗,提升移动目标检测效果。最后,陈思衡博士系统介绍了影响群智交互感知效果的各类维度,肯定了车路协同方案的现实收益和巨大潜力。
上海交通大学长聘副教授陈思衡
北京科技大学机械工程学院长聘副教授段京良博士从工业智能化需求与数据驱动控制的发展趋势出发,将强化学习作为最优控制问题的求解工具,介绍了其团队在促进强化学习落地工业界方面所做出的贡献,包括自研的强化学习求解工具链GOPS与值分布强化学习算法(DSAC)。其中GOPS以模块化的配置,内嵌主流及自研训练算法、多种近似函数,支持gym、Simulink及自定义环境,搭建了从工业问题到应用方案的桥梁。而DSAC算法通过学习值函数分布,能够有效抑制过估计问题,稳定提升性能。目前该算法已分别与约束任务、对抗任务、平滑神经网络等相结合,实现多样化拓展形式,并在混合动力汽车能量管理、凿岩车控制与火箭回收等任务中落地应用。
北京科技大学机械工程学院长聘副教授段京良
商汤研究院研发总监卢乐炜博士系统介绍了绝影智驾的研发历程与发展布局。从工业领先的时序BEV算法BEV Former到大模型解决方案BEV Former2,再到障碍物检测解决方案OccNet,商汤绝影在工业界感知技术的发展和落地中处于领先地位。而在大模型赋能之下,商汤提出了自动驾驶多模态大模型解决方案UniAD,将自动驾驶感知决策一体化,获得了学界业界的普遍关注。在此基础上,绝影智驾将持续布局通用人工智能,促进自动驾驶多模态大模型解决方案的进一步落地应用。
商汤研究院研发总监卢乐炜
会后,李升波教授为参与报告的专家学者颁发演讲证书。