鞭牛士报道,11月10日消息,据外电报道,谷歌母公司 Alphabet 的无人驾驶叫车部门 Waymo 现已为其自动驾驶运营推出了一种新的人工智能研究模型。
Waymo在两份关于其AI 方法和用于自动驾驶的新型端到端多模式模型(称为 EMMA)的新闻稿中分享了其未来 AI 研究模型计划的细节。
该公司表示,它仍在研究阶段使用 EMMA 模型,而不是在运营车辆中使用,这种方法是一种替代方案,与特斯拉的全自动驾驶 (FSD) 和其他端到端模型方法非常相似。
Waymo 副总裁兼研究主管 Drago Anguelov 表示:EMMA 是一项展示多模态模型对自动驾驶的强大功能和相关性的研究。我们很高兴继续探索多模态方法和组件如何有助于构建更具通用性和适应性的驾驶堆栈。
Waymo 表示,EMMA 模型使用基于其 Gemini 语言模型的真实世界知识,而端到端方法预计最终将使自动驾驶汽车直接从传感器数据和实时驾驶场景中运行。该公司还强调了其对大型语言模型 (LLM) 和视觉语言模型 (VLM) 的使用,并将其架构称为 Waymo 基础模型。
请听该公司高管详细介绍 Waymo 的研究和人工智能计划。
EMMA 研究与批评
在有关 EMMA 的新闻稿中,Waymo 列出了该研究计划的主要方面:
端到端学习:EMMA 处理原始摄像头输入和文本数据以生成各种驾驶输出,包括规划轨迹、感知对象和道路图元素。
统一语言空间:EMMA 将非传感器输入和输出表示为自然语言文本,从而最大限度地发挥 Gemini 的世界知识。
思路链推理:EMMA 使用思路链推理来增强其决策过程,将端到端规划性能提高 6.7%,并为其驾驶决策提供可解释的理由。
Waymo 工程副总裁 Srikanth Thirumalai 表示:我们试图解决的问题是如何打造能够在现实世界中导航的自动驾驶汽车。这远远超出了许多人工智能公司正在尝试做的事情。
不过,一些人对大规模端到端模型表示怀疑,称在没有采取重大安全措施的情况下使用生成式人工智能模型可能风险太大。
Aurora Innovation 首席产品官斯特林·安德森 (Sterling Anderson) 在给《汽车新闻》的一份声明中表示:这只是一种听起来很了不起但实际上并不是解决方案的想法。
Mobileye 首席技术官 Shai Shalev-Shwartz 称端到端方法风险巨大,尤其是在验证基于该模型的车辆的决策过程方面。值得注意的是,Waymo 目前还在研究这种方法,目前还没有任何将其商业化的计划。
此前,Waymo 刚刚完成了一轮 56 亿美元的融资,估值已超过 450 亿美元。该公司还在研发基于现代 Ioniq 5 的下一代自动驾驶汽车,该汽车将在佐治亚州的新工厂生产。