当前位置:首页|资讯|Sora|自动驾驶|OpenAI|阿尔特曼

当Sora植入自动驾驶,会触发哪些反应?

作者:未来驾驶发布时间:2024-04-19

原标题:当Sora植入自动驾驶,会触发哪些反应?

近日,国外社交媒体流出一段OpenAI CEO Sam Altman及COO Brad Lightcap 一同接受采访的视频,两人直接给出了“高质量AI技术成本有可能降到‘接近零’”的观点,并提出,通过 ChatGPT 等AI技术,企业供应链在特定领域可大幅压缩支出,节约成本。

在 ChatGPT之外,今年年初正式推出的文生视频应用Sora是OpenAI扔向市场的又一“王炸”,至今热度不减。那么,在AI的天然应用场景——自动驾驶中,Sora有没有用武之地?能否成为汽车智能化中的新亮点,带来新的用户体验?新的AI产品在自动驾驶场景下,如何改变汽车供应链成本结构?我们与自动驾驶方案解决公司的技术人员聊了聊,与大家分享如下观点:

Sora在自动驾驶中最有可能的应用方向

OpenAI表示,Sora能深刻理解语言,不仅理解用户文本提示,还能理解所属事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”

换句话说,OpenAI对Sora的定义不只是替代视频生成的创作者,而是将视频生成作为帮助AI理解真实世界的「模拟器」。

因此,Sora的应用将不仅仅在视频制作领域。视频制作之外,最先受到关注的可应用领域当属自动驾驶。

从根本上来看,Sora最创新之处还是在对物理世界的理解上,以此为基础,Sora在自动驾驶技术中或许会有广泛应用空间,我们大胆预测,以下三方面或许最先落地应用:

  1. 为自动驾驶测试提供更丰富的虚拟数据。自动驾驶系统的学习需要海量数据来喂养,而目前受限于车队规模、量产上车数量及实际使用率等现实问题,自动驾驶数据采集仍存在较大缺口。Sora的视频生成能力,则恰好可以根据文字指令为自动驾驶提供源源不断的数据供给。
  2. 应用于仿真系统。简单来说就是通过sora生成一段仿真视频,模拟真实的物理世界,把自动驾驶车辆放到这个环境中去运行、测试。
  3. 用于预测决策模块。如上文所述,sora最令人惊艳的不是生成视频的能力,而是其作为「世界模型」预测物理世界变化的能力,而这一能力恰好适用于自动驾驶的预测及决策模块。在自动驾驶的预测模块,会有很多对环境变化的假设,即假设车辆发生某一变化(例如变道、加速等等)后,环境会发生什么样的变化,这恰好使用了sora的预测能力。而这一预测模型可以实现的话,sora模型则有可能进一步应用到规控当中。

Sora在自动驾驶应用中的几点壁垒

虽兴奋于Sora给自动驾驶带来的新的可能性,但理想的实现仍需要跨越很多现实的鸿沟。Sora要想真正地、更广泛地应用于自动驾驶仍要解决很多的技术难题。

首先,从OpenAI释放的信息来看,Sora目前仅能生成最长60秒的视频,但自动驾驶所需的虚拟数据、仿真环境都是持续往前延伸的,时长远超60秒。因此,延长视频时间将是Sora应用于自动驾驶需要解决的基础问题。

其次,Sora生成的世界模拟空间是以像素为表达方式的,但自动驾驶系统所需要的数据是结构化的,即如何将视频的像素表达转变为结构化表达将是Sora广泛应用于自动驾驶的重要壁垒。

最后,与视频制作等应用场景不同,自动驾驶系统的大部分计算是在车端完成的,而车端算力受制于成本、功耗等因素,算力空间有限。加之自动驾驶系统需要实时采集海量数据及低时延需求之下,计算量更是激增,这对Sora在自动驾驶中应用的算力需求提出了新的要求。

此外,Sora在自动驾驶中的应用还需要产业配套的发展支撑。从产业链条来看,Sora是基础研究,而自动驾驶则是工程化应用,其中仍需中间平台或企业完成产业链两端的链接,从而实现Sora在自动驾驶中的高效、广泛应用。

然而,上述一切均基于Sora能够100%理解物理世界。因此,客观来看,从Sora自身能力到与自动驾驶的深度融合均存在极大提升空间。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1