近日,国外社交媒体流出一段OpenAI CEO Sam Altman及COO Brad Lightcap 一同接受采访的视频,两人直接给出了“高质量AI技术成本有可能降到‘接近零’”的观点,并提出,通过 ChatGPT 等AI技术,企业供应链在特定领域可大幅压缩支出,节约成本。
在 ChatGPT之外,今年年初正式推出的文生视频应用Sora是OpenAI扔向市场的又一“王炸”,至今热度不减。那么,在AI的天然应用场景——自动驾驶中,Sora有没有用武之地?能否成为汽车智能化中的新亮点,带来新的用户体验?新的AI产品在自动驾驶场景下,如何改变汽车供应链成本结构?我们与自动驾驶方案解决公司的技术人员聊了聊,与大家分享如下观点:
OpenAI表示,Sora能深刻理解语言,不仅理解用户文本提示,还能理解所属事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”
换句话说,OpenAI对Sora的定义不只是替代视频生成的创作者,而是将视频生成作为帮助AI理解真实世界的「模拟器」。
因此,Sora的应用将不仅仅在视频制作领域。视频制作之外,最先受到关注的可应用领域当属自动驾驶。
从根本上来看,Sora最创新之处还是在对物理世界的理解上,以此为基础,Sora在自动驾驶技术中或许会有广泛应用空间,我们大胆预测,以下三方面或许最先落地应用:
虽兴奋于Sora给自动驾驶带来的新的可能性,但理想的实现仍需要跨越很多现实的鸿沟。Sora要想真正地、更广泛地应用于自动驾驶仍要解决很多的技术难题。
首先,从OpenAI释放的信息来看,Sora目前仅能生成最长60秒的视频,但自动驾驶所需的虚拟数据、仿真环境都是持续往前延伸的,时长远超60秒。因此,延长视频时间将是Sora应用于自动驾驶需要解决的基础问题。
其次,Sora生成的世界模拟空间是以像素为表达方式的,但自动驾驶系统所需要的数据是结构化的,即如何将视频的像素表达转变为结构化表达将是Sora广泛应用于自动驾驶的重要壁垒。
最后,与视频制作等应用场景不同,自动驾驶系统的大部分计算是在车端完成的,而车端算力受制于成本、功耗等因素,算力空间有限。加之自动驾驶系统需要实时采集海量数据及低时延需求之下,计算量更是激增,这对Sora在自动驾驶中应用的算力需求提出了新的要求。
此外,Sora在自动驾驶中的应用还需要产业配套的发展支撑。从产业链条来看,Sora是基础研究,而自动驾驶则是工程化应用,其中仍需中间平台或企业完成产业链两端的链接,从而实现Sora在自动驾驶中的高效、广泛应用。
然而,上述一切均基于Sora能够100%理解物理世界。因此,客观来看,从Sora自身能力到与自动驾驶的深度融合均存在极大提升空间。