三年前,翻译行业的从业者们不会预料到GPT会打碎自己的饭碗。
站在今天展望三年后,滴滴师傅们也不会预料到,自动驾驶会威胁到自己的生存空间。
看看最近这段时间自动驾驶领域突飞猛进的进展,似乎可以得出一个令人心碎的判断:留给滴滴师傅的时间也许真的只有三年了。
亚马逊河流域热带雨林中的一只蝴蝶扇动了一下翅膀,两周以后,引起了美国德克萨斯州的一场龙卷风。
谁也不会想到,2022年底的大洋彼岸,马斯克的一个决定将引发自动驾驶行业翻天覆地的改变。
彼时的特斯拉已经引领了智能驾驶行业两次技术路线转变,第一次,从两维的相机视图图转向三维BEV视图,第二次,从矢量化的BEV视图转向体素化的占用空间视图。
在感知层面,特斯拉已经触摸到了性能的天花板,接下来,要继续提高智能驾驶的性能,必须对规划和决策模块动刀了,怎么办?
看了看自己一手创立的OpenAI在ChatGPT上的巨大成功,想了想英伟达前些年研究的端到端技术路线,特斯拉评估了一下算法、算力、数据的三要素,要不实验一下端到端,看看能不能提高智能驾驶性能的天花板?
算法方面,CNN架构炉火纯青,Transformer架构也已经成熟。算力有两个层面,车端推理和云端训练,车端推理算力上,第4代HW硬件已经推高到了720个TOPS,训练算力方面,可以外购英伟达H100,也可以加速构建Dojo。
数据方面,特斯拉几百万辆车可以提供具有极高一致性的高质量数据。万事俱备,只欠东风,就看马斯克舍不舍得烧钱,做一下实验了。
看了看身旁紧追不舍的华为,瞅了瞅身后不断拍马杀到的小鹏、蔚来和理想,老马咬了咬牙,跺了跺脚,开干端到端。
投入100万个视频片段训练一下,性能有所回退,投入200万个视频片段,好像也就那样,投入300万个视频片段,终于像那么一回事儿了,到了500万个视频片段,老马终于哇了一下,就是它了,从此,特斯拉全力加码端到端。
过了大概半年,本土车企也纷纷醒过神来,开始转向端到端,就此开启了自动驾驶行业的第二个春天。
古有周幽王为博美人一笑烽火戏诸侯,最终丢掉了江山,今有马斯克每年都喊自动驾驶第二年就会实现,频频被打脸。
不过,当2023年马斯克再度喊出这个口号的时候,大家终于觉得狼来了,开始认真对待了,因为,端到端技术路线确实提高了智驾性能的天花板。
端到端路线可以提高性能天花板的根本原因在于其实现形式是数据驱动的神经网络。
数据驱动的神经网络有一个最根本的优良特性:训练得有多好,推理能力就有多强。从训练到推理,知识传递的效率特别高。
大家可以这么理解训练和推理,训练就是从已知数据中学习到一种新的能力,而推理就是把刚刚学习到的这种能力应用到新的数据上。
如此一来,当通过训练的方式将海量高质量的驾驶数据中隐藏的知识压缩到模型的参数文件里之后,在实际的驾驶过程中,自动驾驶系统能百分之百地发挥学习到的能力。
也就是说,将从已有的驾驶数据中学习到的知识应用到新的驾驶环境中时,神经网络真正做到了学以致用,知行合一,一点都不藏着掖着,有多大力出多大力,中间没有能力的损失。
但是在规则驱动的人工编码方式下,程序员需要将自己对驾驶行为的理解体现在代码文件里,中间隔了程序员这么一个二道贩子。
即便“中间商不愿赚差价”,从驾驶知识到人类码农、从码农到代码的这么个知识传递过程也将不可避免地出现信息和能力的损失。
且不说客观损失,在主观上,即便是出于无意,码农们有时也是貌似在写代码,实际上却在写bug。笔者编程20年,仔细算下来,每天的有效代码量好像也就在二三十行之间。
“时间都去哪儿了,还没好好感受青春就老了”,说实话,大量的时间都花在找bug上面了。
有一句鸡汤味很浓的话,每天进步一点点,一年之后,你就会彻底改头换面。
端到端技术路线恐怖的地方就在这里,它基本可以保证智能驾驶系统每一次迭代都会进步一点点,从而借助时间的复利,实现智能驾驶性能的迅速提升。
端到端能实现这样的奇迹,是因为它可以做到持续学习,更加符合第一性原理。
这里的第一性原理不是马斯克经常宣扬的纯视觉路线的那个第一性原理,而是端到端的本质是数据驱动下的“有样学样”。
应该说,“有样学样”是自动驾驶系统目前效率最高的开发和训练方式,端到端之后,直接向模型投喂作为系统输入的车周环境和作为系统输出的方向盘、踏板动作,通过一次次的强化学习和反馈调整,让它慢慢培养出对驾驶环境的理解能力,掌握人类驾驶的知识和与交通出行相关的物理世界的运行规律。
类比一下,人类幼崽也是通过有样学样,慢慢加深对这个世界的理解,掌握认识世界、改造世界的能力的。这么一对比,是不是愈发觉得端到端符合第一性原理了?
从智能系统的本质出发、符合第一性原理带来的后果是,智能驾驶系统的性能可以迎来飞速的裂变。
小鹏汽车在5月20日的AI Day上宣称,XNGP性能可以在18个月内提升30倍,城区平均接管里程从10公里提高到300公里。
马斯克在股东大会上声称,每一次版本迭代性能可以提升5倍,
誓言要拿下国内智能驾驶方案供应商70%市场份额的Momenta也认为,有了端到端,智能驾驶系统软件性能可以做到每两年提升10倍。
和特斯拉与小鹏汽车的表态相比,Momenta保守了很多,但是,即便按照这种智驾摩尔定律,也可以实现四年后智驾体验比现在好100倍,6年后智驾体验比现在好1000倍!
有那么一句令人悲哀的话:当时代抛弃你时,连声招呼都不打。
对于很多挣扎在温饱线上的滴滴师傅来说,他们真的不知道自己的工作也许在三五年之后就消失了。
毕竟,肉体凡胎的人类怎么可能竞争得过可以007作业的自动驾驶汽车呢?