/导读/
最近的科技圈,大家都被微软推出的ChatGPT刷屏,作为工智能公司OpenAI于2022年11月推出的聊天机器人,其能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,并且智能性远超当下所有的人机交互模型。而ChatGPT的轰动也让谷歌、百度等以搜索为主要业务的大厂感受到了前所未有的压力,也随即推出了自研的类ChatGPT模型,然而实际的使用效果还得打个问号。
那么,如果对于文本的学习已经能够达到如此智能的地步,对于自动驾驶行业,ChatGPT能够为其带来什么呢?是否能够对困扰从业者多年的决策难题做出突破呢?
自动驾驶中的决策难题
在自动驾驶行业中,决策规划作为整体系统的大脑,处于算法中的核心模块,对于自动驾驶功能的实现以及安全性的保障起着重要的作用。目前包括辅助驾驶及自动驾驶功能的决策实现上,大多数企业都采用了基于规则的方式,这种方式能够极大程度地保障在应对不同场景时的决策的安全性。不同于强化学习,强化学习具有致命的弱点,那就是出了问题很难去追溯到原因,只能不停的迭代更新模型,以针对当前场景获得期望的输出结果。
另一方面,强化学习需要进行大规模的训练,这样对其执行结果的评价也是难点之一,如果不能合理地评价模型给出的结果,那么决策的智能性则无法进步,甚至在极端场景下给出错误的决定,让车辆处于危险之中。以上种种原因,使得在自动驾驶行业中,基于强化学习的决策规划系统还远远未达到成熟,而基于规则的系统也难以应对极端的Corner case,这也使得从业者们普遍认为L4甚至L5级别的成熟自动驾驶难以实现的根本原因。
ChatGPT能给自动驾驶带来什么?
那么就以上的决策难题,ChatGPT能够为自动驾驶带来什么样的突破呢?首先,我们先回答 ChatGPT 到底是什么?它是个基于上千亿超大语料参数组成的 GPT3.0 架构训练出来的一个自然语言处理聊天工具。ChatGPT 的算法采用了 Transformer 神经网络架构,具有很好的时序数据处理能力。
Transformer 对于自动驾驶行业的人员来说并不陌生,它是一种结构简单的编解码器,几乎可以无限堆叠,从而形成一种大规模的预训练语言模型。基于 Transformer 模型构成的 GPT 架构可以很好地完成多种语言处理任务,填空、造句、分段、翻译等等。另外,ChatGPT 还需要使用监督学习和强化学习来实现。具体来说,ChatGPT 使用了一种叫「人类反馈强化学习(RLHF)」的训练方法,在训练中可以根据人类反馈,保证对无益、失真或偏见信息的最小化输出。
从对ChatGPT的分析我们可以看出,其是利用人类反馈进行强化学习的产物,并且其强大的识错能力能够对错误的信息进行判别与纠正。那么回想自动驾驶的决策难题,其核心技术将可以为自动驾驶带来前所未有的突破。那么具体怎么实施呢?
首先,自动驾驶决策算法中有一类叫做模仿学习,利用人类驾驶员针对不同场景的执行策略让机器进行学习,遇到类似的场景便可以采用模仿人类的驾驶策略。
其次,要想获得一个经验老道的老司机的决策能力,必须看得多,学得多。因此需要引入大量的人类驾驶数据,并灌输到机器学习的模型之中。在这一步,由于牵涉到大量的数据训练,采取人工标注显然是不现实的。而ChatGPT的成功证明了,机器对于数据判别的好坏是能够学习成功到如此地步的,那么采用人类反馈强化学习的思想,可以训练出模型来验证、评价机器模型的输出,使其不断进步,最终达到人类的驾驶水平。
最后,便是引入人类驾驶的真实接管数据,在其中尝试使用「人类反馈强化学习(RLHF)」。一般来说,人类司机的每一次接管,都是对自动驾驶策略的一次人为反馈;这个接管数据可以被简单当成一个负样本来使用,就是自动驾驶决策被纠正的一次记录。同时也可以被当作改进认知决策的正样本来学习。
除此之外,ChatGPT也可以用来分析大量的驾驶日志数据,以找出驾驶员在特定情境下的行为规律,并用这些信息来训练自动驾驶控制系统,从而提高它们在复杂情境下的决策能力。总的来说,ChatGPT的分析能力可以为改善自动驾驶技术的情景判断能力提供有力的支持。
ChatGPT带来的困难与挑战
尽管ChatGPT十分具有颠覆性,但亚马逊却对其充满了警惕,甚至警告员工不要与ChatGPT分享机密信息。微软高级工程师也表示“请不要将敏感数据发送给OpenAI终端,因为他们可能会将其用于训练未来的模型。”
原因就是我们老生常谈的话题:数据隐私。
以ChatGPT的数据体量,人类在ChatGPT面前没有秘密可言,任何人类留存在网络的信息,ChatGPT应该都搜索得到,包括我们的隐私。从ChatGPT的表现来看,小到人类个人都可能成为其受害者,个人或企业肖像、名誉等人格和财产权益可能受到损害,大到ChatGPT会给社会秩序、国家政治稳定和安全造成巨大威胁。自动驾驶领域也不例外,并且直接关系到人类的出行安全,其使用更应该得到谨慎处理及关注。
所幸的是,ChatGPT现在还属于人类管控,而且应该是被冻结了找出隐私的功能。因此,不管是汽车行业还是其他行业,在使用ChatGPT上,并不是只管用就行,还存在着技术上的挑战。除了数据安全外,还需要大量的专业知识和高质量的训练数据,以及专业的技术支持,以解决技术上的问题和难题。
总结
ChatGPT的横空出世对于自动驾驶行业的从业者们来说无疑是感到激动兴奋的,其成功证明了机器可以学习到人类的知识到何种地步,也证明了类人驾驶在未来的可行性。在未来,ChatGPT将对自动驾驶行业产生重要的影响,将改善包括车载语言识别、智能座舱、导航系统等等智能化设备,为消费者提供更加高效和便捷的驾驶体验。在自动驾驶行业不断发展的过程中,ChatGPT将成为一把利器,推动行业技术的提升和创新。更多咨询请关注智车科技公众平台!
- End -