ChatGPT的火爆,已经席卷到了汽车领域。
众多相关企业宣布纷纷布局,车企也争相宣布将搭载类似产品。
2月初,百度宣布将在今年3月完成类似ChatGPT的项目“文心一言”的内部测试。据悉,该产品是基于百度文心大模型ERNIE打造,具备跨模态、跨语言的深度语义理解与生成能力。
在百度官宣推出该产品之后,截止到2月20日,已有集度、岚图、红旗、长城、东风日产、爱驰、零跑、吉利汽车、海马汽车等近10家车企加入文心一言的朋友圈。
自动驾驶领域,2月17日,毫末智行宣布将自动驾驶认知大模型(人驾自监督认知大模型)正式升级为“DriveGPT”,在自动驾驶模型算法方面,全面运用ChatGPT的模型和技术逻辑。
毫末智行方面表示,ChatGPT采用的是Transformer大模型以及“人类反馈强化学习(RLHF)”技术,而毫末智行是国内最早将Transformer大模型引入到数据智能体系MANA当中的企业。
随着汽车新四化的发展,在电动化之后,智能化成为引领汽车行业持续发展的重要动力因素。而汽车智能化的发展,则离不开人工智能技术的加持。
也正因此,ChatGPT的火爆也让汽车行业看到了巨大的价值空间。
作为一种对话式的软件,业内人士认为ChatGPT技术或最先在智能座舱领域、车载语音等智能交互功能上落地。
此外,其背后所使用的AI大模型,也对自动驾驶技术的发展具有重要的作用。中国科学院院士、清华大学教授、百人会副理事长欧阳明高认为,ChatGPT会让自动驾驶、智能驾驶的编程变得更简单,并将成为重要的技术趋势。
在面向企业整车研发的过程中,ChatGPT也能够提供一定的助力作用。
那么,ChatGPT将如何助力汽车行业发展?而众多入局的玩家,谁又能够做智能汽车行业的“ChatGPT”?
在讲ChatGPT对汽车行业的影响和应用之前,我们需要先搞清楚这个产品究竟是什么,以及背后应用的核心技术是什么。
ChatGPT是由美国公司OpenAI研发的一款基于上千亿超大语料参数组成的 GPT3.0 架构训练出来的自然语言处理聊天工具。ChatGPT 的算法采用了 Transformer 神经网络架构,具有很好的时序数据处理能力。
ChatGPT于去年12月正式上线,上线5天注册用户突破100万,两个月后用户量突破1亿。
据用户在社交媒体晒出来的对话例子,可以看出ChatGPT能够完成包括写代码,修复bug(代码改错),翻译文献,写小说,写商业文案,创作菜谱,做作业,评价作业等一系列常见文字输出型任务。
ChatGPT所表现出来的能力非常智能,甚至连特斯拉CEO埃隆·马斯克都在社交媒体称赞道:“ChatGPT好得吓人,我们离危险而强大的人工智能不远了。”
一般来说,想要机器人能够准确、迅速的理解人类语音并进行回答,就需基于海量的数据建立的模型去支持机器人进行训练。这也意味着,模型需要具备处理海量数据的能力。
传统的算法小模型已经并不具备该能力。因此,随着人工智能技术的发展,以及海量数据的加持,算法训练模型也从传统的算法小模型逐渐发展至大模型。
ChatGPT的背后,也是基于算法大模型的支持。
在NLP领域早期发展阶段,主流的模型为循环神经网络,但该模型存在不稳定或者过早停止有效训练等问题。因此,在2017年,谷歌大脑团队首次提出基于自我注意力机制(self-attention)的变换器(Transformer)模型,并首次将其用于理解人类的语言。
在Transformer之后,OpenAI又相继在语言处理大模型领域推出了包括GPT-1、GPT-2、GPT-3等语言训练大模型。ChatGPT则是OpenAI对GPT-3模型(又称为GPT-3.5)微调后开发出来的对话机器人。
从2017年的Transformer到今天的ChatGPT,大型语言模型经历了如此多的迭代,一代比一代性能更强。现如今,随着汽车智能化的发展,以及整车对海量数据处理的实际需求,算法大模型也势必会对汽车行业产生重要影响。
整车在智能化过程中,离不开感知(识别)、理解和决策三方面的能力。其中,理解人类语言,分析感知数据,成为汽车智能化发展所面临的重要难题之一。
而ChatGPT基于大规模预训练语言模型(GPT-3.5),通过在人工标注和反馈的大规模数据上进行学习,能够更好的理解人类的问题并给出更好的回答。
另外,ChatGPT还使用了一种叫「人类反馈强化学习(RLHF)」的训练方法,在训练中可以根据人类反馈,保证对无益、失真或偏见信息的最小化输出。
基于如此强大的能力,ChatGPT能够集成至车上各个场景,助力汽车行业智能化发展。
首先,车载语音领域或将是ChatGPT最先落地的应用场景之一。
行业专家表示,ChatGPT在推理和学习能力上优势明显,不仅可以用于理解和对话,更可以通过上下文交流和自我学习,来实现辅助创作和知识进化。
ChatGPT这些能力同样适用车载语音交互领域,融合对话智能技术、深度学习大模型技术、工程化能力、大数据的潜力,带来更流畅、更有效的响应。在车内有限的空间,结合声场定位和多说话人判断,提升多角色、长上下文对话的逻辑一致性;更可以拓展满足方言、外语的统一识别和对话需求,快速实现更灵活、自由、个性化的交互。
2月14日,在集度ROBOVERSE三里屯体验中心启动会上,集度汽车CEO夏一平宣布,集度汽车机器人将融合百度文心一言的全面能力,打造全球首个针对智能汽车场景的大模型人工智能交互体验,将“支持汽车机器人实现自然交流的再进阶”。
此前,集度智能驾驶负责人王伟宝也谈到,关于集度将引入汽车的百度文心一言大模型,其现阶段将用于语音和对话方面,未来不排除把该模型融入自动驾驶的数据生成工作中。
在自动驾驶领域,ChatGPT背后所应用的算法大模型,具备对海量算法的处理能力以及多维度分析能力。因此,ChatGPT也能够通过分析驾驶行为数据,找出驾驶员的行为规律,以此来训练自动驾驶控制系统,从而提高系统在复杂情境下的决策能力。
毫末智行是国内首家将Transformer大模型引入数据智能体系中的公司。
此前,毫末智行也曾多次表示,当前自动驾驶行业正在从小规模数据、小模型的软件驱动的2.0时代向大规模数据、大参数模型为代表的数据驱动的3.0时代的跨越阶段。
在今年1月份举办的毫末智行AI DAY上,毫末智行CEO顾维灏重点提及ChatGPT,并直言:“毫末已经展开对ChatGPT背后的技术研究。”
顾维灏还表示,实际上,此前毫末智行推出的人驾自监督认知大模型就已借鉴了ChatGPT的实现思路,采用人类反馈强化学习(RLHF)技术,通过引入真实人驾接管数据,对自动驾驶认知决策模型进行持续优化。通过这一大模型,在掉头、环岛等公认的困难场景中,场景通过率提升30%以上。
2月17日,毫末智行宣布将自动驾驶认知大模型(人驾自监督认知大模型)正式升级为“DriveGPT”,并称将在2023年4月举行的第八届HAOMO AI DAY上公布重要进展。
据悉,目前毫末DriveGPT已完成模型搭建和第一阶段数据的跑通,参数规模可对标GPT-2的水平。接下来 DriveGPT将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果,同时也将DriveGPT作为云端测评模型,用来评估车端小模型的驾驶效果。
除了车载语音和自动驾驶领域外,DriveGPT还可以应用至汽车研发上,比如说,其可以通过对数据的分析和处理,为汽车生产企业提供更准确的生产计划和决策,帮助汽车生产企业实现更加智能化的生产管理,降低生产成本和提高生产效率。
当然,现阶段ChatGPT在汽车领域的应用尚处于初步阶段,未来发展还充满着不确定性。那么,在如此火热的狂潮下,国内众多玩家中谁又能够真正跑出第一个“ChatGPT”?
要做智能汽车行业的ChatGPT,门槛并不低。
一方面,ChatGPT背后最核心的技术能力,是大模型对数据的处理能力,而这又需要对AI具有非常深厚的技术积累。
另一方面,从成本来看,ChatGPT的研究需要巨大的资金和人才投入,其需要超算平台、算法、数据等各核心力量支撑。
由此来看,当前只有巨头平台公司具备这方面的优势,对于科技企业可以更多从场景融合入手,寻求创新机会。
目前,在智能汽车领域,百度率先推出了“文心一言”产品,剑指车载语音赛道。而该赛道中,科大讯飞、Cerence又占据着强势的市场份额优势,二者在NLP领域也有着深厚的技术积累。
在自动驾驶赛道中,特斯拉是最先引用Transformer的企业,毫末智行紧随其后,是国内最早一批率先展开对人工智能技术的研究,并率先将其优化应用至自身的自动驾驶系统之中,这一点几乎可以是与特斯拉同步。
此外,基于对前沿技术发展趋势的准确判断,毫末智行率先实现了智能辅助驾驶产品的规模量产,打通自动驾驶数据闭环,并快速实现产品迭代升级。
2021年初,毫末智行宣布推出HPilot1.0,在之后短时间内,很快就推出2.0和3.0产品,并且在3.0产品上实现了类似特斯拉FSD的飞跃式的换代。
此外,面对ChatGPT的火热,甚至原美团联合创始人王慧文都按耐不住,高调在社交平台公布一则求贤令,为其创立的北京光年之外科技有限公司招揽AI研发大牛,并以2亿美元的估值,个人出资5000万美元,只为打造中国的OpenAI。
智能汽车的发展和技术的迭代升级,离不开AI技术的支持。ChatGPT火热,也让汽车行业看到未来无限的发展空间。那么,在众多车企官宣入局之后,谁又能够做出真正的第一个国内“ChatGPT”?
本文来自微信公众号“HiEV大蒜粒车研所”(ID:XEVLab),作者:白日梦想家,36氪经授权发布。