近日,极越宣布将首次大版本升级,陆续向全量用户OTA推送V1.3版本软件。作为极越01交付以来的首次整车级升级,V1.3包含了OCC占用网络技术上车在内的通用视觉能力进化、SIMO完全融入文心一言4.0在内的通用语音能力进化、冬季模式等安全和生态服务等5大类、超400个功能点升级。而其中的OCC技术应用与文心一言升级是BAO师傅认为将掀起2024车企新卷点的核心。
这次升级的一大亮点是极越官方宣称的“B.O.T三向箔”,它是将“BEV+OCC+Transformer”组成的纯视觉感知完整体系的正式命名。BEV(Bird Eye View 鸟瞰视角)+Transformer(是 Google 的团队在 2017 年提出的一种 NLP 经典模型)的“纯视觉”技术方案已经在极越01上实现了量产,此次,极越又加入了OCC技术(Occupancy Network占用网络技术)。使纯视觉自动驾驶方案如虎添翼。
作为“纯视觉”方案的核心技术之一,OCC是一种基于学习的三维重建方法,通过产生3D体素,将这些3D体素与3D重建体素(Nerf离线训练得到)进行比较,从而实现感知识别,既能辨别出“不能碰的物体”又能发现“可以碰的网格”。 和BEV(Bird's Eye View)鸟瞰视角相比,OCC解决了不识别就不能作为障碍物的问题,能够更好地理解和处理三维空间数据,从而实现更精确和高效的操作,显著增强理解周围环境的能力。甚至有业内人士认为,OCC将彻底弥补当前感知算法最后一公里的缺陷。不过BAO师傅个人认为,这样的算法虽然能够补足纯视觉方案的部分不足,却没办法改变纯视觉方案在夜间以及能见度低情况下的感知缺陷,不过不排除未来还会有其他廉价解决方案能够替代激光雷达方案的路线。但“BEV+OCC+Transformer”的方法无疑能够带来大幅降低车上硬件成本的好处。
在极越发布的OCC占用网络技术演示视频中,OCC技术在汽车机器人的视觉世界里,实时重建还原了3D场景,车内系统用体素清晰地展示了栏杆、绿植、路障等标准障碍物,同时还识别出了施工中的工程车、树木中的路灯等异形障碍物。其中蓝色网格代表静态建筑物,如路中心护栏隔离带、施工围栏;橙色代表动态交通参与者,包括机动车、非机动车;还有紫色马路沿、绿色绿化带等,每一个网格约15厘米。极越官方表示,它对运动障碍物的速度识别精度也可控制在0.1米/秒误差范围内。目前,极越01的“纯视觉”高阶智驾高速PPA可用范围已包含全国90%的高速高架,城市PPA已经跑通上海、北京、深圳、杭州4个城市的主要城市道路。
这次OTA升级的另一大亮点,就是文心一言大模型将从3.5升级为4.0,智能AI伙伴SIMO也将充分融合文心一言。用户无需“Hi SIMO,打开文心一言”,直接语音提问SIMO就能体验文心一言4.0的全部能力,并且在使用文心一言过程中依然支持其他功能指令(如“SIMO打开车窗”)。这次升级还优化了此前不能兼容使用指令的情况。SIMO支持查询前方5公里红绿灯数量、离线查询车内温度/日期、询问当前歌手/歌曲名,并且可自定义开/关其他音区SIMO语音指令识别。
另外,在未来的版本升级中,基于AI大模型重构的百度地图、小度也即将全面融入SIMO。比如,SIMO将与小度完全打通,实现对小度全屋智能设备的操控,并接入超1500+生态品牌,真正实现车家互控。
在BAO师傅看来,大模型融入语音系统,最大的好处是让车主的用车体验大幅上升,但对于企业而言,它会成为一个像操作系统一样的角色,成为贯穿各个应用的核心线索。此前理想的大模型就打通了美团的操作,此次极越则是打通了百度地图,各家都在把大模型作为自家热门应用的核心引导。而这样的趋势,或许将在2024年愈演愈烈,未来包括拥有强势应用地位的高德地图、微信都将参战。
而另一方面,OCC占用网络无疑是给低成本的纯视觉类自动驾驶方案打了一剂强心针,相信在未来的一年中,也会有越来越多的车企入局,甚至不排除有激光雷达方案的企业“反水”,毕竟当谁都在卷价格的时代,谁又会对合情合理合法的成本降低说不呢。所以这次极越的OTA无疑是给竞争更加激烈的2024年起了个头,在几个核心卷点上率先来了个当头炮。