当前位置:首页|资讯|文心一言|百度

虽支持8路语音+免唤醒,但大家对文心一言的期待过高了?

作者:路咖汽车发布时间:2023-05-27

原标题:虽支持8路语音+免唤醒,但大家对文心一言的期待过高了?

昨夜,走在AI人工智能最前沿的英伟达股价大涨24.37%,市值在一个交易日内暴涨1840亿美元(约1.3万亿元人民币),超越苹果创美股历史上单日市值涨幅第一,1840亿美元意味着英伟达一天就涨出“1.6个英特尔”,这就是英伟达公布一季度财报之后的威力,英伟达乘着2023年AI人工智能领域的东风,迅速起飞。

人工智能领域的大蛋糕,谁都想分一块,百度自然不会落后。就在今天,百度CEO李彦宏在2023中关村论坛上表示,百度很快会正式推出文心大模型3.5版本。百度作为国内今年最早发布大模型AI的企业,它的整体大模型架构也要迎来新的一版。而百度的文心一言在发布之时,就有不少车企宣布将把文心一言纳入到智能座舱当中。

而就在最近,百度智能座舱demo版本正式亮相,在百度Apollo智能车,大家可以首次体验到有文心一言加持的智能座舱,对于AI上车,大家都抱有非常高的期待,这也普遍被认为是改变目前智能座舱研发瓶颈的一个关键。

同时支持8路语音,这才是AI“助手”?

百度的文心一言,作为一个语言大模型,它目前最大的用处还是在加持智能语音系统方面,而百度的智能车上,使用了一片高通骁龙8295芯片来驱动整个智能化系统,这也是目前车机硬件的“天花板”了,在下一个阶段,高通8295芯片会集中上车,5纳米制程,30Tops的算力,这枚芯片会给智能座舱提供更为充沛的算力,以及持续的生命力,当然高算力芯片对于语音系统的加持会更为明显。

目前的智能语音系统,虽然已经很智能,能够帮助使用者去完成很多事情,但它基本上还没有跳出执行指令的这个范畴,只能说是工具,还不能算是助手。其实也就是用语言去代替一些动手的基础操作,比如开关窗、调节空调、调整模式等,这些其实都是去完成最基础的指令,目前绝大多数的语音系统还都在卷准确性与反应速度,因为做到这些基础操作,其实已经不容易,而大多数新势力现在都开始接入神经网络,接入AI人工智能,去训练智能语音系统。

那么百度的文心一言做的有哪些不同呢?首先就是反应速度,小度车载语音可以做到全领域毫秒级响应,速度会达到端到端的800毫秒,基本上就是你的话音还没有落,系统已经开始执行操作了,这个表现其实主要还是得益于充足的算力,当然开发语音系统也不只要依靠8295,还需要其他很多辅助芯片。

其次,百度的小度车载语音在开机之后,是支持免唤醒功能的,也就是不需要你去额外的点击按键或者说唤醒词来启动语音,想要做什么,直接说就可以了,其实省去唤醒的这一个步骤,并不容易,可省去这一个步骤会极大提升体验感。特别是这款语音系统可以同时支持8路语音的输入,8个人可以同时说出需求,目前新势力们跨音区识别的能力在4路语音这个层次上,而百度这套软件直接卷飞了。

而免唤醒的语音系统和跨音区识别,目前在其他新势力车型上也已经有所搭载,误识别的问题又是一个痛点,特别是车内成员比较多,人多口杂时,百度如何优化这个问题?小度车载语音通过语音加语义的多模拒识,可以达到非常高的拒识准确率,官方称能达到95%,而且是全程在线的,也就是说系统其实是时刻在线的,而且每时每刻都要承担不小的压力。

但目前的表现,与蔚小理无异?

而小度语音基于大模型本地化技术开发,它是把云端参数非常大的模型通过蒸馏和裁剪方式,把整个体积和运行资源做成很小的体积,然后再移植到车端上,体用车辆自身硬件算力,再去进行甄别,从而提升语音交互方面的体验。

而由于是时刻在线,所以语音系统肯定会听到很多车内交流的内容,而这里面只有极少数是有用的部分,那么没用的这些部分其实也会涵盖大量车主的隐私问题,这部分如何避免隐私泄露呢?其实这套系统采取的是“听后即焚”的策略,数据都保留在了本地,并不会上传到云端,就像特斯拉等车型的哨兵模式所采集的数据一样。

这套系统可以成为你的AI助手,文心一言的其他功能,比如写文案,按描述画图等功能,也是可以实现的,除此之外还有一个闲聊模式,就是可以让你把小度语音当做另一个人,和它进行真实的对话,唠唠家常什么的。

其实这么看下来,这套有文心一言大模型加持的小度语音系统和车机,其表现与现在的头部新势力车机系统,并没有拉开太大的差距,有了AI的加持后,好像还并没有做出什么改变使用逻辑,或者说操作习惯的变化。

这套语音系统在大算力芯片和大模型的加持下,有了比如8音区同时在线、免唤醒、AI小助手这些功能,但其实还是停留在了指令式的范畴内,它所实现的功能还没有超脱出我们的认知和想象,比较符合大家的预期。

但是,我们看到了这套系统其实做出了很多可以在无网环境下的操作,这其实也算是一个痛点问题,因为绝大多数现有车型的智能化都属于是“有网一条龙,无网一条虫”,比如小鹏和理想它们在现阶段已经开始克服这个问题,不过百度把文心一言的大模型植入到了每一台车内,降低了每台车在执行智能化需求时对于网络的依赖程度,而制约这套系统的可能还会是算力问题,因为真正到了AI人工智能领域,30Tops的算力可能依旧不够看的。

总结:

目前这套系统也还是属于工程版阶段,而直接放上还未完全实现量产的高通8295芯片,更能看出这还不是最终版本。我们看到很多车型都已经体验“预订”了百度文心一言的上车名额,而目前价格很高的8295芯片可能并不是这些车都能承受得起的。

而百度也进行了向下的兼容,高通8155平台也是可以兼容的,只是可能在性能方面有些不同,毕竟8155的算力只有8Tops,在前两年看这还是很强悍的,不过在如今其实已经不太够用了,而很多车都在采用成熟的8155骁龙座舱平台,百度非常有必要再去为老平台开发对应的方案,毕竟需求量最大的还是这些成熟平台下的车型。

这次百度文心一言加持下的座舱体验,揭开了AI上车的序幕,相信国内众多与百度合作开发车机的车企,都会迅速用上这套系统,而且其中涵盖了不少合资车企,在有了AI加持后的合资车们,可能会迅速缩小与新势力们的智能化差距,新一轮的内卷即将到来。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1