国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级。业内人士表示,在AI方面国内“并没有落后多少”。
今日(29日),苹果智能(Apple Intelligence)终于在海外上线。苹果计划在12月份推出新一批AI功能,包括将ChatGPT服务集成到Siri中,以及推出更强大的图像生成工具。不过,Apple Intelligence何时能够在中国市场使用还尚未确定。
近日来,国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级,各种AI智能体、AI OS的概念铺天盖地袭来。
可以说,苹果智能尚未落地中国市场的窗口期,正促使国产手机厂商进一步以AI卖点来加码旗舰机型的竞争。各家手机厂商都明确要做系统级AI,要做AI OS、做好AI智能体。
IDC中国研究经理郭天翔对《科创板日报》表示,安卓阵营和苹果在AI方面的思路类似,都是注重端侧模型、智能体的概念。“在AI方面国内并没有落后多少。”
作为 iPhone 的语音助手, Siri 可以通过语音指令进行简单操作。但由于过去的回答主要基于搜索引擎,智能程度非常有限,并没有能取代手机的APP交互模式。随着大模型的发展,以Siri为代表的手机助手有望变得更有智商,从语音助手升级为AI智能体。比如想要预定酒店行程,不需要再打开APP,而是直接与AI智能体对话来完成。
谈及智能体是否会取代APP,荣耀CEO赵明认为,大概率是往这个方向发展,但是相当长的时间内,APP和智能体肯定是一个长期共存的方式。“这涉及到一个使用习惯的问题,还有各种意想不到的体验障碍的问题,所以一定是相当长的时间内并存,或者长期可能并存。”
作为智能体交互模式的第一步,AI识屏已开始在国内安卓手机上落地。最新发布的OPPO Find X8上线了一键问屏功能,能智能解析屏幕信息,并根据内容与用户互动,提供相应的解答和操作。
“举个例子,平时拍摄的景点照片,直接一键让AI识别并回答这是哪、背后有什么故事。看上去很简单,但背后涉及到全国3A级以上16000个景点,差不多百万级的数据来做专项训练。“OPPO AI中心产品总监张峻表示。
荣耀则发布搭载智能体的AI操作系统MagicOS 9.0。赵明介绍,现在智能体可以模拟人来点击屏幕、阅读理解屏幕,进行慢思考、找到关键的信息,然后进行相应的操作。目前可分为“自动驾驶”的智能体以及与应用交互的智能体两大类。
“自动驾驶的智能体,无需第三方的介入,首先对用户意图进行分析理解。比如说帮我点杯喝的,智能体能理解意图背后的这些信息和逻辑,对意图场景进行分解之后,变成可执行的指令,最终实现了点咖啡的操作。另一种则需要应用方进行协同。比如,荣耀跟中国移动的灵犀大模型。在查询手机话费的余额、充50块钱话费的过程当中,调用了灵犀的型进行接管。上述两种智能体未来一定是并存的,会有需要生态介入的部分,也有一些操作可以自动进行。”
对于未来AI交互在手机上的发展,多名业内人士认为,符合直觉、最直接的方式,会最终占据主流。
郭天翔表示,识屏交互属于AI手机一种新的交互方式,更便于用户的使用,降低学习成本。从目前看,未来AI交互还是会以最直接最简单的方式为主,从人的本能出发。
OPPO首席产品官刘作虎也认为,符合直觉是最基本的AI理念。
“我每周都会开AI专项会,一直灌输一个概念:不管是什么,首先是符合直觉。我们看到很多可能炫技的东西,看似很简单,其实背后的技术要求很高。就像一键问屏,怎么识别用户的意图、识别屏幕,里面涉及很多的分流技术。但技术最终都要回到用户做产品。比如使用导航时,打开就有地址,直接一按就到目的地,AI时代就是直觉更加高效,这是最基本的AI理念。”
大模型要装入手机,在前景无限的同时,挑战并存。手机上有限的算力决定了端侧模型不能过大,但小参数的模型在能力上又受到局限。
郭天翔表示,现在端侧模型已经不再过于强调模型参数的大小,而是追求使用体验、占用内存以及功耗之间的平衡。
刘作虎坦言,端侧模型对性能要求很高,不管是性能还是内存的要求都非常高。所以如何持续优化架构、高能效发挥芯片潜能,仍是很漫长的路。
“目前还有很多事情可以做。比如对平台的散热,可能大家会觉得很简单,其实很难。还有怎么做好底层内存的调用等等。说实话,AI在手机行业还是刚刚开始,接下来大家会看到非常多的AI变化。”
张峻透露, OPPO即将推出新的端侧架构AI LoRA,来降低内存等资源的占用。
“端侧AI最大的瓶颈是手机计算资源的使用。比如同时在手机上实现三个功能的端侧化,正常而言要占用三个相应的资源。假使把模型比做火车头,上了三个模型就意味着需要三个火车头再加车厢。而LoRA架构采用了基模型+应用模型的模式。只需要一个基模型,即只有一个火车头。后面的应用模型,相当于三个车厢,像左轮手枪一样,可以轮换。当需要什么模型,就上什么车厢,这样的内存峰值占用,可以节约75%。”
对于大模型的发展,业内普遍保持短期审慎、长期乐观的态度。在端侧的落地亦如是。
刘作虎分析,AI时代的变化非常快。“过去对手机操作系统,我们是按半年、一年来做规划。而AI时代,一定不是这样。谁能知道一年后,AI是什么样子。AI产品甚至不是每三个月规划,应该每个月去规划。模型变化太快,技术超出想象速度。坦白讲,我自己都有很大的紧迫性。”
刘作虎强调,在AI时代做产品就是要快跑。“你一定要去跑,跑得要快,不然要落后,要紧跟技术的变化。
近日,中国信息通信研究院发布了全球首份《终端智能化分级研究报告》,将终端智能化水平分为五个等级L1-L5,智能化等级越高,终端自主参与度越高,人的参与度越低。L1级和L2级具备一定智能化,可以完成单类型任务。L3级和L4级逐步从感知识别复杂意图到识别潜在意图。L5级具备全面智能化,能够自主规划完成全类型任务。
赵明表示,当前终端智能化水平处于L3的水平,要通往下一个L4、L5的阶段,所需的时间会更长一点,需要更多的积累。
“今天我们可以实现用户理解类别达到950项。未来,一定能够涵盖手机诸多的运行,把现有在传统手机上需要更多人干预的地方,逐步都消除掉。现在,一句话拨打手机电话没问题,微信视频也可以了,点咖啡也能做到。再往下一步,要实现更多、更模糊的指令,以及更复杂的关系之间的理解。”
本文来自微信公众号“财联社AI daily”,作者:黄心怡,36氪经授权发布。