目前“AI手机”只是附加了AI功能的智能手机,革命性的改变尚未来临
文|杨柳
编辑|郭丽琴
农历新年复工后,多家手机厂商铺开了面向市场的新故事:全力押注AI手机。这不由让人追问,AIGC能否在手机端找到可持续盈利的技术和商业模式。
先是OPPO CEO陈明永发布的内部信断言,AI手机将成为继功能机、智能手机之后的第三阶段,OPPO专门成立了AI中心。同一天,魅族宣布进行战略调整,停止传统智能手机新项目的开发,全力投入“明日设备”。
这股吹向手机厂商的大模型劲风,从2023年下半年便逐步蓄势。手机厂商纷纷自研大模型,随后推出AI手机新款。受制于调用云端大模型服务的高成本等因素,这些AI手机追求在本地设备端搭载运行大模型。OPPO、vivo、荣耀、三星、谷歌等,成为快速抢滩的安卓阵营厂商。苹果动作稍缓,但据媒体报道,苹果即将升级的操作系统iOS18将引入大模型支持语音助手Siri。
“生成式AI和手机的结合是‘双向奔赴’。”市场分析机构Counterpoint Research智能手机业分析师Archie Zhang向《财经》表示,作为目前市场最大的消费电子产品,手机与AI结合,有助于将AI技术普及至千家万户;同时,近十年来,智能手机交互逻辑和生态变化不大,生成式AI技术(AIGC)有潜力革新目前的手机生态和交互方式。
智能硬件AI化,是当前大模型商业化落地的主流方向之一。当前,传统智能手机市场已陷入疲态,Counterpoint Research报告显示,2023年全球智能手机出货量降至十年来的低点,同比收缩5%。智能手机市场能否借助大模型实现产品迭代,形成新的增长曲线,尚待观望。但咨询机构IDC近日已给出预测,2024年全球市场AI手机的出货量将达到1.7亿部,约占智能手机整体出货量的15%;中国市场到2027年,AI手机有望达到1.5亿台,占智能手机市场份额超过50%。
那么,要成为生成式AI技术的载体,并形成可持续盈利的商业模式,现在的AI手机技术已经做到了哪些?又在哪些方面仍存较大差距?
如何定义一台“AI手机”?
2月20日的一场AI战略发布会上,OPPO首席产品官刘作虎率先给出了AI手机的特征解释。具体而言分为四项特征:要能高效地利用计算资源,以满足生成式AI的计算需要;要能敏锐地感知真实世界,了解用户与环境的复杂信息;拥有强大的自主学习能力;具备更充沛的创作能力,为用户提供持续的灵感与知识支持。
其中,为实现计算资源的高效利用,各家手机厂商投向大模型端侧化部署的路径。通俗来讲,就是将大模型直接内置在手机设备,而不是从云端调用服务,意味着即便断网也能使用本地化部署的大模型服务。
综合手机厂商以及受访分析师和行业人士的解释来看,端侧部署的原因包括:优化用户的使用体验、提供产品卖点和降低手机厂商的服务成本。
咨询机构Canalys研究分析师钟晓磊告诉《财经》,从用户层面讲,端侧大模型具有更强的隐私性以及实时性,能够在保证隐私的前提下进一步拓展应用场景,如实时翻译,断网状态下的语音助手等。
某些用户使用场景,也离不开端侧部署。2月20日OPPO AI战略发布会后接受群访时,刘作虎举例说,一般人用云相册的实际比例比较低,还是习惯把照片保留在手机本地,如果需要针对相册提供某些AI功能,无法强迫用户必须把相册传到云上才能体验,而只能做端侧部署。
从行业及厂商角度来看,钟晓磊分析说,端侧大模型对SoC(系统级芯片)性能、DRAM(一种存储芯片)等提出了更高的要求,目前市面上能满足该需求的机型供应较少,渗透率低且均价高,因而具有差异化的端侧大模型体验,有望加速整体换机周期。相比而言,与云端大模型相关的5G、WIFI-7等概念,目前看来能够提供的价值量增长空间仍不如前者。并且,大模型的端侧运行亦能帮助厂商节省运营成本。
“如果仅作云端部署,这个成本没有一家手机厂商能扛得住。”一位曾在华为和OPPO技术研发部门从业多年的行业人士向《财经》表示,大模型的推理面临成本压力,现在头部品牌都有几亿的用户,如果每天调用云端大模型十次,成本将不堪重负。据vivo副总裁周围公开披露的具体成本,目前调用一次云端大模型的平均成本在0.012-0.015元。如果以0.012元/次计算,一亿用户每天调用十次的成本高达1200万元。
端侧部署并不意味着不再需要云端大模型,按照手机厂商的思路,这只是一种分配计算资源的优化选择,必要时刻仍需云端的配合。
“参数小的‘轻模型’和参数大的‘重模型’的混搭,是非常常见的设计思路。”前述手机行业技术研发人士说,“轻模型”用于处理紧急、实时的一些需求,“重模型”用来查缺补漏。
钟晓磊介绍,模态单一、有一定隐私以及实时性需求的场景较多通过端侧AI实现,例如实时翻译、通话转录;而涉及到视频、图像等对算力要求较高的多模态场景,大多还是通过云端大模型去完成。但随着模型优化以及硬件算力的提升,有望在未来看到更多此类多模态场景在端侧运行。
手机端采用大模型“压缩版”
端侧部署的前提,是将“重模型”轻量化。钟晓磊说,由于手机算力等的限制,手机端侧大模型的参数规模最好控制在10B(100亿)以内,较为考验厂商如何在有限的参数规模下对模型进行调优,保证输出质量。
市场上新推出的AI手机,其端侧大模型参数多处在70亿的水平。例如,OPPO在1月8日发布的Find X7系列,荣耀1月11日发布的Magic6系列,以及vivo在2023年11月上线的X100系列,搭载的手机端模型均为70亿参数。
芯片厂商也抓住这轮AI手机热潮,改进手机芯片性能,为大模型本地化运行提供算力底座。
高通2023年10月发布的骁龙8 Gen3,和联发科同年10月面世的天玑9300,是目前市面上两款主流的支持生成式AI的移动端SoC芯片。最新AI手机纷纷配置了这些迭代的移动芯片完成大模型端侧落地,比如OPPO Find X7系列搭载联发科天玑9300,荣耀Magic6系列集成的则是高通骁龙8 Gen3。高通公司介绍,骁龙8 Gen3支持在终端设备上运行100亿参数的模型,并且针对70亿参数大模型,每秒能够生成20个token,上市初期支持20多种AI模型。
前述手机行业技术研发人士认为,芯片AI能力的加强后,大家对每秒10-20个token的推理速度是可以接受的,可以预计未来1-2年内,高通和联发科肯定会进一步加强各自移动芯片的AI推理能力,提升手机端侧大模型运转的算力条件。
除了“吃算力”,大模型端侧部署还“吃内存”。vivo副总裁黄韬在一场手机发布会上曾介绍,大模型对手机运行内存性能的要求,起码是8G起步。咨询机构IDC近日预测,16GB内存(RAM)对于新一代AI手机将属于最低要求。
距离“AI智能体”还有多远?
虽然OPPO CEO陈明永将AI手机视为与功能机、智能手机并列的第三个手机发展阶段,但就《财经》在各品牌门店对初代AI手机的使用体验而言,仍然只是附加了AI功能的智能手机,革命性的改变尚未来临。
各个厂商的AI手机,大多围绕图片优化、文本创作、知识问答等功能展开。以搭载荣耀“魔法大模型”的Magic6系列手机为例,用户可通过唤醒语音助手“YOYO助理”,体验相关AI功能。该款手机可以根据生成特定主题视频的prompt(提示),自动查找本地相册符合该主题的图像素材并生成对应视频;以及简单创作美食探店、小红书种草等场景下的文案等。OPPO Find X7系列手机,则主打“AI消除”,清除用户在照片圈选的对象,并自动修复清除后遗留的画面。
OPPO AI消除功能
OPPO AI中心产品总监张峻在2月20日接受群访时,用“高效、创作和专属”三个关键词概括了AI手机的应用场景,即提高用户手机体验的效率、进行多模态内容生成、利用用户画像和智能体记忆能力打造个性化的AI助理。
生成式AI落地应用层,目前仍少见跑通的标杆案例,充斥着不确定性。但手机厂商在受访时对手机这一成熟消费电子的前景具有十足把握,相当于在一个确定性的产品基础上试验不确定性的技术。
刘作虎称,往后虽然会诞生凭借听觉感官进行交互的创新产品,但视觉仍是人们获取信息的最主要渠道。基于这一底层逻辑,他认为理想的交互方式依旧依靠屏幕,“手机至少在10年之内肯定是一个人最不可离开的设备,它的形态有可能会发生一些变化,但不会发生根本性的变化。”
大模型和手机的结合,当前集中在功能应用和服务层面,前述手机行业技术研发人士认为,大模型并没有深入底层的安卓系统,对操作系统没有直接的交互,因此并没有改变使用不同应用服务仍需跳转到相应App的现状。该人士称,未来大模型肯定要做在系统层,如果操作系统和大模型能打通,那么大模型可以帮助用户直接操作不同应用程序,真正成为用户的生活助理。
“手机厂商不应仅仅是将AI作为简单的功能堆砌,而是要深入挖掘用户需求,将AI技术与操作系统、实际应用场景进行深度融合。”分析师Archie Zhang举例说,比如准确感知用户的意图,让用户可以一键或是一个指令即可得到想要的内容和功能。
早有互联网大厂的研发人员看到用AI Agent(智能体)自主操作App的潜力。2023年12月,腾讯的研发人员开发了一款AppAgent的产品,直接模拟人类的操作,与手机的图形用户界面(GUI)交互。2024年1月底,阿里的团队发布一篇论文,介绍了其研发的手机操纵智能体框架Mobile-Agent,可以根据用户指令自主完成刷视频点赞评论、在电商平台下单等任务。
Mobile-Agent自主留言评论
王君阳是Mobile-Agent的研发者之一,他告诉《财经》,与腾讯团队的AppAgent需要从 安卓系统调用XML文件不同,Mobile-Agent无需权限去访问这种底层代码,而是利用视觉感知工具来准确识别和定位App前端界面中的视觉和文本元素,实现对App的自动规划操作。这类自动化操作的智能体,在完成机械性工作,以及面向老年人、残障人士群体,有不错的市场前景。
但王君阳介绍说,还没有把Mobile-Agent做成产品的想法,现在还难以克服安全性的问题,作为一个手机助手,智能体需要时刻关注屏幕上的内容,可能会看到用户手机界面一些敏感的信息。
将手机终端变成一个AI智能体,自然也被纳入到手机厂商的战略规划。按照刘作虎的说法,“每一个人都应该有一个超级助理,一站式地把所有需求搞定”。这背后还潜藏着手机厂商搅动现有超级App厂商地位的野心和利益冲突,“未来可以直接跟它(手机终端)对话,我为什么还要再进到一个所谓的超级App里面去?”刘作虎说。
责编|肖振宇
题图|视觉中国