每经记者:王晶 每经编辑:杨夏
在硬件堆砌难以拉动销量增长后,智能手机市场再次“卷”向软件层面。
上一轮软件层面的竞争,手机厂商竞相采用智能语音助手,但对用户来说存在感一直不高,不同于此,如今ChatGPT引发了全球AI领域的军备赛,在AI大模型的驱动下,各大手机厂商不约而同地将目光投向了手机端侧载体。
11月16日,在OPPO开发者大会(ODC 2023)上,ColorOS(OPPO推出基于Android定制的操作系统)14首发对话增强的安第斯大模型(AndesGPT),其中包括从10亿至千亿多种不同参数规模的模型。同时,安第斯还将与潘塔纳尔系统融合,在大模型的加持下,对用户意图理解更精准,从而推出一系列专属服务。
OPPO开发者大会。 图片来源:OPPO供图
OPPO之外,当前包括华为、小米、vivo、荣耀等在内的手机厂商均已跑步进入大模型赛道,让一场围绕“软实力”的深水之战愈演愈烈。业界普遍认为,手机端侧与AI大模型能力融合后,未来将成为每个人的私人助手。
不过,应用在手机端的大模型是真正能引发智能手机巨变的技术,还是仍然偏重“语音助手”的噱头还有待观察,对于大多数智能手机厂商而言,在具有突破性的手机应用或产品出现之前,大型模型是不能放弃的高地。
手机端侧大模型初步跑通
过去AI大模型赛道的主要玩家以互联网大厂为首,但随着该技术在手机终端应用上的成熟,当前几乎所有的头部手机厂商集体将创新点向软件转移。
华金证券指出,AI大模型对手机的提升主要来自两方面:首先,AI大模型可增强手机处理图像、语音、NLP(自然语言处理)等任务的能力,大幅提升手机性能;其次,AI大模型拥有庞大的语言数据库作为训练资源,在算力和算法的支持下,手机可以理解复杂的语意和语境。基于准确的自然语义理解,外加庞大的知识和数据库,手机可以给出准确和快速的回答。随着人机交互愈发频繁,用户画像刻画将更为精确,回答也越发定制化,手机将真正意义上成为专属数字助手。
8月初,在华为开发者大会上,余承东表示鸿蒙4.0系统会迎来一个全新的语音助手“小艺”,其中包括知识获取、逻辑推理、任务规划、记忆扩展、工具调用和制作辅助等方面的功能。同样在8月,雷军在年度演讲中表示,小米全面拥抱大模型,并且在今年4月已经组建小米AI大模型团队。10月26日,小米发布澎湃OS,AI大模型的能力完全嵌入到澎湃OS;10月,OPPO宣布与联发科技合作共建轻量化大模型端侧部署方案。
OPPO在ODC 2023上介绍称,安第斯大模型采用云端相结合的方式落地端侧大模型,即通过手机端硬件+云的组合,实现以往单纯依赖云服务的智能语音助手所不能实现的效果。“当ColorOS融入了端云协同的安第斯后,用户可能只需要一句话,就能通过融合端侧与云侧数据更好理解用户,成为非常懂你的超级助理。在端云分工上,安第斯大模型会根据任务需求和模型能力不同,调用不同模型,比如联系人查询等简单任务,采用小模型端侧快速响应,知识/信息查询等复杂任务采用云端大模型准确回答,兼顾推理成本和用户体验。”
图片来源:OPPO供图
据悉,仅云端运行大模型的成本非常高昂。例如,ChatGPT这样的超大模型需要1000张主流卡容量的独立计算集群,以及对应的模型并行算法框架来支持训练。在成本方面,超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑,因此训练成本通常很高。ChatGPT单次模型训练耗时1个月,训练成本达1200万美元。
另一方面,如果将大模型直接上传到云端联网使用,又会失去端侧部署的优势。例如,大模型原本可以根据用户信息,在手机上个性化定制手机助理,且确保信息不上传到云端;但如果大模型在云端加载,势必要将个人信息通过网络上传,隐私安全无法保障。
实际上,相比其他应用领域,手机端是大模型最难落地的场景之一。受体积、性能、功耗的限制,如果直接将大模型部署在端侧,往往难以取得较好的使用效果,即使能运行起来,推理速度也不及预期,vivo副总裁、OS产品副总裁周围曾直言:“性能方面,如果做输入法的出词推荐,两秒才能出一个词;功耗方面,大参数量级的大模型在端侧运行的话非常耗电。”
为此,安第斯大模型在端侧对推理引擎进行算子融合与优化,通过与高通、联发科技合作,在行业采用4位量化技术(行业最优大模型端侧部署方案),使得安第斯大模型在端侧响应更快,从而提升模型的内容生成时间。
智能手机还有怎样的“进化”空间?
智能手机这类产品所面对的用户之广、应用场景之丰富,应用类型之多,是其他行业很难比拟的,在大模型落地端侧后,怎样用好大模型,真正给消费者带来价值是当前各大手机厂商思考的重点。
过去在提升用户体验方面,智能手机等泛终端的焦点主要集中在硬件性能和软件优化。当前,5G、云、AI正在加速推进万物互融的进程,同时,XR、元宇宙、机器人等未来技术场景、内容与形态也在不断创新发展。
QuestMobile数据统计显示,2022年1季度,国内移动互联网用户已接近12亿,人均拥有5台智能设备,超过50%的用户存在跨设备跨应用的需求。另据IoT Analytics预计,2025年全球可能将有超过270亿的物联网设备连接。然而,海量智能设备在帮助用户实现便利生活的同时,也放大了设备过多带来的副作用:设备间的生态差异、系统不兼容等问题,导致用户往往需要耗费更多精力不停切换设备/应用获取服务。
实际上,万物互融时代,用户关注的各类信息,常常以各种格式散落在各个应用之间,互不相通。例如用户要制作一份出行攻略,需要打开不同旅游类APP以及小红书、马蜂窝、大众点评……查找景点、美食、出行线路等等,保存不同格式内容素材,并且有的APP还不支持复制文本,只能截图后裁剪,操作极其繁琐,效率非常低。
对此,OPPO的解题思路是,将安第斯与潘塔纳尔系统融合,潘塔纳尔是OPPO实现不同设备和不同操作系统之间互联互通的系统,安第斯则拥有学习、记忆与计算能力,能够从用户情境、上下文对话、正在发生事件等多维度变量信息中识别用户需求,推动系统融合组装自有服务与三方服务。
举例来看,此前系统只有知道用户订了高铁票去北京,才会提前推送高铁行程信息。未来,安第斯大模型在理解用户需求后,系统会推荐用户合适的高铁班次进行购买。随后,系统将高铁卡片与目的地天气卡片进行融合,成为一张包含高铁班次、出行时间与北京天气温度的新卡片。此外,系统还会根据交通拥堵情况,以及用户偏好习惯,提供导航去高铁站停车场等关联服务推荐;如果识别到用户想去旅游,还会提供旅游相关的服务。
不过,要做到这种触达效果,要建立在大模型对用户需求的精准理解,以及潘塔纳尔对三方服务与系统服务的编排组合能力基础上。这需要OPPO持续扩大朋友圈、搭建生态。
布局生态圈在过去几年已成为手机厂商共同的动作。从投入路径来看,各家头部厂商在软件层面的切入点其实并不相同。
其中,华为打造的鸿蒙生态持续强调跨终端的全联接场景。苹果是最早的软硬结合的践行者,已经实现了生态闭环。手机行业进入存量时代,在原先的单一维度上寻求突破变得困难重重,各自为政只会恶性竞争、加剧内卷,但如果跨终端、多应用的企业联合起来,或许能有新的机遇。OPPO以已上线的美团卡片为例,通过对用户各环节意图的精准推送,美团外卖卡片点击率提升63%、访购率提升200%。
vivo方面的思路略有不同。周围认为,“大模型用于增强已有的一些模块和能力,属于锦上添花。但它也有一些颠覆式能力,并且一定会改变人们对于手机的定义。AI大模型的应用再进一步,将是以‘智能体’形式呈现。甚至当低至32M-200M主频+32G内存,就可以跑通一个系统并且具备大模型能力时,未来更多轻量化的设备,诸如摄像头、机器狗等都将具备智能表现。”
对于智能终端行业来说,AI大模型让人机交互产生了革命性变化,可以预见的是,未来终端设备的服务能力、服务方式都会迎来革新。
每日经济新闻