当前位置:首页|资讯

vivo:做成一部AI手机,究竟要自我推翻多少次?

作者:36氪发布时间:2024-10-11

vivo:做成一部AI手机,究竟要自我推翻多少次?

AI手机,vivo趟路。

封面来源|企业提供

尽管三年蝉联国产手机市场份额TOP1,但依旧无法抹除vivo身上的“不合群”感。

比如,当所有人都觉得手机是不再是一门性感的生意,而调转枪口做起产业生态、磨刀霍霍向造车时,vivo依旧坚守手机的一亩三分地:从影像优化到操作系统,从AI能力升级反向倒推芯片的设计。

直到今年10月,vivo突然又讲起了AI大模型,以及操作系统与AI手机的“新故事”。

如何定义AI手机?

这个故事没有宏大叙事,表面上看,是传统企业对新技术的又一次拥抱与探索;本质内核,则是一个领跑者,当前路已经没有“参考答案”之时,自我颠覆的最佳剖析样本。

早在,2017年vivo就在内部组建了专门的AI研究团队;基于大模型技术推出的“蓝心小V”与vivo自研的通用大模型矩阵“蓝心大模型”也早在2023年推出,但手机上装载AI助手,相册增加个智能去路人的特效,就是AI手机的全部想象力了吗?

如此定义,未免太投机取巧。

为了思考这个问题,vivo一度经历了漫长的阵痛期。

由vivo副总裁周围亲自带队,在去年,vivo花了整整11个月时间去思考,AI手机到底是一个怎样的事物。

困难来的猝不及防。无往不利的“用户导向”调研,在关于“AI手机”上这个新事物上收效甚微:当你在200年前,问一个人,怎么让车跑的更快,他只会告诉你,选一匹更贵的马……相似的剧情,在大模型时代再次重演。

前方没有路,就自己蹚出一条路。静默期的后6个月,vivo决定,“从头造一辆所有人都没见过的汽车”。

10月10日的vivo开发者大会上,vivo正式官宣全新AI战略——蓝心智能,将大模型技术与手机操作系统深度融合后的个人智能。vivo将大模型技术与手机操作系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。

但这种AI+操作系统,与过去的智能相册,智能备忘录有什么区别?vivo将这种深度融合,拆解为三步走:

第一步,从底层开始重塑,向交互动刀。

在vivo内部,每次新品推出之前,必定现有一次关于行业逻辑的复盘与推演。周围曾向团队安排这样一个思考题:为什么触摸屏能够取代传统的键盘式诺基亚?

一个最基础的逻辑就是:触摸屏的交互逻辑相比于各种按钮一定是更加方便的;左滑右滑是比按键盘要更加灵活,可能性也更多的。在此之后,触屏手机从用指甲盖去操作发展到用指尖去操作,本质变化也是让整个的操作和交互更符合人的自然习惯和的直觉。

思考到这一步,问题就可以被进一步延伸,什么比触摸还要高效?毫无疑问是语音,这个看似已经被讲烂了的技术,一旦融合进操作系统,在产品上的体验上,将会带来巨大的突破和变革。

但语音不同于全球统一标准的手势触控,不同国家、不同地区都有着不同的语言:为此,vivo的声音大模型将粤语,四川话,东北话,河南话甚至苗族话全都进行了专门的语言互译适配,力求人机对话,更自然、更情感化。

交互的链路被缩短之后,vivo的第二把火烧向了人与数字世界的服务体验:AI手机需要掌握从被动变主动的能力。更通俗来说,手机作为最了解用户的“数字陪伴”,不该只会被动应答。

这种被动变主动,可以从三个方向进行拆解:第一点,依托 AI 技术对手机的基础功能进行全面升级,重构输入法、电话、笔记、扫描等 15 项刚需功能,构建了平台化的 AI 公共能力;第二点,搭建连接服务的框架和平台,包括为开发者搭建的集合开发和分发于一体的智能体平台,以及针对轻量化和原子化的服务构建的完整的意图框架体系,让人找服务的同时,服务也主动匹配人的需求。第三点,构建个人智能系统框架,让手机成为专属个人助理。

比如,“小V建议”可以以桌面常驻组件的形式,24小时提供主动贴心服务。在用户外地出差时,无论出门时的打车建议、到机场后的登机口提醒、抵达后的城市攻略,还是抵达酒店前的入住提醒,小V都能提前预知并给出最合适的建议。

再比如“小V记忆”,不仅了解用户的想法,也一直默默地记忆着与用户相处的点点滴滴。而对于用户日常收藏的各种各类文章、视频,小V也会认真地进行整理。在部分旗舰机型上,小V会利用端侧的分析能力,将收藏内容以更有逻辑性的方式进行呈现。

更进一步,手机连接起的只能是数字世界吗?vivo的思考是否定的,手机应当能借助大模型重构人与物理世界的连接。

比如“vivo看见蓝心升级版”,听见通过搭配无线耳机以及适配摄像头,可以帮助盲人,告诉他们洗发水在哪里,护发素在哪里,沐浴露在哪里,如何上车?甚至告诉他们去到一个博物馆中正在展览的东西是什么。进而视障人士更好地看见、听见眼前的世界,去探索世界的美好。

技术的屠龙刀与应用的老战场

当确定了vivo要做什么,能做什么之后,接下来的故事就进入了双线叙事剧情,锻造技术的屠龙刀与寻找应用的战场。

技术上,2024 vivo开发者大会期间,vivo对AI能力做出了四大重点发布:

重点一,【升级语言大模型】:vivo正式推出千亿级蓝心大模型云端能力,重点优化意图理解与分发、任务规划能力。相比去年,整体能力提升30%,并在CMMLU和SuperCLUE的榜单上继续领跑国内第一梯队。

重点二,【发布蓝心端侧大模型3B】:针对“模型小 能力强 功耗低“的行业不可能三角困局,vivo推出全新30亿参数的蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上可以越级比肩行业7B-9B模型。相比蓝心7B极致性能提升300%,平衡模式下功耗优化达46%,内存减小63%,极致出词速度可以达到80字/s,系统功耗仅450mA ,内存仅占用1.4GB。

重点三,【发布蓝心语音大模型】:当前,vivo自研的蓝心语音大模型已经可以做到准确理解自然语义,感知情绪,模拟人声,而且支持中英日韩泰同声传译,以及超过15种语言互译。

重点四,【发布蓝心图像大模型和蓝心多模态大模型】:vivo将蓝心图像大模型针对中国特色与东方美学做了升级;蓝心多模态大模型,则在今年升级了上下文理解和记忆能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。

技术的屠龙刀在手,vivo应该将其用在何处?

相比重新定义手机,vivo更愿意将其称为对已有功能的优化:至少,多年的产品经验告诉vivo,现在的手机关于如何打电话,发短信,图片编辑,计算器,或许我们已经足够适应与熟悉,但距离完美还有很长的路要走。

这是一场老战场上的新战役,而接下来的工作重点就是去梳理那些我们习以为常,但仍有巨大进步空间的市场究竟在哪里。

周围回忆每年他都会特地留出三个月时间进行闭关,“我们有130多个赛道,对应130多个技术小组的总监高级总监。和他们,我每个星期5天要花4天半的时间开会,就是在回答通信你准备怎么做,通信你的使命是什么?你准备完成哪几个你的目标,你的123是什么?每个赛道全部都这么过了一遍。”

已有功能优化的典型成果代表是搜索。最新上线的智能体小V圈搜,不仅支持通过长按导航条的形式将它呼出,用户还可以直接将图片、文件、文字直接以向下拖拽进行处理。除了支持已有的语音和文字指令输入之外,用户还可以用最自然的指尖圈选的方式,把想要了解的内容发送给小V,通过小V搜索快速找到想要的本地文档或是服务,点击预览列表就可以直接打开。

系统层面的优化代表,则是OriginOS 5的内存优化机制更新。随着微信、王者荣耀为代表的软件内存占比逐渐庞大,内存不够用、卡顿,成为了很多用户困扰的头件大事,过去,行业的通用做法是在硬件上做加法,在此基础上,vivo在软件层面,在安卓领域内首创Ledger内存账本机制,并迭代升级了不公平调度机制3.0和虚拟显卡2.0,通过在存储、计算效率及显示体验等方面的整体优化,实现“重载如轻载,长久使用亦流畅”,更能轻松应对大型手游等重载场景,带来感官和操作上的极致流畅体验。

思考好了做优化的减法,接下来的问题就是怎么做减法,以及谁来做减法。

用工程化思路去做大模型

做减法的过程中,vivo一度将自己比作一个庞大项目中的包工头。而包工头最重要的工作就是沟通与打样。

打样的重点是智能体。比如最常用的智能家居连接中心,过去通过手机控制智能家居往往步骤繁琐,且经常会出现型号不适配的情况。为解决这一问题,vivo训练了一个学会4000多种空调操作的智能体,如此一来,相比过去,同样是智能家居控制,但是新的智能体,对于空调适配以及控制的泛化性都有了极大提升。

以此为样板,vivo接下来的任务就是做大生态,挨个谈合作。vivo的思路是,跳出各大应用都在做基于自身APP的智能体的思维限制,vivo从手机端建立起一个更泛化的智能体广场。

这中间vivo的主要精力应该放在接口标准,耦合以及用户使用范式的建设,说的更直白一些,就是手机操作系统层面,完成初步的用户意图识别后,通过中台去匹配智能体广场中的不同智能体应用,将他们的能力与用户的需求进行链接,从而解决用户问题,帮助应用获客。

过程中,vivo向后退一步,如果一个应用行业里已经有50个团队在完成这件事情,那么vivo就坚决不去做:比如用户有音乐需求的时候,那么唤起的智能体不是vivo的智能体,而是 QQ音乐等音乐平台来进行最专业的内容回答。

基于这种用户问题牵引,生态伙伴向前,vivo定位后退的导向:目前阶段vivo已经学会了上百万个应用的操作。

而当量变引发质变,一个神奇的现象发生了,下载一个全新应用之后,人工智能比人类更早学会了APP的各种隐藏功能与玩法。

距离乔布斯高喊重新定义手机,已经过去了十几年。这十几年间,全球的手机产业,都在按照乔布斯最初的软件生态为王,触摸交互简化的设想一路滚滚向前。过程中,所有的手机企业,有竞争,但更多的是沿着同一方向进步的心照不宣。

直到此时此刻,大模型再次重新定义手机。

过去手机只能触摸交互,计算器必须是个独立功能、相册只是简单的分类照片……这样的几乎形成肌肉记忆的刻板经验,在一夕之间全部被推翻。

vivo们的重新定义对象变成了自己,以及过去的军功章。

这注定是一场漫长而艰辛的道路,而本分,是通往未来唯一的门票。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1