当前位置:首页|资讯

AI手机再进化 手机智能体登场

作者:封面新闻发布时间:2024-10-13

AI手机再进化 手机智能体登场

全文1873字,阅读约需6分钟,帮我划重点

划重点

01vivo在2024开发者大会上发布全新AI战略“蓝心智能”,并首次提出“手机智能体(Phone GPT)”的概念。

02PhoneGPT作为手机智能体,能根据用户需求完整执行任务,解决用户问题,同时确保执行的安全和可信。

03为此,vivo投入重金从交互方式、数字世界、服务意图平台和服务理念四个方面用AI重构手机系统。

04除此之外,vivo还将开放无障碍产品的安卓公版,让所有智能手机用户都能用,并面向无障碍功能的开发者免费开放全栈AI能力。

05未来,vivo将继续朝着更个人化、更自动化的AI方向发展,不仅体现在AI助手蓝心小V上,更体现在整个系统的深度融合上。

以上内容由腾讯混元大模型生成,仅供参考

10月10日,vivo在2024 开发者大会上官宣全新AI战略——“蓝心智能”,并首次提出了“手机智能体(Phone GPT)”的概念。而手机智能的目标就是把人彻底解放,让手机来帮你完成各种事务。此外,全面升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)以及vivo在安全、人文、生态合作等方面的最新成果也集中亮相。

图1

手机智能体(Phone GPT)问世

vivo 此次发布的 PhoneGPT 备受业界关注。

vivo不仅联合中国信通院制定了手机智能体的标准,PhoneGPT还是首家获得相关标准体系下四星认证的产品。其核心在于能够根据用户需求完整执行任务,解决用户问题,同时确保执行的安全和可信。这涵盖了对智能体感知、决策、执行能力的度量和关键标准的设定。

图2

vivo AI系统中心高级总监熊官敬在介绍采访时强调:“PhoneGPT作为手机智能体不仅做标准,还做技术和场景的定义,我们认为一个完整的主动执行的手机智能体,它像人一样,人是看屏幕的,人是听扬声器的,人的声音会传回麦克风。”以订餐场景为例,PhoneGPT是多模态的,它可以自主点击屏幕,找到用户需要的内容,关掉了中间弹出的广告,接管音频和店员对话订餐,而这在过去是做不到的。

而在vivo AI全球研究院院长周围眼中,PhoneGPT是主动智能,而主动智能是需要训练的,训练完之后它能像人一样操作手机。而在生日场景中,PhoneGPT先找到用户和孩子的照片,再写上祝福语通过微信发给过生日的孩子,然后推荐适合生日宴请的餐厅并询问是否需要订餐,以及提醒用户取消加班日程。

图3

周围强调个人智能的核心是记忆。他表示,这些贴心操作的背后是手机智能体的主动洞察,它能根据时间、空间、地点、行为、习惯、事件等形成意图洞察,在手机上生成与用户的共同记忆,这样才能帮助用户做决策。

而要做到这些并不容易,vivo需要重新定义AI和手机融合后的产品。

用AI深度重构手机系统

谈及今年vivo发布的全新AI战略——蓝心智能。周围表示,蓝心智能以蓝心大模型为技术底座,可以理解用户的个人情景和偏好,为用户提供个性化的专属服务; 最关键的是可以通过系统深度融合,跟用户进行更自然、更符合人类直觉的人机交互。他强调了蓝心智能是“温暖”的AI。

图4

而为达成这一点,vivo投入重金从三个方面用AI重构了系统体验。

第一是交互方式的重构。vivo 将旧的交互方式变得更自然、更符合直觉。例如支持手机的拖拽、圈选等操作,同时像点击操作也能实现智能识别,知道用户是想保存、分享还是转移到其他应用。语音交互也得到升级,不仅能听懂各种方言,还能识别多国外语,并且能流畅地表达输出。

第二是数字世界的重构,搭建智能体平台。用户可以通过蓝心小 V 调用各种教育、金融、医疗等智能体。比如:拍作业试卷时,就能调用教育智能体来提供作业指导。

第三是重构服务意图平台。将各种服务以更合理的方式呈现,包括将一些能力公共化、标准化,如便签的摘要、文生文、写市场报告等能力,不仅 vivo 本系统可用,也可供行业开发者调用。

第四是为用户服务的理念。智能体能够为用户分担生活琐事。比如了解用户孩子生日,自动发送回忆图片并祝福,还能帮忙订餐厅、取消会议等。

截至今天,vivo的AI能力已覆盖全球60多个国家和地区,服务超过5亿手机用户,大模型token输出量超过了3万亿个。

做有温度的科技  让AI更“懂”人

大会现场,由导盲犬引导来现场的一群vivo无障碍听说项目服务的用户,信息无障碍技术开发者共同组成了一幅与众不同的感人画面。

图5

vivo也在大会上就宣布将开放vivo无障碍产品的安卓公版,让所有智能手机用户都能用。同时也面向无障碍功能的开发者免费开放vivo全栈 AI 能力。

我国有近3000万的听障人群,1730万的视障人群和超过2亿的老年人。vivo持续在做一件事,用AI来帮助这些群体。

2023年,vivo推出了首款集手语识别与合成于一体的软件“手语翻译官”。今年又在“手语翻译官”中升级了“手语学习”功能。而基于蓝心语音大模型,“vivo听说”新增了方言自由说功能,目前支持6种方言。

“vivo看见”同样得到了语音大模型加持,新增了实时问答功能,成为行业首款多模态大模型视觉辅助产品。今年8月28日vivo为正式开馆的国家无障碍环境展示馆制作了行业首款视障用户导览软件。通过vivo手机产品和“vivo看见”的视觉辅助功能,为展馆提供助力。

AI作为新一轮科技革命的核心力量,为产业提高运营效率、优化用户体验、增强市场竞争力创造了新契机。而相比其他厂商,vivo 更强调水面之下的工作,注重基础体验和能力支撑的重构,不单纯追求表面的差异化。而未来vivo也将.继续朝着更个人化、更自动化的 AI 方向发展,不仅体现在 AI 助手蓝心小 V 上,更体现在整个系统的深度融合上。

封面新闻记者且菲深圳报道

【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1