今天分享的是【生成式AI手机产业白皮书 中文版 终版(3)】 报告出品方:MEDIATEK
从 2023 年底至 2024 年一季度,新一代旗舰智能手机陆续发布,越来越多的基于生成式 AI 能力的功能 开始出现在这些产品中。无论是手机厂商还是其生态伙伴,在主动拥抱生成式 AI 趋势的同时,也在积极探 索各种可能性,着力打造对用户有价值的高频使用场景,而这一探索将贯穿整个2024年。Counterpoint认 为 2024 年会是生成式 AI 手机的元年。
大约在二十多年前,以诺基亚塞班为代表的操作系统,第一次允许用户自行下载 APP,并将其作为入 口,访问服务和数字内容,这种模式一直持续到今天。也正是这种变化,使得全球的开发者可以加入到智 能手机产业中来,为手机用户提供丰富多样的应用选择,促成了之后移动互联网生态的蓬勃发展,手机也 逐渐发展为人们休闲娱乐、通信社交、健康和出行服务、消费购物,以及移动办公的重要载体,早已不可 或缺。
2007 年,iPhone 的问世颠覆了传统的手机设计理念,物理键盘逐渐被淘汰,触控屏幕成为人机交互的 核心。然而随着时间的推移,在一些场景下,触控输入的方式变得越来越低效,常常需要多次的用户干预, 才能到达最终的服务界面。在此背景下,出现了包括智能语音助手,手势、眼球追踪在内的新的交互方式, 致力于打造更流畅、高效,更加用户友好的交互体验。
通过 AI 技术赋能智能手机的尝试最早可以追溯至 2017 年,彼时苹果刚刚发布了首款后置双摄手机 iPhone 7 Plus,而安卓阵营也开始在其 SoC 平台中加入独立的 AI 计算单元,用于运行和影像增强相关的 深度学习模型。在这之后,AI 技术逐渐被手机厂商用于更多方面,如强化安全、优化续航、提升网络性能 等,但计算摄影一直是其最主要的应用领域,直到 LLM 被装进智能手机,手机 AI 应用从中小模型时代跨越 至大模型时代。
得益于 AI 大模型的赋能,智能手机将迎来新一轮的革新。首先在人机交互层面,有了 LLM 的加持,新 的多模态交互将取代传统的、单一的触控屏交互,逐渐实现从图形用户界面 GUI 到语音用户界面 VUI 的跨 越式转变,用户可以以更直观、更自然的方式与手机沟通。其次,多模态输入和输出能力相结合,可以极 大强化智能手机的生产力工具属性:既可以基于多种形式的输入信息,生成用户需要的图表、文本、音乐、 图片甚至是视频,也可以对输入的图片、视频进行编辑。 最后,随着融合的深入,生成式 AI 技术将在智能手机上孕育出一个甚至多个智能生命体(AI Agent)。