生成式AI手机产业白皮书中文版终版(3)

作者：孤高山海发布时间：2024-05-10

今天分享的是【生成式AI手机产业白皮书中文版终版(3)】报告出品方：MEDIATEK

从 2023 年底至 2024 年一季度，新一代旗舰智能手机陆续发布，越来越多的基于生成式 AI 能力的功能开始出现在这些产品中。无论是手机厂商还是其生态伙伴，在主动拥抱生成式 AI 趋势的同时，也在积极探索各种可能性，着力打造对用户有价值的高频使用场景，而这一探索将贯穿整个2024年。Counterpoint认为 2024 年会是生成式 AI 手机的元年。

大约在二十多年前，以诺基亚塞班为代表的操作系统，第一次允许用户自行下载 APP，并将其作为入口，访问服务和数字内容，这种模式一直持续到今天。也正是这种变化，使得全球的开发者可以加入到智能手机产业中来，为手机用户提供丰富多样的应用选择，促成了之后移动互联网生态的蓬勃发展，手机也逐渐发展为人们休闲娱乐、通信社交、健康和出行服务、消费购物，以及移动办公的重要载体，早已不可或缺。

2007 年，iPhone 的问世颠覆了传统的手机设计理念，物理键盘逐渐被淘汰，触控屏幕成为人机交互的核心。然而随着时间的推移，在一些场景下，触控输入的方式变得越来越低效，常常需要多次的用户干预，才能到达最终的服务界面。在此背景下，出现了包括智能语音助手，手势、眼球追踪在内的新的交互方式，致力于打造更流畅、高效，更加用户友好的交互体验。

通过 AI 技术赋能智能手机的尝试最早可以追溯至 2017 年，彼时苹果刚刚发布了首款后置双摄手机 iPhone 7 Plus，而安卓阵营也开始在其 SoC 平台中加入独立的 AI 计算单元，用于运行和影像增强相关的深度学习模型。在这之后，AI 技术逐渐被手机厂商用于更多方面，如强化安全、优化续航、提升网络性能等，但计算摄影一直是其最主要的应用领域，直到 LLM 被装进智能手机，手机 AI 应用从中小模型时代跨越至大模型时代。

得益于 AI 大模型的赋能，智能手机将迎来新一轮的革新。首先在人机交互层面，有了 LLM 的加持，新的多模态交互将取代传统的、单一的触控屏交互，逐渐实现从图形用户界面 GUI 到语音用户界面 VUI 的跨越式转变，用户可以以更直观、更自然的方式与手机沟通。其次，多模态输入和输出能力相结合，可以极大强化智能手机的生产力工具属性：既可以基于多种形式的输入信息，生成用户需要的图表、文本、音乐、图片甚至是视频，也可以对输入的图片、视频进行编辑。最后，随着融合的深入，生成式 AI 技术将在智能手机上孕育出一个甚至多个智能生命体（AI Agent)。