毋庸置疑,2023 年科技行业最重要的产品技术突破都来自大模型和生成式 AI 技术,上到各国政要精英,下到普通网友都见识到了大模型带来的突破性改变。年初,微软创始人比尔·盖茨在接受德国商报采访时就感慨:
「ChatGPT 像互联网发明一样重要,将会改变世界。」
智能手机厂商也看到了大模型的技术突破,以及与智能手机结合的巨大潜力。
今年 5 月,谷歌在 I/O 开发者大会上就宣布将在 Pixel 上内置端侧大模型,而后,主流手机厂商陆续被曝将在手机上支持大模型,涵盖了三星、华为、小米、OPPO、vivo、荣耀等主流手机厂商。
到了年底,除了三星、荣耀将在 2024 年年初正式推出搭载端侧大模型的新机,各家都在手机终端上搭载或接入了自主训练的大模型。但对于大部分手机用户而言,更关心的可能还是,搭载大模型对于智能手机到底意味着什么?
大模型手机目前的动态?哪些厂商做了?
严格来说,目前手机行业还处于 AI 大模型的混战前夜。一些厂商已经只差临门一脚,就能将大模型正式带到手机上,另一些厂商还差一些准备,还有一些处于更早的准备阶段。
图/ OPPO
华为、小米、OPPO 稍早前在最新版系统中都接入了自主训练的大模型,并应用在小艺、小爱同学、小布等 AI 助手上,目前基本都进入公测阶段。vivo X100 系列则首发搭载自主训练的蓝心端侧大模型,也应用在了蓝心小 V 上。
谷歌比 vivo 更早,10 月就在 Pixel 8 Pro 上正式落地端侧大模型 PaLM2(壁虎版)。12 月 6 日,谷歌发布新一代大模型 Gemini 后,也很快将轻量化的 Gemini Nano 更新到 Pixel 8 Pro 上,还将 Gemini Nano 的能力整合进 Android 系统。
至于三星和荣耀,基本可以断定将在明年年初发布的新机——Galaxy S24 系列和 Magic6 系列上首发搭载端侧大模型,三星 S24 将搭载自主训练的高斯(Gauss)大模型,荣耀则在高通骁龙峰会上透露:
荣耀 Magic6 将搭载全新的第三代骁龙 8 移动平台,支持 70 亿参数的 AI 端侧大模型。
大模型手机,给用户带来什么价值?
从长期来看,大模型的根本改变在于人机交互方式的变革,用户将从 GUI(用户图形界面)迁移到新的交互方式,必然将颠覆我们最重要的移动设备——智能手机。就像金山办公 CEO 章庆元指出的,Office 一直是很复杂的,很多功能的学习成本很高,AI 能大幅降低使用门槛。
用说话的方式「操作」软件,图/央视
当然,交互方式的变革是一个长期、潜移默化的变革,但用户希望看到「摸得到、用得上」的改进。而在当下,几乎所有厂商都优先选择从 AI 助手切入。
同样对于用户来说,在接入大模型支持之后,最直观的感受就是手机内置 AI 助手更能理解用户的自然语言表达,随之而来的就是对话变得更加自然。通俗来讲,大模型加持的 AI 助手更能听懂人类的话,包括比较复杂的语音指令,一定程度上解决了过去 AI 助手的长期问题。
也受益于大模型支持,AI 助手在系统层面能够更便捷地实现文章摘要、生成文案/文章以及图片处理等大模型的操作。另外在 Pixel 8 Pro 上,谷歌除了让 Google Assistant 和相册支持大模型,最近还实现了端侧离线的文字转录、自动回复等功能。
AI 自动回复,图/谷歌
虽然所有人的共识都是把大模型带到手机上,但总的来说,手机厂商仍然处在一个摸索的阶段,消费者、手机厂商都需要适应新的变化。
大模型手机,跟普通手机+ ChatGPT 或者智能助理 App 的区别?
核心的区别在于对个人数据的隐私保护以及本地数据的处理,这基本也是端侧大模型势在必行的原因所在。
简单来说,云端大模型虽然在算力上有绝对的优势,但存在很大的隐私泄露风险。相反,端侧大模型的数据处理都在端侧,用户的个人数据将不会上传至云端服务器,用户才会放心将数据交给 AI 去学习,这才能为手机 AI 助手真正成为个人助理提供了先决条件。
荣耀 CEO 赵明,图/荣耀
就像荣耀 CEO 赵明指出,端侧 AI 大模型可以更好地理解用户,「知道我几点睡觉,知道我喜欢吃什么,能解决我的即时需求,相当于拥有洞察我需求的能力。」
然而,这是第三方平台难以克服的。
大模型手机,是不是一定要 AI 芯片?
理论上不需要,但实际还是需要。首先要知道,我们通常说的是 AI 芯片,实际是指广义上的 AI 芯片,即包括 GPU 这类并非专门为 AI 计算而设计的芯片。
CPU、GPU、NPU 都能用于 AI 加速计算,图/英特尔
如果只是接入云端大模型,自然不需要终端设备拥有多强的算力和 AI 芯片;但如果要运行端侧大模型,无疑需要较为强大的算力。
理论上,CPU、GPU 都可以进行并行计算,但效率、能耗控制肯定比不上专门用来 AI 加速计算的 NPU/TPU 等神经处理单元。所以不考虑手机接入云端大模型的情况下,手机运行大模型实际上离不开 AI 芯片的算力支持。
为什么苹果没动作?
严格来说,苹果并非没动作。今年 WWDC 大会上,苹果就介绍了 iPhone 上的自动更正功能,你每按下一次空格键,基于 Transformer 语言模型就会在 iPhone 上本地运行一次,「推理」出一个单词或句子。
WWDC 上,图/苹果
此外据彭博社报道,苹果已经基于自研大模型框架 Ajax 创建了首个聊天机器人服务——Apple GPT,仅限于内部使用。
几乎肯定的是,追求隐私安全的苹果不会选择接入云端大模型,而是谋求在 iPhone 上本地运行大模型,绕过很多基于云的 AI 面临的数据隐私问题。
但要如何在算力有限的手机上实现较好的大模型能力表现,这对于所有手机厂商都是一个问题?
事实上,如果你至少用过 ChatGPT(基于 GPT-3.5),目前正在公测的一众国产手机 AI 助手的逻辑推理、上下文理解等等方面都很难让你满意,就算是那些接入云端大模型的。
相较于他们,苹果更加保守,也可以说是谨慎。
Google Gemini 发布,安卓的大模型动态?
图/谷歌
就像前文所提,谷歌在发布 Gemini 时就按照不同定位和参数分为三个版本:Ultra、Pro、Nano。其中,Gemini Nano 就定位于在移动设备上本地运行,并首发搭载在 Pixel 8 Pro 上。
与此同时,Gemini Nano 能力是内置在 Android 系统中,未来不只是 Pixel 机型,开发者可以通过 AICore API 直接调用其他 Android 手机的 Gemini AI 能力(在硬件算力上有要求)。
大模型手机是不是伪命题?
不是。
诚然,手机厂商很多时候过度夸大了现阶段的大模型对于手机的价值,但不能忽略大模型带来的潜在价值,更详细的可以参看前文的回答。
目前手机厂商还在不断探索大模型与智能手机的结合,实际效果确实不大,甚至部分厂商只是接入了云端大模型,还没有搭载端侧大模型,所以在隐私数据上依然存在严重的安全问题。
事实上,如果我们查看各家官网对最新旗舰机型的介绍页就能明白,手机厂商也知道大模型现阶段的价值,华为 Mate60 系列、小米 14 都强调了新系统的设计,却丝毫没有提及大模型,只有 vivo 100 系列在最后提到了蓝心端侧大模型。
vivo X100 是唯一一款介绍大模型的国产新旗舰,图/ vivo
所以对用户来说,现阶段在选购的时候,确实没有必要考虑大模型带来的影响。但两三年后,事情很可能就会发生变化。
为什么手机厂商要炒作大模型手机?
最直接的原因还是「秀肌肉」。作为今年最热门的技术方向,大模型几乎出现在了每一个技术展会,如今国产手机厂商都在宣传「技术领先」,自然也不可能放过大模型技术。
另一方面,智能手机发展到今天,硬件和软件产品形态都已经非常成熟,大模型在事实层面和宣传层面都提供了一个绝佳的「出口」,可以突破现有的产品形态,重新刺激市场。
当然,还在萎靡的手机市场也是重要的背景因素。