图片来源@视觉中国
文 | AI商业评论
2023 年 3 月 21 日,在英伟达的年度重磅科技会议 GTC 上,英伟达 CEO 黄仁勋面向整个科技行业发出了宣告:伴随着大语言模型 ChatGPT 的火遍全球,一个新的计算平台已经被发明出来,AI 的 iPhone 时刻已经开始(The iPhone Moment of AI has started)。
由此,「AI 的 iPhone 时刻」在成为一个行业热门词汇的同时,也在无意之中预示了由大语言模型(后来又称为「大模型」)引发的这一轮 AI 变革与以 iPhone 为代表的智能手机行业的密切关联。
实际上,智能手机行业对大模型的拥抱和应用速度,快得让人目不暇接。
近一年来,包括华为、小米、OPPO、vivo、荣耀在内的中国智能手机行业参与者,都已经相继高调入局大模型——苹果虽然还没有官宣入局,但业内也有不少关于苹果布局「Apple GPT」和大模型的消息。
那么问题来了:手机厂商布局大模型,到底是不是噱头?
华为抢先一步,为什么?
大模型与智能手机首次发生应用层面的关联,其实是在 2023 年 3 月的华为春季旗舰新品发布会上。
在这次发布会上,华为常务董事、消费者业务 CEO 余承东面向用户发布了全新的「智慧搜图」功能,该功能是基于多模态大模型技术,在云端进行训练,然后在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。
简单来说,用户可以像与人对话一样,通过语音唤醒小艺,使用自然语言在手机图库中搜索出匹配如「山顶看日出、「围炉煮茶」、「蓝色珊瑚中的小丑鱼」等描述的照片。
相较于传统图库使用标签进行照片搜索,存在准确率低、响应速度慢等问题,智慧搜图更加「聪明」。结合多模态大模型,智慧搜图对亿级的图文数据进行预训练,增加了对泛化通用语义的理解,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,同时还实现了端侧轻量化应用。
值得一提的是,在用户使用「智慧搜图」的过程中,相关数据均于端侧处理,进一步保护了消费者隐私安全。
那么,为什么华为能够率先利用多模态大模型技术为智能手机赋能?
答案很简单:布局很早。
实际上,早在 2021 年 4 月下旬,在 HDC.Cloud 2021 华为开发者大会上,当时担任华为云 CEO 的余承东就发布了一款重磅产品——华为云盘古大模型,它基于预训练和少量行业适配和微调的开发模式,让全球领先的 AI 真正地进入到千行百业。
具体来看,这次发布的盘古大模型,包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。其中,盘古 NLP 大模型是业界首个千亿级生成与理解中文 NLP 大模型,盘古 CV 大模型也是业内最大的计算机视觉大模型,支持 30 亿个参数;而多模态大模型则包括跨模态搜索、扩模态生成和看图说话等功能。
所以,自 2020 年开始,华为在大模型领域已经进行了数年的布局,并且在不断进化;而到了 2023 年,随着 ChatGPT 的爆发,智能手机也成为了华为大模型能力面向端侧进行部署的一个应用场景罢了。
在 2023 年 8 月初的 HDC 2023 华为开发者大会上,余承东在讲到鸿蒙 4.0 时的升级表示,在 AI 的大模型时代,盘古大模型将助力鸿蒙生态。
具体来说,在盘古自然语言大模型、盘古视觉大模型和盘古多模态大模型的助力下,鸿蒙 4.0 系统会迎来一个全新的「小艺」,其中包括知识获取、逻辑推理、任务规划、记忆扩展、工具调用和制作辅助等方面,推动智能终端的交互变革、生产力效率变革和个性化服务变革。
需要说明的是,鸿蒙 OS 4.0 在正式发布后不久,依旧已经推送到用户手中——不仅如此,在 9 月 25 日举行的华为秋季全场景新品发布会上,根据余承东在现场公布的消息,拥有大模型加持的鸿蒙 4.0 在发布一个多月后,升级用户已经超过 6000 万。
也就是说,目前来看,在大模型面向智能手机终端的部署进程中,华为是真正的抢先者。
小米 OV 荣耀也入局,靠谱吗?
在华为之外,小米、OPPO、vivo 和荣耀等国产手机厂商,也都瞄准了大模型。
今年 6 月底,在 2023 MWC 上海移动通信大会上,荣耀 CEO 赵明表示将会率先将 AI 大模型引入端侧,打造只属于用户的个人 AI。他还强调,「大模型打破了我们很多的思考边界,是我们迄今为止看到 AI 的最佳诠释」。
当时,荣耀旗下的旗舰手机 Magic V2 即将发布,因此有外界声音称它将会是「全球首款 AI 大模型国产手机」,引发外界关注——但是,从后来的情况来看,荣耀 Magic V2 与尚未与大模型建立关联,不过它已经在 8 月底申请了「MagicGPT」商标。
与荣耀相比,小米在大模型领域的部署,与普通用户的距离已经不远。
今年 8 月份,在雷军的 2023 年度演讲中,雷军表示,小米全面拥抱大模型,并且在今年 4 月已经组建小米 AI 大模型团队——据了解,该团队的负责人是小米技术委员会 AI 实验室大模型团队负责人栾剑。
在演讲中,雷军表示,小米大模型技术的主力突破方向是「轻量化」和「本地部署」,目前小米自研的 13 亿参数端侧模型已经在手机端跑通了 Demo,而且部分场景效果可以媲美 60 亿模型在云端的运算效果。
有意思的是,雷军强调,在布局大模型的过程中,数据层面,小米自己挖掘整理的训练数据占比达到了 80%,其中小米自有的产品和业务数据量达到 3TB。
另外,为了保护用户隐私,小米还模型部署到端侧后,信息不用上传到云端,所有计算都在本地进行,可以从根本上保证用户隐私不被泄露。即使在端云结合的服务框架下,隐私信息会存储在端侧,涉及它们的计算也尽可能在端侧完成;即使偶尔需要使用云端的能力,信息也会经过处理和加密。
从结果上来看,小米大模型的落地载体为「小爱同学」。在拥有大模型的赋能之后,小爱同学的人机交互形态将进行升级改造,增加一系列通识能力,其中包括深度理解上下文、翻译能力、超级问答、生成式结果、完成复杂任务等。
从 8 月起,小米已经开启了「小爱同学大模型」的内测,其落地也是指日可待。
在荣耀和小米之外,OPPO 和 vivo 在大模型方面的动作也没有落下。
具体来看,10 月 11 日,OPPO 宣布,与联发科技合作共建轻量化大模型端侧部署方案,通过采用 4 位量化技术,实现精度不掉点效果下端侧化性能更优,共同推动其自研的 AndesGPT 大语言模型和多模态大模型在端侧逐步落地。
目前基于其自主训练的安第斯大模型(AndesGPT)打造的新小布助手 1.0 Beta 版尝鲜体验正式开启,升级后的小布助手将具备 AI 大模型能力。
除此之外,10 月 16 日,vivo 也宣布将于 11 月 1 日举办的 2023 vivo 开发者大会上发布全新手机操作系统 OriginOS 4,首发搭载 vivo 自研 AI 大模型——vivo 方面还表示,自研 AI 大模型将以更智慧的助手形象释放服务能力,赋能其小 V 助手获得更广阔的智慧服务能力,从而在学习、生活、工作等场景带来颠覆性创新。
总体来看,几乎所有的主流手机玩家,都已经在抢滩大模型的主战场,下一步就是亮剑厮杀了。
大模型,究竟该如何落地?
在手机厂商纷纷拥抱大模型的情况下,一个真正思考的问题是:大模型该如何落地?
毕竟,从诞生之初,大模型就于云端的大算力、大数据、大参数密不可分;实际上,大模型出生于云端,这也是华为这样同时布局了云计算的巨头级厂商能够在大模型业务布局中能够抢先一步的核心要素。
所以,手机厂商拥抱大模型,从一开始就面临一个技术层面的悖论:到底该怎么落地?
目前来看,小米和 OV 都选择了一个共同的路径:轻量化。
比如,小米强调,与早些时候市场上放出的手机端大模型的方案相比,小米会调整模型结构和参数大小,适配各种芯片在内存和算力上的特点,致力于达到功耗、推理速度和生成效果的最佳平衡。
同时,OPPO、vivo 都强调,它们都将推出不同参数量级的大模型,从 10 亿至千亿多种不同参数规模的模型规格——很明显,这背后也是充分考虑到了不同部署端所带来的成本、性能、功耗等问题。
除了轻量化之外,手机厂商入局大模型,还需要考虑大模型如何进行实际部署的产品化问题,这是一个涉及到用户体验、用户隐私等多方面的关键话题。
目前来看,「端云一体」应该是一个比较明显的趋势。
比如说,小米虽然在大模型方面强调本地部署,并且它自研的 13 亿参数的端侧模型已经在手机端跑通——但是根据小米技术委员会 AI 实验室大模型团队负责人栾剑的说法,在具体的实现过程中,手机端并不能解决所有问题,小米还是会坚持一体化的道路;但如果是能够在端侧模型解决的部分能力或者部分功能,就没有必要上升到云端去。
他强调,如果用户在调用大模型的过程中需要用到一些实时更新的信息,就需要结合云端的一些能力。
除了小米之外,OPPO 也在大模型方面强调「端云协同」,它表示 AndesGPT 本质上是以「端云协同」为基础架构设计思路,实现在本地与云端协同运作的效果——很明显,本地部署与云端协同,很难完全分开。
当然,基于「端云一体」的趋势,实际上也要考虑大模型下的隐私问题——目前来看,华为和小米都格外重视隐私问题,而各家的思路基本上也都是在强调:与大模型相关的计算尽量在本地完成,减少对信息传输和云端的依赖。
那么,最后一直值得关心的问题来了:对于普通用户来说,大模型究竟意味着什么?
对此,一位资深行业从业者表示,其实从用户角度来看,可能一开始在功能上不会对大模型那么强烈的感知,但是未来可能会发现在很多场景中自己的隐私得到了保护,这是一个从量变到质变的长期过程——但是从手机厂商的角度,没有任何一家会放弃对大模型的探索,否则很有可能在这个领域落后。
那么,向来高冷的苹果呢?
目前来看,Tim Cook 在公开采访中对于大模型的态度是「谨慎」,他认为与大模型密切相关的生成式 AI 技术在未来的发展中有着巨大的潜力,但同时需要谨慎运用,以确保不会对人类社会带来负面影响。但另一方面,在被问到是否在使用 ChatGPT 时,库克的回答是正在使用,并且「对它很兴奋」,而且苹果在对它密切关注。
然而,根据知名爆料网站 The Information 的消息,苹果实际上已经集合了一个强大的 AI 大模型开发团队,其中包括其机器学习和AI战略高级副总裁 John Giannandre 等人。不仅如此,苹果公司在 AI 大模型方面的预算已经提高到每天数百万美元。另外有消息称,苹果也几乎将其大模型融入到 Siri 中,并且探讨过在 iPhone 端运行大语言模型的可能性。
所以,该来的还是会来——毕竟,技术发展的大势是难以阻挡的。