21世纪经济报道记者骆轶琪 深圳报道
在除了折叠屏之外,硬件端难见十分明显的创新动向之后,软件层面的手机厂商竞赛正在开启。
上一轮软件层面的竞争,手机厂商竞相采用智能语音助手,其应用多少有些可有可无,不同于此,如今在AI大模型的驱动下,手机这个端侧载体被赋予了更为丰富的职能。
业界普遍认为,手机端侧与AI大模型能力融合后,未来将成为每个人的私人助手。
只是这背后需要庞大的计算资源和能力支撑,对端侧的设计、底层能力储备等,都提出很高要求。此外,AI大模型本身也在持续迭代发展,典型如“幻觉”问题无法忽视,其未来走向尚有进一步探讨空间。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围受访时坦言,AI大模型到今天还存在两大关键问题:逻辑思维链能力不强与出现幻觉。
对于逻辑能力的难题,周围指出,需要从理论层面进行建设和突破,vivo正在寻找科学家和行业解决方案;至于幻觉则需要从算法层面不断优化。
“首先要告诉大模型,你是专家级还是小白级的定义,这是下一代GPT需要解决的;第二需要告知大模型数据库的截止时间。我把这两个挑战都归因为如今大模型较大的缺陷。”他续称,但并不能因此就认为大模型一无是处,其依然是一个至少容纳了2.5个国家级图书馆藏书知识量的载体,假如认为现在自研大模型还是一个初中生,希望到一年后可以实现高中生甚至大学生的水平。
那么应用在手机端的大模型,在现阶段是噱头还是走向未来的起步阶段?AI大模型会成为新的换机动力源吗?
竞速大模型
无论国内外,AI浪潮涌动下,大模型到底该如何在硬件端被承载,都是当下核心要解决的问题。
先有谷歌Pixel 8用自研Tensor G3处理器,集成生成式AI等,交出一份AI手机的答卷;再有国内诸多手机厂商也将把旗下AI大模型融入到智能手机产品中。
11月1日,vivo发布蓝心大模型矩阵,包含覆盖十亿、百亿、千亿三个参数量级的五款vivo自研大模型。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,具备本地化文本总结、摘要等能力;70亿模型是面向手机打造的端云两用模型,具有语言理解、文本创作能力;700亿模型是面向云端服务的主力模型,1300亿、1750亿模型也将在更复杂的场景提供智能服务。
据周围介绍,作为一款开源大模型,蓝心大模型并没有基于目前市面上的开源模型进行开发。根本原因在于,vivo团队曾基于开源模型做过微调,但最终发现部分问题无法协调匹配,比如涉及价值观问题等。因此最终选择从最原始的数据进行训练自研。2018年vivo成立人工智能图谱研究院,目前已积累13000T的多种模态数据及2800T高质量中文文本数据。
多名AI界人士都对记者表示,要做好大模型体验,优化“幻觉”问题,数据清洗是一道关键能力,但目前诸如搜索引擎中这类问题都仍需要仔细优化。
对此,周围告诉21世纪经济报道记者,这正是当下要解决的难题之一。“首先要做各种专业图谱建设,比如囊括法律判例和法规条文等,针对性做诸多专业垂类图谱建设,这需要联合合作伙伴完成。”
其次是针对没有完善图谱的方面,可以设置精细化搜索的提示给用户,亦或与搜索公司合作进行能力增强。
至于为什么选择以不同规模的大模型矩阵形式发布,原因在于当下算法还有提升空间的情况下,这会是更好的方案。
比如高净值用户会有极高的隐私保护诉求,本地端需要毫秒级别响应速度,这都是云端无法完成的,且如果完全采用云端的大模型,背后有着高昂的成本。“倘若vivo的3亿用户每天用10次模型,一年算下来有100亿左右的支出,成本非常高。”周围举例道。
据介绍,目前蓝心大模型的应用端口主要包括“蓝心小V”和以公版APP形式推出的自然语言对话机器人“蓝心千询”。
AI大模型的应用再进一步,将是以智能体形式呈现。据周围分析,第一阶段智能体大约需要一年左右时间。无论成熟到什么级别,至少会有产品原型。要具备感知、决策、执行能力,再加上很好的度量和奖励模型,相信整个正循环就能建立起来。
难题与未来
从此轮AIGC浪潮回溯,AI技术是在业界真正跑通了Transformer算法后,才在2021年出现智能涌现的能力。
这一方面意味着技术路线的选择可能出现偏差,另一方面也显示出大模型的发展过程依然曲折。对于集成度更高、功能本身就极为复杂的智能手机来说,更是如此。
“理论上说,大模型的参数量越大,其应用落地效果会更好,但参数量越大,在手机上跑通的概率会越低。”vivo AI解决方案中心总监谢伟钦介绍道,目前能够在手机端侧实现较好效果的能力,主要包括文本总结、摘要、图片生成、图片风格化等。因此选择先把相关能力放入端侧,用户无需上传文件和图片上云,即可实现想要的结果。
从目前vivo旗下的大模型矩阵来说,要运转一个10亿规模大模型至少需要1G内存、70亿模型需要4G内存,130亿目前需要超过7G。
“这对手机存储空间、耗电量等方面都带来很大的技术挑战。”谢伟钦续称,因此需要平衡。“相信到明年70亿或130亿大模型在端上跑起来时,可以慢慢成为智能体,即一个专属私人助理的状态。”
显然,7G内存基本已经接近中高端手机的标准,但同时也对手机性能带来了极大挤压。周围指出,目前来看,130亿规模大模型会是实现智能体能力更好的选择,因其可以更好对复杂的任务进行拆解;当前70亿模型在手机端侧对处理文档摘要等能力会有较好的呈现,但缺点是无法达到中台级别上下文理解的能力,也即无法完成多重复杂的任务。
这些都意味着,要真正迎接更为智能化的端侧手机体验,在当前看,还有诸多挑战要解决。
此外,也有业界人士对记者表示,也许在未来,Transformer算法未必是唯一走向AGI的路途。这也考验着厂商的综合研判能力。
周围对21世纪经济报道记者表示,vivo旗下有专门进行理论研究的算法团队,并跟进前沿进展,再转化成工程实践。
“Transformer算法和ChatGPT的形式,目前我们预判是最合理的路线。因此在这方面会全部投入。”他续称,基于此会从ChatGPT的形式,进一步优化大模型面临的难题。“2017年Transformer算法出现,在此之前的AI更多是基于小数据搭建模型,因此其能力有限,在Transformer之后,才真正可以压缩超大型存储数据。”
“所以算法层面需要持续改善,比如注意力相关算法等,需要逐步学习、调优。”周围表示,此外是备受关注的算力,在外部环境变化下,的确大模型训练会面临算力不够的问题。
智能手机普遍都将搭载自身体系下的AI大模型,这是否会成为新的换机驱动力?
对此周围认为,对于部分场景中,大模型仅仅是增强已有模块的能力部分,则属于锦上添花。但在未来,AI大模型将具备颠覆式能力,一定会改变人们对手机的定义。
“未来的智能体,一定能够成为个人助理的形式。”他续称,届时其将颠覆手机上的产品。
这需要从更长远的时间周期来看,当低至32M-200M主频+32G内存,就可以跑通一个系统并且具备大模型能力时,未来更多轻量化的设备,诸如摄像头、机器狗等都将具备智能表现。倘若再叠加脑机接口等新兴技术进一步成熟,将丰富交互形式,令更多轻量级设备都具备成为行政助理的能力。
从这个角度看,大模型将对手机市场带来颠覆性的改变。“从大模型带来巨大生产效率提升的角度看,我认为大模型是一个历史性、事件级的产物。当大模型做好后,也将必然获得更多高端用户的认可,所以我们也在高规格投入,来迎接人工智能世界的到来。”周围如此表示。
更多内容请下载21财经APP