集微网消息,《金融时报》5月16日报道,将ChatGPT背后的技术带入你口袋里的智能手机的竞赛已经开始。从这项技术惊人的发展速度来看,人工智能(AI)可能会以比几个月前更快的速度改变移动通信和信息处理技术。
报道称,随着科技公司急于将生成式人工智能嵌入其软件和服务,它们面临着成本大幅上升的问题,这一问题对谷歌的影响尤其大。华尔街分析师警告称,如果互联网搜索用户开始期望在标准搜索结果中出现人工智能生成的内容,谷歌的利润率可能会受到挤压。
因此,在手机上运行生成式人工智能,而不是通过大型科技集团运营的服务器云计算,可能成为这一经济问题的答案。
谷歌上周表示,已成功在三星Galaxy手机上运行最新的AI语言模型PaLM 2。尽管谷歌没有公开展示PaLM 2的缩小版模型Gecko,但此举是一个最新的迹象,表明以往只能在数据中心找到计算资源的AI,正迅速融入更多设备。
这一转变,可能会让公司运营AI聊天机器人的服务成本大大降低,并为使用生成式AI更具变革性的应用铺平道路。
移动芯片公司高通首席执行官阿蒙(Cristiano Amon)向英国《金融时报》表示:“你需要制造混合AI,能在在数据中心和本地同时运行,否则成本太高。”他说,利用手机上未使用的处理能力是分摊成本的最佳方式。
去年年底ChatGPT的推出让生成式AI受到广泛关注,但当时将其应用于手机的前景似乎很遥远。除了训练这些服务背后的大型语言模型之外,运行模型产生结果的过程也需要大量的计算。手机没有足够的内存来容纳像ChatGPT这样的大型模型,也没有足够的处理能力来运行它们。
在设备上生成对查询的响应,而不是等待远程数据中心生成结果,这也可以减少应用程序的延迟也可以保护隐私问题。
最重要的是,生成式AI可以使智能手机上的普通活动变得更为容易,例如生成文本。阿蒙说:“你可以把人工智能嵌入到每一个办公应用程序中:你收到一封电子邮件,它就会建议你回复。”
一些基础模型的快速发展,已经悄悄改变了这个行业。谷歌的PaLM 2和OpenAI的GPT-4,占据了头条新闻。但随着小型模型的爆炸式增长,一些技术要求较低的方式可以获得一些同样的功能。得益于语言模型调优新技术,它们需要保存的信息量也减少了。
IBM首席执行官阿尔温德•克里希纳(Arvind Krishna)表示,大多数希望在自己的服务中使用生成式人工智能的公司,将通过组合许多这样的小型模型,获得它们所需的大部分内容。上周,IBM宣布了一个技术平台,能帮助其客户利用生成式人工智能。他表示,许多公司将选择使用开源模型,这种模型的代码更加透明,可以进行调整,部分原因是使用自己的数据更容易对技术进行微调。
一些较小的模型已经展示了令人惊讶的能力。其中包括由Meta发布的开源语言模型LLaMa,据称它与大型模型的许多特性相匹配。
LLaMa有各种各样的尺寸,其中最小的只有70亿个参数,远远少于OpenAI在2020年发布的突破性语言模型GPT-3的1750亿个参数,但今年发布的GPT-4的参数数量尚未披露。斯坦福大学开发的一个基于LLaMa的研究模型,已经在谷歌的一款Pixel 6手机上运行。
除了它们小得多的尺寸外,这些模型的开源特性也能让研究人员和开发人员更容易适应不同的计算环境。高通今年早些时候展示了据称是首款运行Stable Diffusion图像生成模型的安卓手机,该模型拥有约10亿个参数。高通高级副总裁齐亚德•阿斯加尔(Ziad Asghar)表示,这家芯片制造商“量化”了这款模型,即缩小了它的尺寸,以便更容易在手机上运行,同时又不会失去任何准确性。
Creative Strategies的分析师本·巴加林(Ben Bajarin)说,由于针对手机定制的大部分工作仍处于试验阶段,现在评估这些努力是否会带来真正有用的移动应用还为时过早。他预测,从第一波拥有10亿至100亿个参数的移动模型中,会出现相对初级的应用程序,比如语音控制的照片编辑功能和简单的问答功能。
谷歌人工智能研究部门DeepMind副总裁佐宾•加赫拉马尼(Zoubin Ghahramani)表示,Gecko移动模型每秒可以处理16个token。大多数大型模型每生成一个单词使用1至2个token,这表明Gecko在手机上每秒可以生成10至15个单词,这可能使它适合于提示短信或简短的电子邮件回复。
阿斯加尔表示,移动手机的特殊要求意味着,人们的注意力可能会迅速转向所谓的多模态,这种模式可以处理一系列图像、文本和其他输入。他补充说,移动应用程序可能会严重依赖语音和图像,而不是个人电脑上更常见的大量文本应用程序。
与此同时,生成式人工智能开始以惊人的速度向智能手机转移,这将增加人们对苹果的关注。迄今为止,苹果一直与围绕该技术的投机狂潮保持着距离。
巴加林说,生成式人工智能中存在着一些众所周知的缺陷,比如大型模型容易产生“幻觉”,或者聊天机器人会用捏造的信息做出反应。这意味着苹果在一段时间内不太可能将这项技术嵌入iPhone的操作系统。相反,他预测该公司将寻找方法,让应用程序开发人员更容易在自己的服务中开始试验这项技术。
他表示表示:“这也是微软和谷歌的态度,他们都希望为开发者提供工具,让他们能够(与生成式AI应用)竞争。”
苹果的全球开发者大会将于6月5日召开,在此之前,微软也将举行开发者大会,争夺开发者注意力的斗争将变得更加激烈。生成式AI可能仍处于起步阶段,但进入更多用户手中和口袋的热潮已经进入超速行驶状态。