计算成本太高或压垮科技巨头移动设备成AIGC新赛道

作者：腾讯科技发布时间：2023-05-21

划重点

1随着科技公司急于将生成式人工智能嵌入其软件和服务中，它们面临着计算成本大幅上升的问题，而在移动设备上运行聊天机器人等服务有望大幅降低成本。
2分析师警告称，如果互联网搜索用户开始期望在标准搜索结果中出现人工智能生成的内容，谷歌等科技巨头的利润率可能会受到挤压。
3在移动设备上生成对查询的响应，而不是等待远程数据中心产生结果，可以减少使用应用程序的延迟，同时有助于增强隐私保护。
4分析师预测，从第一波拥有10亿至100亿个参数的移动模型中，会出现相对初级的应用程序，比如语音控制的照片编辑功能和简单的问答功能。

腾讯科技讯生成式人工智能模型正以创作文本、图像甚至视频的能力吸引用户，但生成这些内容所需的计算资源相当庞大，因此它们目前只能在云端或高性能计算机上运行。不过，将爆火聊天机器人ChatGPT背后的技术带到移动设备上的竞赛已经开始。从这项技术惊人的发展速度来看，它可能会以超出人们想象的速度改变移动通信和计算领域。

利用手机上冗余的处理能力分担成本

随着科技公司急于将生成式人工智能嵌入其软件和服务中，它们面临着计算成本大幅上升的问题。这种担忧对谷歌的影响尤其大，华尔街分析师警告称，如果互联网搜索用户开始期望在标准搜索结果中出现人工智能生成的内容，谷歌的利润率可能会受到挤压。

在移动设备上运行生成式人工智能，而不是通过大型科技公司运营的服务器上的云计算系统，有望解决最新人工智能技术潮流中一个最大的成本问题。

谷歌上周表示，该公司已经成功在三星Galaxy手机上运行了其最新大语言模型PaLM 2。尽管该公司没有公开展示这种被称为Gecko的缩小模型，但此举堪称是一个最新迹象，表明一种只需要数据中心计算资源支持的人工智能正迅速开始进入更多地方。

这一转变可能会使聊天机器人等服务的运行成本大大降低，并为使用生成性人工智能的更具变革性的应用程序铺平道路。

移动芯片公司高通首席执行官克里斯蒂亚诺·阿蒙（Cristiano Amon）表示：“你需要开发人工智能混合技术，让它能同时在数据中心和本地运行，否则成本太高。”他补充说，利用手机上未使用的处理能力是分担成本的最佳方式。

小模型爆发式增长拉近愿景

去年年底，当ChatGPT的推出引起了人们对生成式人工智能的广泛关注时，将其带到移动设备上的愿景似乎还很遥远。除了对这类服务背后的所谓大语言模型进行培训外，推理（或运行模型以产生结果）的工作也需要计算。手机缺乏足够的内存来容纳像ChatGPT这样的大型模型，也缺乏运行这些模型所需的处理能力。

在移动设备上生成对查询的响应，而不是等待远程数据中心产生结果，可以减少使用应用程序的延迟。当用户的个人数据被用来提炼生成性反应时，将所有处理过程保留在手机上也可以增强隐私保护。

最重要的是，生成性人工智能可以让在智能手机上进行的常见活动变得更容易，例如涉及到生成文本的事宜。阿蒙解释称：“你可以将人工智能嵌入到每个办公应用程序中：你会收到一封电子邮件，它会建议你做出回应，但你将需要在本地和数据中心运行这些东西的能力。”

有些基础模型的快速发展已经改变了这一平衡。最大和最先进的模型总是占据头条的位置，如谷歌的PaLM 2和OpenAI的GPT-4。但随着较小模型的爆炸式增长，有些同样的功能可以以技术要求较低的方式获得。它们部分受益于新技术，这些技术基于对语言模型进行更仔细的培训来微调，从而减少了语言模型需要保存的信息量。

IBM首席执行官阿尔温德·克里希纳(Arvind Krishna)表示，大多数希望在自己的服务中使用生成式人工智能的公司，将通过组合许多这样的小型模型来满足自己的需求。上周，IBM宣布推出专门的技术平台，以帮助其客户利用生成式人工智能。克里希纳称，许多公司会选择使用开源模型。这种模型的代码更透明，同时使用他们自己的数据对技术进行微调会更容易。

有些较小的模型已经展示了令人惊讶的能力，其中包括由Facebook母公司Meta发布的开源语言模型LLaMa，据称它与大型系统的许多功能相媲美。

LLaMa有各种各样的规模，其中最小的只有70亿个参数，远远少于OpenAI在2020年发布的突破性语言模型GPT-3的1750亿个参数，更不用说今年发布的GPT-4，后者的参数数量尚未披露。斯坦福大学基于LLaMa开发的研究模型已经在谷歌的Pixel 6手机上运行。

除了规模更小外，这类模型的开源特性也使研究人员和开发人员更容易适应不同的计算环境。高通今年早些时候展示了据称是首款运行Stable Diffusion图像生成模型的安卓手机，该模型拥有约10亿个参数。高通高级副总裁齐亚德·阿斯加尔（Ziad Asghar）表示，这家芯片制造商“量化”了这款模型，即缩小了它的尺寸，以便更容易在手机上运行，同时又不会失去任何准确性。

平台转移将为苹果带来机会？

Creative Strategies的分析师本·巴加林(Ben Bajarin)说，由于针对手机定制的大部分功能仍处于试验阶段，现在评估这些努力是否会带来真正有用的移动应用还为时过早。他预测，从第一波拥有10亿至100亿个参数的移动模型中，会出现相对初级的应用程序，比如语音控制的照片编辑功能和简单的问答功能。

谷歌旗下人工智能研究部门DeepMind副总裁佐宾·加赫拉马尼(Zoubin Ghahramani)表示，其Gecko移动模型每秒可以处理16个令牌。令牌是大型语言模型处理的短文本单位数量。大多数大型模型每生成一个单词使用1-2个令牌，这表明Gecko在手机上每秒可以生成10-15个单词，这可能使它适合于提示短信或简短的电子邮件回复。

高通的阿斯加尔表示，移动手机的特殊要求意味着，人们的注意力可能会迅速转向所谓的多模态模型，这种模型可以处理一系列图像、文本和其他输入。他补充说，移动应用程序可能会非常依赖语音和图像，而不是个人电脑上更常见的大量文本应用程序。

与此同时，生成式人工智能开始以惊人的速度向智能手机等移动平台上转移，这将增加人们对苹果的关注。尽管迄今为止，苹果始终没有就这波人工智能浪潮做出动作。

巴加林说，生成式人工智能存在众所周知的缺陷，比如大型模型容易产生“幻觉”，或者聊天机器人会用捏造的信息做出反应。这意味着，苹果在一段时间内不太可能将这项技术嵌入iPhone的操作系统中。相反，他预测该公司将寻找方法，让应用开发者更容易在自己的服务中测试这项技术。

巴加林表示：“这也是微软和谷歌的态度：他们都希望为开发者提供工具，让他们能够与生成式人工智能应用竞争。”

苹果的全球开发者大会将于6月5日召开，在此之前，微软也将举行名为Build的开发者大会，争夺开发者注意力的斗争将变得更加激烈。生成式人工智能可能仍处于起步阶段，但进入更多用户移动设备的赛道已经启动超速行驶状态。（金鹿）

计算成本太高或压垮科技巨头移动设备成AIGC新赛道

推荐体验

相关资讯

计算成本太高或压垮科技巨头，移动设备成AIGC新赛道

曝光：Sora的推理与训练，一笔惊人的计算成本大公开！

Sora 究竟有多烧钱？Sora的推理与训练的计算成本被扒出来了

黄仁勋称计算成本降低让AI得以出现，明年英伟达将推出Blackwell Ultra芯片

AI迅速推高数据中心价格：硅谷空置率接近历史低点，云计算成本也飞涨

近期资讯

深入理解JavaScript作用域：撬开js的大门

JavaScript 数组的常用方法有哪些

10.4K Star！推荐一款超实用的开源待办任务清单工具：Super Productivity

基于mapbox 调研 trip.com 地图功能

自定义跑马灯控件：实现 Android 高性能滚动文本效果

1小时构建Vue3知识体系-之vue3工程项目的构建

scss和less的区别

解释不同业务场景下 JavaScript 中 this 的值

如何开发并发布一个简单的 VS Code 扩展

1小时构建Vue3知识体系-Vue的响应式，让数据动起来

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

计算成本太高或压垮科技巨头 移动设备成AIGC新赛道

计算成本太高或压垮科技巨头移动设备成AIGC新赛道