谷歌把人工智能大模型竞赛的战线卷到了手机硬件上。
美国当地时间周三,谷歌推出该公司自认为最大、最有能力的AI大模型Gemini,可以用来分析图像和音频信息,并具有复杂的推理和“规划”能力。它从周三开始为谷歌的Bard聊天机器人提供支持,并将从明年开始更广泛地应用于谷歌搜索引擎。
Gemini 包括三种量级:能力最强的Gemini Ultra,适用于多任务的Gemini Pro ,以及适用于特定任务和端侧的Gemini Nano。
虽然Nano是Gemini大模型中最小的一款,但谷歌对它的应用给予厚望,它是谷歌专门为在移动设备上运行而设计的,无需联网,可以直接在设备上本地和离线运行。
手机本地运行Gemini Nano
谷歌已将Gemini Nano集成到其最新的Pixel手机中。谷歌表示,nano模型针对移动设备进行了优化,安卓开发人员可以轻松构建离线工作的人工智能应用程序和功能,或使用设备上的个人信息,以便更好地保护个人隐私。
Pixel 8 Pro是目前唯一一款兼容Nano模型的手机,但谷歌将这个新模型视为安卓未来的核心部分。
如果你拥有Pixel 8 Pro,从今天开始,你手机上的两项功能将由Gemini Nano支持:录音机应用中的自动摘要功能和Gboard键盘上的智能回复功能。这两项功能都可以离线运行,并且因为Nano模型是在设备本身上运行,所以它会给人快速和原生的感觉。
明年,当谷歌在Pixel手机上的Assistant中,引入由Gemini驱动的Bard聊天机器人时,你将获得更多Gemini体验。
据媒体援引谷歌DeepMind 首席执行官Demis Hassabis表示:
谷歌研究将Gemini Nano构建到安卓系统Nano模型虽然小,但仍然很强大。因为Pixel手机体积非常小,存在内存限制、速度限制等等,所以必须要把AI模型做小。就其量级而言,它实际上是一个令人难以置信的模型。Nano模型的目标是创建一个尽可能强大的Gemini版本,并且不会占用手机的存储空间或让处理器发烫。
目前,谷歌的Tensor 3处理器似乎是唯一能够运行Nano模型的处理器。不过,谷歌也在想办法将Nano模型整合到整个安卓系统中:谷歌推出了一项名为AICore的新系统服务,开发者可以利用这项服务将Gemini支持的功能引入自己的应用程序中。
而你的手机仍然需要一个高端的芯片才能运行Nano模型,但谷歌在宣布该功能的博客文章中提到,高通、三星和联发科等公司可以生产兼容处理器。开发者现在就可以加入谷歌的抢先体验计划。
在过去的几年里,谷歌一直将其Pixel手机本质上视为人工智能设备。有了Gemini Nano之后,未来许多高端安卓设备都能实现这一目标。