焦虑的谷歌，软硬件一起上跟OpenAI拼了

作者：和讯网发布时间：2024-05-22

图源谷歌

凤凰网科技讯（作者/王晓斌）5月22日消息，Google早就明确表示，今年的I/O大会将围绕着AI展开。然而在大会开始的前一天，OpenAI带着GPT-4o截胡，似乎打乱了Google原有的阵脚。

I/O大会开幕式期间，Google CEO皮查伊与高管总共提到121次“AI”。此刻的Google必须在两个小时以内，祭出自己多年积累的产品服务和软硬件优势，与OpenAI争夺AI领域的最高峰。

图源谷歌

Gemini 的进展：

在I/O 大会上，谷歌一口气提了上百次AI，火力全开的发布了Gemini 1.5 Pro并推出了多种AI工具。首先Gemini大模型更新，其中Gemini 1.5 Flash可以做到100万token；Gemini Pro可以做到200万token。相比之下，GPT-4 Turbo是12.8万，Claude 3只有20万。

从上下文的角度，Gemini超过目前所有的大模型。谷歌表示升级之后，Gemini 1.5 Pro 能够同时处理 2 小时的视频、22 小时的音频、6 万多行代码或 140 多万字。谷歌还称这不是终点，未来的目标是无限上下文。

此外，在 Google 办公套件中，Gemini 也将更深度整合，提供自动整理邮件和生成数据分析表格等功能。

与此同时，令人惊喜的是，Google也推出了对标sora视频模型的产品-- Veo，可以生成长度超过 1 分钟，分辨率最高 1080P 的“高质量”视频，并具有多种视觉和电影风格。

根据谷歌官方新闻稿，Veo 具备对自然语言有先进的理解能力，能够理解“延时摄影”、“航拍风景”等电影术语。用户可以使用文本、图像或视频提示来指导他们所需的输出，谷歌表示，这样产生的视频“更加连贯一致”，在整个镜头中人物、动物和物体的动作也更加逼真。

AI搜索全面升级：多轮推理、视频搜索、AI概览

谷歌宣布，到今年年底，谷歌搜索的AI概览将超过10亿人。这意味着，谷歌搜索将更加智能，能够为用户提供更准确、更相关的信息。此外，谷歌搜索还将很快推出多轮推理能力，可将复杂问题分解处理，并将原本需要几分钟甚至几个小时的研究压缩到在几秒钟内完成。

在视频搜索方面，谷歌将支持用户通过拍摄视频来进行搜索。例如，用户可以通过拍摄电唱机，来获取故障排除相关的AI搜索概述。

Gemini 在 Android 上的整合：Gemini赋能安卓，打造最强AI手机

谷歌将Gemini大模型嵌入到安卓操作系统中，打造了首个内置端侧AI的移动操作系统。这意味着，安卓手机用户将能够享受到更智能、更便捷的AI体验。

具体来说，谷歌在安卓系统中增加了以下AI功能：

画圈即搜：用户可以直接在手机屏幕上圈出不懂的问题，Gemini就会给用户一步步的问题解答。

Gemini Live：用户可以通过文本、语音或影像多种方式进行交互，直接与大模型进行对话。

AI虚拟员工：用户可以创建一个AI虚拟员工，将其放入各个工作群组中，它可以在各个群聊中提取信息，找到关键信息。

AI Teammate：

Google 推出了 AI Teammate，将 Gemini 的功能包装成一个 AI 员工，帮助用户在工作中整理信息、提取关键信息并进行智能反馈。AI Teammate 在办公套件中的应用尤为突出，如在 Gmail 中生成会议纪要、在邮件中提取表格文件等。

Notebook LM：

Google 进一步发展了去年推出的 Notebook LM，作为教育应用的探索项目。它能模拟教师身份，讲述物理课程，并在用户提问时提供准确的回答，使用户更好地掌握知识。

DeepMind 的项目：

DeepMind 创始人哈萨比斯首次在 Google I/O 上亮相，介绍了新项目 Project Astra。这个项目旨在探索通用人工智能如何为我们的日常生活提供帮助。通过演示视频展示了 Astra 的功能，展示了其强大的通用语言与环境理解能力。

新一代 TPU 硬件 Trilium：

Google 发布了代号为 Trilium 的第六代 TPU 硬件，计算能力提升 4.7 倍，预计将在 2024 年年底面向用户推出。Trilium 的发布为 Google AI 技术的发展提供了更强大的硬件支持。

Android 15 中的 AI 功能更新：

Android 15 也加入了多项 AI 功能更新，尤其是 Gemini 在 Android 中的更深度整合，使其能够更好地应用于用户的日常生活中。

今年的 Google I/O 大会在人工智能领域展示了 Google 在 Gemini、AI Teammate、Notebook LM、DeepMind 项目、新一代 TPU 硬件和 Android 15 中的 AI 功能更新等方面的重要进展，显示了 Google 在 AI 领域的持续领先地位和创新能力。

谷歌I/O 2024大会的召开，标志着谷歌在AI领域的又一次重大突破。凭借着Gemini大模型的强大实力，谷歌在AI搜索、操作系统、视频生成等多个领域都取得了领先地位。

然而，在AI大模型的竞争中，谷歌并非孤军奋战。OpenAI、微软等公司也在不断加大投入，研发各自的AI大模型。未来的AI大模型战火将更加激烈，谁将最终胜出，还有待观察。