AI搜索引擎来了！谷歌深夜发布“AI超级全家桶”，全面叫板OpenAI

作者：华夏时报发布时间：2024-05-15

AI巨头谷歌放出“王炸”。北京时间周三凌晨1点开始，谷歌召开年度Google I/O开发者大会。

虽然被OpenAI抢在前面发布了重磅新品演示，但谷歌做到了OpenAI还没能做到的事，率先发布人工智能（AI）搜索引擎，捍卫搜索领域的王者地位，同时对垒OpenAI新发布的旗舰模型GPT-4o，以升级版的最强大AI模型Gemini迎战。

与预期一致，谷歌的这场发布会基本都是在谈AI、AI、AI、AI和AI。根据发布会最后的官方统计，整场Keynote的演讲稿里总共提了120次AI。

谷歌CEO桑达尔·皮查伊（Sundar Pichai）表示，谷歌的所有工作都在围绕生成式AI模型Gemini展开，“我们希望每个人都能从Gemini所做的事情中受益”。

AI搜索支持视频输入，Gemini、Gemma上新

作为搜索引擎巨头，AI搜索正是谷歌所做工作中的一部分。

据介绍，在最新Gemini的加持下，谷歌搜索将具备多步骤推理能力，可以一次性处理带有多个限制条件的长问题、帮助用户进行头脑风暴，并支持视频搜索，让用户通过拍摄视频来搜索解决方案。这些功能将先在美国推出，谷歌预计会在今年年底前将其带给超过10亿人。

谷歌AI搜索将具备多步骤推理能力。来源：谷歌

谷歌的Gemini以超长的上下文窗口而出名。在大会上，谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力，为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最新模型、拥有100万个token的Gemini 1.5 Pro，支持超过35种语言，定价为每100万token 3.5美元。

据皮查伊介绍，Gemini 1.5会提供“迄今为止所有基础模型中最长的上下文窗口”。Gemini 1.5 Pro将在今年晚些时候将会把窗口进一步扩大至200万token，拓展同步处理多模态信息的边界。

从今年夏天开始，Gemini将支持语音实时交互，并在今年晚些时候上线实时视频交互。未来几个月内，谷歌也将推出类似于GPTs的自定义AI助手功能，名为Gems，可以与整套“谷歌全家桶”联动。

另外，对于一些需要快速响应的场景，谷歌推出了Gemini 1.5 Flash模型。Flash将是API中速度最快的Gemini模型，针对大规模、大批量的高配任务进行了优化，也具有100万token的长上下文窗口。

谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍，Gemma 2采用全新架构，参数上达到27B，拥有突破性的性能和效率。

AI助手Project Astra叫板GPT-4o

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后，谷歌的AI智能体项目Project Astra也重磅登场。

在演示视频中，Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进建议、能够通过镜头“看到”伦敦国王十字区，并提醒用户智能眼镜的放置位置。

Project Astra是谷歌对于未来AI助手的展望。来源：谷歌

谷歌AI助手将能够通过智能眼镜和用户一起观察世界。来源：谷歌

据介绍，谷歌在Gemini的基础上开发了Astra的原型，可以通过连续编码视频帧、将视频和语音输入组合到事件时间线中以实现更快地处理信息。通过语音模型，谷歌也强化了智能助手的说话能力，让其能够给出更快速的回应。

不过，在演示视频中，谷歌AI助手的回应速度似乎还是会比GPT-4o稍慢一些，语音所表现出的感情色彩也平淡一些。

皮查伊表示，谷歌计划从今年开始将Astra的功能添加到其Gemini应用程序及其产品中。不过，他也强调，虽然最终目标是“让Astra在公司的软件中实现无缝连接”，但该产品将被谨慎推出，并且“商业化之路将由质量驱动”。

除了在AI助手领域的竞争外，谷歌还通过文生视频模型Veo来反击OpenAI的Sora。Veo能够根据文字、图片和视频的提示来生成高质量的1080p视频，创作“一致且连贯”的镜头，用户可以对光照、镜头语言、视频颜色风格等进行自定义设置。不过，谷歌没有宣布Veo的具体推出时间。

来源：谷歌I/O主题演讲

此外，谷歌还宣布了一系列与图像、音乐有关的生成式AI工具，包括能够表现更高细节水平的文生图工具Imagen 3，还有与Youtube以及音乐家合作的AI音乐工具“AI音乐沙盒”。

在硬件方面，谷歌将于今年晚些时候推出交付第六代数据中心AI芯片TPU Trillium。皮查伊表示，每块芯片的计算性能将比第五代提升4.7倍，谷歌通过扩大芯片的矩阵乘法单元（MXU）和提高整体时钟速度来实现这一目标。此外，第六代将比第五代芯片节能67%，谷歌还将Trillium芯片的内存带宽提高了一倍。

最新AI项目撞车OpenAI？

最值得注意的是，谷歌刚刚官宣了新的人工智能模型，包括一款文生视频模型Veo，与OpenAI的Sora颇为类似。

同时，其万能AI助手项目Project Astra以及其AI语音聊天功能 Live，都与OpenAI前一日推出的GPT-4o功能颇为类似。

在前一日OpenAI发布的演示中，GPT-4o可以实时对音频、视觉和文本进行推理。而从谷歌的演示视频来看，谷歌的AI助手Project Astra也并不逊色于GPT-4o，可以通过视频画面接受信息、理解复杂多变的环境并做出回应。

皮查伊在谈到OpenAI时表示：“我认为他们还没有向用户提供演示。我不认为他们的这一功能将在产品中可用。”

OpenAI周一在一篇博客文章中表示，其ChatGPT Plus订阅的客户将能够在未来几周内试用GPT-4o的早期版本。而皮查伊也表示，谷歌的Project Astra多媒体聊天功能将在今年晚些时候出现在Gemini聊天机器人上。

皮查伊表示：“我们清楚地知道如何处理这个问题，我们会把它做好的。”

14日当天，谷歌（Nasdaq：GOOGL）股价收于每股171.93美元，涨0.6%，总市值2.12万亿美元。

来源：澎湃新闻、财联社、公开信息等

本期编辑：孙琪

AI搜索引擎来了！谷歌深夜发布“AI超级全家桶”，全面叫板OpenAI

推荐体验

相关资讯

谷歌反击OpenAI奇袭：发布生成式AI版搜索引擎等大模型“全家桶”

剑指谷歌！OpenAI AI搜索引擎SearchGPT来了

OpenAI或将发布搜索引擎，谷歌的麻烦来了？

AI搜索引擎来了谷歌放大招正面刚OpenAI

OpenAI和谷歌同日升级AI搜索功能，AI搜索引擎之战全面打响

近期资讯

Next.js 14 性能优化：从首屏加载到运行时优化的最佳实践

对ArkTS并发的理解

JavaScript GC 垃圾回收机制

MySQL中的几种主要日志

从零搭建一个现代化的个人导航网站：技术实践与经验分享

快来看，使用 CSS 打造复古老电影效果🎬

✨ 三分钟就能挂彩灯？那你试过用代码点亮圣诞树吗？🎁

Leptos_001 快速开始

前端开发测试清单【含解决方案】

用 WebGL 绘制你的专属魔方：从零开始打造炫彩立方体

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响