谷歌“狙击”OpenAI，发布新一代大模型！主打Agent+多模态

作者：量子位发布时间：2024-12-17

谷歌 OpenAI

鱼羊西风发自凹非寺

量子位 | 公众号 QbitAI

继量子芯片之后，谷歌又来抢“OpenAI双12直播”的流量了！

就在刚刚，谷歌新一代大模型Gemini 2.0突然登场，再次由谷歌CEO皮猜亲自官宣。

新一代模型专为AI Agent而打造，谷歌表示目前已经将2.0版本提供给了一些开发者内测，正在迅速将其集成在Gemini和搜索等产品线中。

好消息是，Gemini 2.0 Flash实验版模型今天就在网页端开放，大家都能玩，移动端即将推出。

除此之外，谷歌还推出了一项名为深度研究（Deep Research）的新功能，基于高级推理和长上下文能力，它能直接帮你干研究助理的活儿——给个主题，自己出报告的那种。

目前这个新功能在Gemini Advanced版本中可用。

谷歌这一波出手，再结合Sora的不尽如人意，新一天的直播还没开始，已经有人开始唱衰OpenAI了：

OpenAI的护城河是什么？

“面向智能体时代的新AI模型”

在谷歌CEO皮猜、Google DeepMind CEO哈萨比斯，以及Google DeepMind CTO科雷（Koray Kavukcuoglu）三人共同撰写的博客文章中，官方给Gemini 2.0的定位是：

面向智能体时代的AI模型。

在多模态方面的新进展，以及原生工具的使用，使我们能够构建新的AI智能体，以更接近实现通用助手的愿景。

具体如何体现？在Gemini 2.0 Flash实验版第一时间上线的同时，谷歌还在Gemini Advanced中推出了一项名为深度研究（Deep Research）的智能体新功能。

你可以把它当成以研究助理，围绕一个复杂主题生成研究报告。有点像是个科研版AI搜索。

另外一个Gemini 2.0的重点关键词是：多模态。

2.0 Flash实验版除了支持图像、视频、音频多模态输入，还支持多模态输出。

不单单是简单的图文混排，可控的多语种文本到语音（TTS）输出也行，还能直接本地调用工具，比如谷歌搜索、代码工具、第三方用户定义的功能。

有ChatGPT插件那味儿了。

不过，作为实验模型，其文本到语音和原生图像生成功能目前仅提供给早期访问合作伙伴。谷歌透露2.0 Flash将在1月份正式推出，会提供更多不同大小的模型。

而根据谷歌发布的基准测试结果，不论是在多模态的图片、视频能力上，还是编码、数学等能力上，仅是Flash实验版的Gemini 2.0表现就已几乎全面超越Gemini 1.5 Pro 002。

而且它的速度是1.5 Pro的两倍。

谷歌表示，明年年初，会将Gemini 2.0扩展到更多旗下产品中，比如Project Astra。

就是I/O大会上谷歌推出来跟GPT-4o的语音功能打擂台的那个。

此次，基于Gemini 2.0，Project Astra更新了以下功能：

更好的对话：现在能够以多种语言和混合语言进行对话，更好地理解口音和不常见的单词。
使用新工具：Project Astra会用谷歌搜索、Lens和地图了。
更强的记忆力：Project Astra现在拥有10分钟的会话记忆，并且可以记住更多历史对话，也就说，凭借这些“记忆”，它能更懂你了。
改进延迟：Project Astra可以按正常人类对话的节奏来理解对话。

谷歌还提到，正在将Project Astra移植到眼镜等更多移动终端中。

另外，谷歌透露，他们正在和Supercell等游戏开发商合作，测试基于Gemini 2.0打造的游戏智能体们的实力。

这些智能体可以根据屏幕上的动作对游戏进行推理，并与玩家实时对话提供行动建议。

玩《突击小队》、《部落冲突》、《农场日记》，场面belike：

除了网页端可用，Gemini 2.0 Flash实验模型还通过Google AI Studio和Vertex AI的Gemini API向开发者提供。

从OpenAI跳槽到谷歌的Logan Kilpatrick表示，他们在Google AI Studio中创建了一个全新体验，展示了Gemini 2.0视频理解、原生工具使用、空间理解的入门应用。

那么，你觉得这够Agent吗？

参考链接：

[1]https://x.com/GoogleDeepMind/status/1866869343570608557

[2]https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents

— 完—

近期资讯

荣耀工程师称手机拍照只有 2 家可比，豪言背后的自信与底气

12月23日，荣耀举行了荣耀Magic7RSR保时捷设计及影像技术发布会。在发布会上，荣耀正式宣布Magic7系列将全面升级“大王影像”，旨在以人性化的摄影体验为核心目标，重塑摄影体验新境界。总之，整场发布会看下来，我们能够深刻感受到荣耀在影像技术方面确实取得了非常耀眼的成果。

IT之家 2024-12-26

Steam账号安全指南：如何修改密码与启用双重验证

在现代社会中，网络安全越来越受到重视，尤其是对于游戏玩家来说，保护自己的账户安全是非常重要的。Steam作为全球最大的数字游戏分销平台，拥有数以亿计的用户。为了保护自己的账号，定期更改密码是个不错的选择。一旦登录成功，你会看到界面右上角有一个“昵称”或者你的账户名。

新报观察 2024-12-26

启明星辰集团数据安全检查工具箱正式发布，“有理有据”搞定数据安全检查“痛点”！

随着我国《数据安全法》《个人信息保护法》《网络数据安全管理条例(征求意见稿)》等一系列法规政策相继出台与持续推进,国家监管部门和各大行业领域加大对数据安全工作重视程度,数据安全监管体系日益严密,数据安全检查成为网络安全管理的一项重要任务。

砍柴网 2024-12-26

圆的面积计算：公式、应用与背后的数学故事

圆的面积是一个在数学中非常基本的问题，很多人可能在小时候就学过这个公式，但随着时间的推移，可能对它的理解和应用逐渐淡忘了。今天，就让我们来聊聊圆的面积怎么算，以及这个公式背后的故事和一些相关的知识。那么，为什么是r的平方呢？

新报观察 2024-12-26

景胜电子取得导电胶生产用切条装置专利，避免人工切割效率低下

金融界2024年12月26日消息，国家知识产权局信息显示，井冈山景胜电子科技有限公司取得一项名为“种导电胶生产用切条装置”的专利，授权公告号CN222200674U，申请日期为2024年5月。

金融界 2024-12-26

配骁龙8 Gen2！荣耀GT Pro真机现身

荣耀正式推出了首款独立后的GT新品，这是一款针对年轻人市场的产品。最近有消息称，这款手机还可能会推出Pro版本。

中关村在线 2024-12-26

荣耀赵明谈与华为影像技术的竞争，工程师称手机拍照只有2家可比

12月23日，荣耀举行了荣耀Magic7RSR保时捷设计及影像技术发布会，本次发布会，荣耀正式宣布Magic7系列将全面升级“大王影像”，旨在以人性化的摄影体验为核心目标，重塑摄影体验新境界。

IT之家 2024-12-26

美的BCD-185WM(E)冰箱：1199元享185升风冷无霜，节能静音新体验

#年货节好物集市#美的冰箱以其创新技术和卓越性能在家电市场中占据了重要的地位。美的冰箱的技术特点包括风冷无霜技术，该技术能够避免结霜问题，使食物保持新鲜；双系统双循环技术，独立控制冷藏室和冷冻室的温度，有效避免食物串味。此外，美的冰箱还以其节能低噪、小机身大容量等特点，满足了现代家庭对高效、环保和便捷生活的需求。

小米地瓜 2024-12-26

华凌HR-589WKP冰箱：直降400元，一级能效风冷无霜，大容量新选择

#年货节好物集市#华凌冰箱以其高性价比在家电市场中占有一席之地。华凌冰箱，尤其是HR-589WKP型号，以其大容量、一级能效、风冷无霜技术以及PT净味系统等特点，满足了现代家庭对高效、节能和健康生活的追求。

小米地瓜 2024-12-26

共绘巫山红叶盛景｜华为Mate70红枫原色影像见证自然之美

日前，“巫山盛景入镜来”红枫原色影像分享沙龙在华为智能生活馆·重庆解放碑来福士店成功举办，本次活动由市民影像计划、华龙网、巫山县文旅委、巫山县林业局以及巫山文旅集团共同发起，旨在通过华为Mate70系列的镜头，捕捉巫山红叶的壮丽与细腻，还原自然之美，展现“两岸青山·千里林带”生态修复工程的辉煌成就。

金台资讯 2024-12-26

谷歌“狙击”OpenAI，发布新一代大模型！主打Agent+多模态

推荐体验

相关资讯