当前位置:首页|资讯|OpenAI|谷歌

难忍OpenAI抢风头!谷歌贴脸开大发布新模型Gemini 2.0,主攻多模态及AI智能体

作者:搜狐科技发布时间:2024-12-19

出品|搜狐科技

作者|郑松毅

根本忍不了OpenAI抢风头,谷歌出手!

就在刚刚,谷歌CEO“劈柴”亲自官宣新一代大模型Gemini 2.0登场。

作为Gemini 2.0系列的“先头兵”,此次最先向大家开放的是Gemini 2.0 Flash实验版本。

话不多说,先来看看其测试成绩。

熟悉Gemini的人知道,Flash轻量系列主打在低延迟的优势下实现较高性能,谷歌也一度称该系列是最受开发者欢迎的版本。

从测试结果来看,升级后的Gemini 2.0 Flash在通识知识、编码、数学等多方面表现已经超越上一代的“招牌”模型Gemini 1.5 Pro。

谷歌称,Gemini 2.0 Flash在测试中的响应速度要比Gemini 1.5 Pro快得多,基本达到两倍。

除了性能增强,Gemini 2.0 Flash本次还增添了新功能,主攻多模态。

升级后的2.0 Flash不仅支持图像、视频和音频等多模态输入,现在还支持多模态输出。

不光是能图文混排,和实现可操纵的多语种文本转语音 (TTS) ,还能直接调用Google 搜索、代码执行等工具,以及第三方用户定义函数。

上述成绩还仅仅是升级后Flash版本的表现,现在是不是对Pro版本更“流口水”了?

有网友看后嘲讽,“OpenAI到底还有没有新花样震场了,看起来12天的直播也就那样。”

除了多模态,谷歌看准的另一个潜力发展方向就是AI智能体。

在谷歌发布的官方博客中,CEO“劈柴”与DeepMind核心领导者一致将Gemini 2.0定位为:面向智能体时代的AI Agent模型

谷歌的愿景是,希望以此能构建新的AI智能体,早日实现通用人工智能助手。

假如科研人员正在研究一个复杂的课题,完全可以使唤AI助手去帮助搜集资料、整理数据、甚至输出完整的研究报告。

当然,像编写代码这种任务,AI助手一样可以胜任。

有了更强劲的Gemini 2.0,谷歌下一步的动作当然是对其旗下产品进行升级。

在今年的谷歌I/O大会上,有一款与OpenAI GPT-4o语音助手相较量的产品——Project Astra。

谷歌表示,将着重先对Project Astra升级改造,以实现以下功能:

更好的对话:现在能够使用多种语言和混合语言进行交谈,更好地理解口音和不常见的单词。

使用新工具:会用谷歌搜索、地图等新工具,让其作为助手变得更有用。

更强记忆力:拥有10分钟的会话记忆,并记住更多历史对话。

更低延迟:实现按正常人类对话节奏来理解对话。

此外,谷歌还计划把Project Astra功能添加到智能眼镜及更多移动终端中。

更值得期待的是,谷歌表示,正在与一些游戏开发商洽谈合作,有机会将AI智能体植入游戏中,实现玩家实时对话等功能,让玩家拥有更沉浸式的游戏体验。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1