出品|搜狐科技
作者|郑松毅
根本忍不了OpenAI抢风头,谷歌出手!
就在刚刚,谷歌CEO“劈柴”亲自官宣新一代大模型Gemini 2.0登场。
作为Gemini 2.0系列的“先头兵”,此次最先向大家开放的是Gemini 2.0 Flash实验版本。
话不多说,先来看看其测试成绩。
熟悉Gemini的人知道,Flash轻量系列主打在低延迟的优势下实现较高性能,谷歌也一度称该系列是最受开发者欢迎的版本。
从测试结果来看,升级后的Gemini 2.0 Flash在通识知识、编码、数学等多方面表现已经超越上一代的“招牌”模型Gemini 1.5 Pro。
谷歌称,Gemini 2.0 Flash在测试中的响应速度要比Gemini 1.5 Pro快得多,基本达到两倍。
除了性能增强,Gemini 2.0 Flash本次还增添了新功能,主攻多模态。
升级后的2.0 Flash不仅支持图像、视频和音频等多模态输入,现在还支持多模态输出。
不光是能图文混排,和实现可操纵的多语种文本转语音 (TTS) ,还能直接调用Google 搜索、代码执行等工具,以及第三方用户定义函数。
上述成绩还仅仅是升级后Flash版本的表现,现在是不是对Pro版本更“流口水”了?
有网友看后嘲讽,“OpenAI到底还有没有新花样震场了,看起来12天的直播也就那样。”
除了多模态,谷歌看准的另一个潜力发展方向就是AI智能体。
在谷歌发布的官方博客中,CEO“劈柴”与DeepMind核心领导者一致将Gemini 2.0定位为:面向智能体时代的AI Agent模型。
谷歌的愿景是,希望以此能构建新的AI智能体,早日实现通用人工智能助手。
假如科研人员正在研究一个复杂的课题,完全可以使唤AI助手去帮助搜集资料、整理数据、甚至输出完整的研究报告。
当然,像编写代码这种任务,AI助手一样可以胜任。
有了更强劲的Gemini 2.0,谷歌下一步的动作当然是对其旗下产品进行升级。
在今年的谷歌I/O大会上,有一款与OpenAI GPT-4o语音助手相较量的产品——Project Astra。
谷歌表示,将着重先对Project Astra升级改造,以实现以下功能:
更好的对话:现在能够使用多种语言和混合语言进行交谈,更好地理解口音和不常见的单词。
使用新工具:会用谷歌搜索、地图等新工具,让其作为助手变得更有用。
更强记忆力:拥有10分钟的会话记忆,并记住更多历史对话。
更低延迟:实现按正常人类对话节奏来理解对话。
此外,谷歌还计划把Project Astra功能添加到智能眼镜及更多移动终端中。
更值得期待的是,谷歌表示,正在与一些游戏开发商洽谈合作,有机会将AI智能体植入游戏中,实现玩家实时对话等功能,让玩家拥有更沉浸式的游戏体验。