图源谷歌
凤凰网科技讯(作者/王晓斌)5月22日消息,Google早就明确表示,今年的I/O大会将围绕着AI展开。然而在大会开始的前一天,OpenAI带着GPT-4o截胡,似乎打乱了Google原有的阵脚。
I/O大会开幕式期间,Google CEO皮查伊与高管总共提到121次“AI”。此刻的Google必须在两个小时以内,祭出自己多年积累的产品服务和软硬件优势,与OpenAI争夺AI领域的最高峰。
图源谷歌
Gemini 的进展:
在I/O 大会上,谷歌一口气提了上百次AI,火力全开的发布了Gemini 1.5 Pro并推出了多种AI工具。 首先Gemini大模型更新,其中Gemini 1.5 Flash可以做到100万token;Gemini Pro可以做到200万token。相比之下,GPT-4 Turbo是12.8万,Claude 3只有20万。
从上下文的角度,Gemini超过目前所有的大模型。 谷歌表示升级之后,Gemini 1.5 Pro 能够同时处理 2 小时的视频、22 小时的音频、6 万多行代码或 140 多万字。 谷歌还称这不是终点,未来的目标是无限上下文。
此外,在 Google 办公套件中,Gemini 也将更深度整合,提供自动整理邮件和生成数据分析表格等功能。
与此同时,令人惊喜的是,Google也推出了对标sora视频模型的产品-- Veo,可以生成长度超过 1 分钟,分辨率最高 1080P 的“高质量”视频,并具有多种视觉和电影风格。
根据谷歌官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。用户可以使用文本、图像或视频提示来指导他们所需的输出,谷歌表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。
AI搜索全面升级:多轮推理、视频搜索、AI概览
谷歌宣布,到今年年底,谷歌搜索的AI概览将超过10亿人。这意味着,谷歌搜索将更加智能,能够为用户提供更准确、更相关的信息。此外,谷歌搜索还将很快推出多轮推理能力,可将复杂问题分解处理,并将原本需要几分钟甚至几个小时的研究压缩到在几秒钟内完成。
在视频搜索方面,谷歌将支持用户通过拍摄视频来进行搜索。例如,用户可以通过拍摄电唱机,来获取故障排除相关的AI搜索概述。
Gemini 在 Android 上的整合:Gemini赋能安卓,打造最强AI手机
谷歌将Gemini大模型嵌入到安卓操作系统中,打造了首个内置端侧AI的移动操作系统。这意味着,安卓手机用户将能够享受到更智能、更便捷的AI体验。
具体来说,谷歌在安卓系统中增加了以下AI功能:
画圈即搜:用户可以直接在手机屏幕上圈出不懂的问题,Gemini就会给用户一步步的问题解答。
Gemini Live:用户可以通过文本、语音或影像多种方式进行交互,直接与大模型进行对话。
AI虚拟员工:用户可以创建一个AI虚拟员工,将其放入各个工作群组中,它可以在各个群聊中提取信息,找到关键信息。
AI Teammate:
Google 推出了 AI Teammate,将 Gemini 的功能包装成一个 AI 员工,帮助用户在工作中整理信息、提取关键信息并进行智能反馈。AI Teammate 在办公套件中的应用尤为突出,如在 Gmail 中生成会议纪要、在邮件中提取表格文件等。
Notebook LM:
Google 进一步发展了去年推出的 Notebook LM,作为教育应用的探索项目。它能模拟教师身份,讲述物理课程,并在用户提问时提供准确的回答,使用户更好地掌握知识。
DeepMind 的项目:
DeepMind 创始人哈萨比斯首次在 Google I/O 上亮相,介绍了新项目 Project Astra。这个项目旨在探索通用人工智能如何为我们的日常生活提供帮助。通过演示视频展示了 Astra 的功能,展示了其强大的通用语言与环境理解能力。
新一代 TPU 硬件 Trilium:
Google 发布了代号为 Trilium 的第六代 TPU 硬件,计算能力提升 4.7 倍,预计将在 2024 年年底面向用户推出。Trilium 的发布为 Google AI 技术的发展提供了更强大的硬件支持。
Android 15 中的 AI 功能更新:
Android 15 也加入了多项 AI 功能更新,尤其是 Gemini 在 Android 中的更深度整合,使其能够更好地应用于用户的日常生活中。
今年的 Google I/O 大会在人工智能领域展示了 Google 在 Gemini、AI Teammate、Notebook LM、DeepMind 项目、新一代 TPU 硬件和 Android 15 中的 AI 功能更新等方面的重要进展,显示了 Google 在 AI 领域的持续领先地位和创新能力。
谷歌I/O 2024大会的召开,标志着谷歌在AI领域的又一次重大突破。凭借着Gemini大模型的强大实力,谷歌在AI搜索、操作系统、视频生成等多个领域都取得了领先地位。
然而,在AI大模型的竞争中,谷歌并非孤军奋战。OpenAI、微软等公司也在不断加大投入,研发各自的AI大模型。未来的AI大模型战火将更加激烈,谁将最终胜出,还有待观察。