当前位置:首页|资讯|谷歌|OpenAI|大语言模型

谷歌 I/O 2024大会简报:谷歌强势回归,可惜被OpenAI抢了头条

作者:视角先锋队发布时间:2024-05-15

谷歌发布了一系列新产品,包括集成了AI的新产品、全新的语言模型以及许多不属于大型语言模型(LLM)的新功能

以下是我觉得特别有意思的一些亮点:

语言方面

优点:

  • 推出新的Gemini 1.5 Flash!成本仅为GPT-4o的7%(专业版成本的1/10)
  • Gemma 2:更多开源AI模型!
  • PaliGemma:新的视觉语言模型
  • Gemini Nano:设备端运行
  • Gemini 1.5 pro 上下文扩展到了惊人的2M token

缺点:

  • 没有提供基准测试数据?
视觉方面

优点:

  • Imagen 3:创建更加逼真的图像
  • Music Audio Studio:与油管合作
  • 推出视频生成模型Veo(对标OpenAI Sora):1分钟1080p,waitlist地址:https://aitestkitchen.withgoogle.com/zh/tools/video-fx

缺点:

  • 还是没有提供基准测试数据?
助理和代理方面

优点:

  • 推出Project Astra项目,类似OpenAI的GPT4o的语音视觉人机交互方式,聚焦未来的AI助理,演示令人惊叹,可以在智能眼镜上运行,出色的视觉语言技能,非常酷的应用。可惜OpenAI抢先一步发了,上不了头条

缺点:

  • 语音实时交互看起来比GPT-4o慢?不确定……
硬件方面

优点:

  • 发布TPUv6 ,计算性能提高4.7倍,2024年底推出
  • 液体冷却能力超过1千兆瓦(不确定其重要性)
  • B100将于2025年初推出

缺点:

  • 谷歌似乎总是在GPU部署上出问题……
产品方面

优点:

  • AI深度整合到现有产品中(搜索、Gmail、照片、工作空间)
  • 我非常喜欢生成搜索,尤其是在旅行规划方面
  • 照片搜索看起来看起来很有意思,可以搜索照片中的信息

缺点:

  • 不明确这些功能的费用是多少?
总结

优点:

  • 谷歌重新调整方向,稳步前进。发布了许多令人兴奋的技术公告,并进行了深度产品整合。我对谷歌非常看好——他们有足够的计算能力和产品界面来收集数据

缺点:

  • 对开发者的关注不多,注册过程仍然比较令人难受

OpenAI抢在谷歌I/O大会之前发布更新,这让谷歌I/O大会显得黯淡无光。

OpenAI在基准测试中似乎仍占优势,而谷歌没有推出具有更好数据的新模型让我有些失望


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1