谷歌发布了一系列新产品,包括集成了AI的新产品、全新的语言模型以及许多不属于大型语言模型(LLM)的新功能
以下是我觉得特别有意思的一些亮点:
语言方面
优点:
- 推出新的Gemini 1.5 Flash!成本仅为GPT-4o的7%(专业版成本的1/10)
- Gemma 2:更多开源AI模型!
- PaliGemma:新的视觉语言模型
- Gemini Nano:设备端运行
- Gemini 1.5 pro 上下文扩展到了惊人的2M token
缺点:
视觉方面
优点:
- Imagen 3:创建更加逼真的图像
- Music Audio Studio:与油管合作
- 推出视频生成模型Veo(对标OpenAI Sora):1分钟1080p,waitlist地址:https://aitestkitchen.withgoogle.com/zh/tools/video-fx
缺点:
助理和代理方面
优点:
- 推出Project Astra项目,类似OpenAI的GPT4o的语音视觉人机交互方式,聚焦未来的AI助理,演示令人惊叹,可以在智能眼镜上运行,出色的视觉语言技能,非常酷的应用。可惜OpenAI抢先一步发了,上不了头条
缺点:
硬件方面
优点:
- 发布TPUv6 ,计算性能提高4.7倍,2024年底推出
- 液体冷却能力超过1千兆瓦(不确定其重要性)
- B100将于2025年初推出
缺点:
产品方面
优点:
- AI深度整合到现有产品中(搜索、Gmail、照片、工作空间)
- 我非常喜欢生成搜索,尤其是在旅行规划方面
- 照片搜索看起来看起来很有意思,可以搜索照片中的信息
缺点:
总结
优点:
- 谷歌重新调整方向,稳步前进。发布了许多令人兴奋的技术公告,并进行了深度产品整合。我对谷歌非常看好——他们有足够的计算能力和产品界面来收集数据
缺点:
OpenAI抢在谷歌I/O大会之前发布更新,这让谷歌I/O大会显得黯淡无光。
OpenAI在基准测试中似乎仍占优势,而谷歌没有推出具有更好数据的新模型让我有些失望