谷歌推出史上最强大AI模型Gemini，挑战OpenAI旗舰模型GPT-4o

作者：金融界发布时间：2024-05-15

在年度Google I/O开发者大会上，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新。此举标志着谷歌在人工智能领域的又一重要突破，同时也是对OpenAI新发布的旗舰模型GPT-4o的有力回应。

Pichai表示，谷歌的全部工作重心都已转向Gemini，他们希望通过这个强大的AI模型，让每个人都能从中受益。为了实现这一目标，谷歌率先将AI技术应用于搜索领域，推出了全新的AI搜索功能。

在美国，AI生成摘要的功能——AI Overviews，已率先上线谷歌搜索，并计划在全球范围内推广。该功能利用Gemini的多步推理能力，能够代替用户进行研究，提供更精准的搜索结果。例如，通过汇总用户一整天的膳食和食谱，Gemini可以帮助规划饮食，甚至推荐购买所需餐食的地方。

此外，借助Gemini的力量，谷歌搜索的结果页面也将发生变革。用户可以获取更加个性化的推荐，如寻找有现场音乐的餐厅时，Gemini可以根据季节等因素提供智能推荐。

在谷歌相册Google Photos中，Gemini同样展示了其强大的搜索能力。新推出的Ask Photos with Gemini功能允许用户通过上下文搜索找到特定的照片，如车牌照号等。同时，谷歌的云计算生产力和协作平台Google Workspace也将与Gemini紧密结合，提升工作效率。

值得一提的是，Gemini还可用于搜索手机内容，如查找收据或安排取货时间等。对于计划旅行的用户来说，Gemini还能搜索有趣的活动，使旅行更加丰富多彩。

在AI模型的更新方面，谷歌推出了Gemini 1.5 Pro，拥有全球消费类聊天机器人中最长的上下文窗口，起始窗口就高达100万个token。此外，新模型还支持超过35种语言，并向150多个国家和地区的Gemini Advanced订阅者提供。

除了文本交互外，谷歌还计划在今年夏季扩展Gemini的多模态功能，包括增加语音进行深入双向对话的能力。这一功能被称为Live，它将使用户能够与Gemini进行更自然的交流。

与此同时，谷歌还宣布了将在Gemini Advanced中添加新的旅行规划功能和数据分析功能。这些新功能将进一步提升Gemini的实用性，使其能够更好地满足用户的个性化需求。

此外，谷歌还推出了名为Gem的Gemini定制版本。用户可以根据自己的需要创建个性化的Gemini，如健身伙伴、主厨帮手等。这将为用户带来更加个性化的AI体验。

在移动端方面，谷歌推出了新的多模态AI项目Project Astra，它可以为用户解释智能手机拍到的东西。同时，谷歌还计划为安卓端侧的Gemini增加多模态功能，使手机能够通过多种方式理解世界。

总的来说，谷歌通过这一系列更新和升级，进一步巩固了其在搜索和AI领域的领先地位。同时，这些创新举措也展示了谷歌对未来科技的深刻洞察和坚定投入。

来源：金融界

推荐体验