划重点:
- 1
Alphabet周二在Google I/O开发者大会中推出Gemini系列人工智能模型的新成员。
- 2
Alphabet发布Gemini 1.5 Pro,上下文窗口增加至200万tokens。
- 3
在Google I/O开发者大会举行之前,OpenAI周一刚发布了最新的AI模型GPT-4o。
腾讯科技讯 5月15日消息,据国外媒体报道,Alphabet 2024年I/O开发者大会于美国东部时间2024年5月14日13时(北京时间5月15日1时)在加利福尼亚州山景城海岸线露天剧场正式举行。借助此次活动,Alphabet向外界展示了该公司最小和最有效的人工智能模型。
在周二的活动中,Alphabet推出了Gemini系列人工智能模型的新成员Gemini 1.5 Flash。该模型速度更快,体积更小,部署更加灵活,并支持多模态。谷歌DeepMind联合创始人、首席执行官戴密斯·哈萨比斯(Demis Hassabis)表示:“我们从开发人员那里听说,他们希望使用响应速度更快、更具成本效益的模型。”与功能更强大的版本一样,Gemini 1.5 Flash可以接收大量数据,同时针对聊天应用、视频和图像字幕进行了优化。
在Alphabet召开2024年I/O开发者大会之际,科技公司正越来越多地把产品开发和推广的重点转向生成式人工智能领域。这对Alphabet子公司谷歌尤为重要,因为与传统的在线搜索相比,新工具为消费者提供了更先进、更具创意的在线信息获取方式。OpenAI周一推出了新人工智能模型GPT-4o和桌面版ChatGPT,以及新的用户界面。该公司表示,GPT-4o的响应速度是GPT-4 Turbo的两倍,但成本只有后者的一半。
Alphabet还宣布了对能够处理大量数据的Gemini Pro 1.5模型的升级,把上下文窗口(人工智能模型可理解的信息量)从当前100万tokens增加到200万。这意味着当在一个提示中给出数千页文本或一个多小时的视频时,Gemini Pro 1.5能够回答用户的问题。
据负责Gemini项目的谷歌副总裁透露,Gemini Pro 1.5模型一次性能够理解长达1500页的多个大型文件,或者是对100封电子邮件进行总结。此外,Gemini 1.5 Pro将很快能够处理时长为一小时的视频内容,或超过3万行的代码库。他表示:“面对海量的文件,用户能够很快获取到核心内容,比如弄清楚租赁协议中宠物政策的细节,或者对多篇长篇研究论文的关键论点进行比较。”
OpenAI本周宣布的最新升级,为50种不同语言的ChatGPT带来了更高的质量和响应速度。该公司还表示,将通过OpenAI的应用编程接口(API)提供,允许开发人员立即开始使用新模型构建应用。
Alphabet表示,Gemini 1.5 Pro有35种语言,上下文窗口达到200万个tokens。该公司高管表示,新模型提高了局部推理、规划和图像理解能力。Alphabet首席执行官桑德尔·皮查伊称:“Gemini 1.5 Pro提供了迄今为止所有基础模型中最长的上下文窗口。”
Alphabet还表示,Gemini 1.5 Pro首先将在内测实验室Workspace Labs进行测试;Gemini 1.5 Flash将用于测试和在机器学习平台Vertex AI中使用,Vertex AI允许开发人员训练和部署人工智能应用。(编译/无忌)