5月10日周三举行的谷歌年度开发者大会Google I/O 2023上,谷歌亮出了人工智能(AI)领域开发的最新成果。
和此前媒体曝光的消息一致,本次谷歌正式发布新的通用大语言模型PaLM 2。PaLM 2是驱动AI机器人Bard的模型的升级版,可以生成多种文本回应用户。谷歌称,它可以使用100种语言,擅长数学、软件开发、语言翻译推理和自然语言生成。
同时,谷歌发布,旗下产品广泛应用AI技术的功能,从文档等各种协作工具、到电邮、搜索、云等各种服务一网打尽,让新型大模型支持的AI功能在各种产品中全面结合。
谷歌还发布了两款手机,其中包括首次推出的可折叠手机Pixel Fold,同时开始预售新款平板电脑Pixel。谷歌确认,新版智能手表Wear OS 4将在今年晚些时候面世,同时会有一批Wear OS配套App和功能出炉。
约20种谷歌产品目前在用PaLM 2 PaLM 2有版本可用于移动端
谷歌CEO Sundar Pichai开场就指出,过去一年,AI成为热议话题,有了生成式AI,我们将迈出下一步。他说,要让AI对人人都有帮助,通过AI增加知识,提升学习能力、创造力、生产力,让他人能创新,负责任地创造和配置。
在介绍新的大语言模型时,Pichai说,PaLM 2在医学等专业领域具有一些优势。它可以回答专家级别的体检问题。
谷歌AI研究实验室DeepMind的副总裁Zoubin Ghahramani称PaLM2“比我们以前最先进的语言模型还好”,PaLM 2使用谷歌定制的AI芯片,比初版PaLM的运行效率更高。PaLM 2能使用Fortran等20多种编程语言,它还可以用100多种口头语言。
Ghahramani透露,现在约有20种谷歌的产品使用PaLM 2,轻量级的PaLM 2版本可以在移动设备上运行。
Ghahramani并未具体说明用于训练PaLM的来源,以及该模型使用的参数数量。
Pichai认为,AI 生成图像的真实性在未来可能会成为一个问题。 Pichai表示,通过添加图像元数据,可以更轻松地识别合成图像。谷歌有另一个AI 模型 Gemini,它可以识别“合成生成的内容”,即由 AI 创建的文本、图像和镜头。Gemini 和其他AI模型将检查水印、即内容中集成的元数据,以及其他技术,告诉用户哪些是原始未变的,哪些是AI创造的。
PaLM 2驱动的升级版Bard 向180个国家地区开放 将可用40种语言回复
谷歌宣布,升级AI聊天机器人Bard,让它改由PaLM 2驱动,可以提供更高明的回复,从本周三起,让约180个国家地区的用户都可以开放申请使用Bard。
谷歌称,Bard的编程能力已经有所改善,Bard现在接入多种编程工具。Bard学习了C++、Go、Python等20多种编程语言,以及和谷歌表格(Google Sheets)的函数。
谷歌副总裁 Sissie Hsiao说,Bard拥有一种让双眼观看更舒适的深色主题,还称用户可以将Bard回复导出到Gmail、谷歌文档、谷歌的Colab交互式编码工具和第三方协作编程App。Bard未来将适时同音乐流媒体Spotify、零售巨头沃尔玛、房产平台Redfin、送餐服务Uber Eats、旅游网站Tripadvisor和招聘网站ZipRecruiter融合。
谷歌产品主管、Bard的负责人Jack Krawczyk称,Bard将能够用英语、日语和韩语回复,谷歌将很快让Bard适用的语言达到40种。
Bard将很快在回复中包含图片,在接下来的几个月里,谷歌将使通过 Google Lens 工具,让Bard更容易回应用户的图片提示。比如,用户可以用智能手机指着满抽屉的艺术品和手工艺品工具和配件,问Bard它们可以用来做什么。
Krawczyk 说,未来Bard能将谷歌地图、文档、表格和 Gmail的信息带入对话中。Bard 还将能在 Adobe等第三方工具的帮助下回复用户。他提到Adobe的生成式 AI服务Firefly,说它可以根据文字描述创建图像。
Gmail、谷歌地图和相册的AI功能
Pichai介绍,AI已经结合到谷歌的一些产品中,谷歌还将融入新的产品。其中一种是,Gmail将利用生成式AI推出实现“帮我写”(Help Me Write)的功能,帮助用户写邮件。
Pichai展示了一个例子,通过写一封信,获得航空公司的全额退款。谷歌有些设置能让生成的文本更长或更短,并且可以用之前的消息作为上下文,帮助AI编写内容。他说:“只要输入你想要的提示词,点击创建,就会出现一个完整的草稿。”
谷歌地图将提供名为“沉浸式视图”(Immersive View)的AI工具。该工具将获取空气质量和天气的信息,为谷歌地图用户选出一条路线,并将路线可视化。
Pichai展示了一条位于曼哈顿的自行车骑行路线。用户可以看到,走这条路线,沿着西区高速公路骑车会有什么情景,其中有AI支持的交通、天气和路线本身的渲染图。从演示中可以看到具备了flyover功能,可以帮助将出行信息叠加到用户界面。
Pichai说,沉浸式视图将在未来几个月内推广到十几个大城市。
谷歌相册将推出名为“神奇编辑”(Magic Editor)的功能,用生成式AI 帮助用户重新构建照片,可以选择编辑照片的任何一部分,无论是画面的主角、天空还是背景,都可以编辑,可以抓取可以移除。
比如用户主要想拍的是瀑布,可以把瀑布边的人挪开些,拍照时人忘了取下背带,可以把拍到的背带抹去,可以把拍出的天空调得更明亮。
神奇编辑功能将于今年晚些时候在谷歌相册上线。
Workspace的Duet AI AI搜索功能Converse
谷歌称,谷歌的协作与生产力工具Workspace将很快能让用户借助AI生成完整的文档,并填写电子表格。这种AI服务名为Duet AI,将在今年晚些时候面向订阅者推出。
Duet AI可以让用户在文档、表格和幻灯片中融入AI服务。比如用户可以要求AI帮助撰写简历、整理企业图表或者为幻灯片生成图像,可以帮用户写文章和销售宣传材料,将它们放在谷歌文档中给所有人共享。谷歌幻灯片可以在App内生成AI图像。
谷歌为搜索服务推出了名为Converse的生成式AI功能。过去,用户想知道一个问题的回答,会在谷歌得到多个搜索结果,得自己综合这些结果。Converse可以为用户合成式的搜索结果。具体来说,它能提供一种“快照”,其中包括一些搜索结果文本或图片的生成式AI内容块,在它的下方是相关的链接。
谷歌称,Converse的搜索结果里会融入广告。和Workspace的一些AI功能一样,Converse 将提供一种“对话模式”,用户可以在其中“提出”后续问题。
虽然谷歌没有透露具体何时上线Converse、哪些地区的用户可用,但这种功能属于搜索生成体验 (SGE)的部分成果。谷歌称,Labs的用户可以在未来几周内使用,可以通过点击谷歌App或桌面版Chrome中的Labs图标访问。
谷歌云推出Duet AI服务和A3超级计算机虚拟机
谷歌云也有自己的Duet AI服务。
谷歌云的CEO Thomas Kurian称,所有谷歌的云服务合作伙伴都可以付费使用谷歌的AI模型,以及算力。
今年夏季,连锁汉堡餐厅Wendy’s将运用谷歌的技术,在俄亥俄州的一家门店接受用户订单,避免用户排长队。谷歌强调,经过其调整的大语言模型可以理解Wendy’s的产品名,比如简称JBC的产品是一种培根芝士汉堡。
谷歌推出了一个名为Tailwind的项目。它可以记录开发者的笔记,并可以在云端网盘中整理不同的笔记。它还能建一个学习指南,提取笔记中的关键概念。用户您可以要求Tailwind 整理信息,或根据所做的笔记向它提问。 它也显示引用内容。
谷歌云还宣布,推出A3超级计算机虚拟机,旨在为语言模型提供优异的训练性能。这些虚拟机将搭载英伟达H100 GPU、第四代英特尔Xeon可扩展处理器,与谷歌专门的数据中心结合,可提供高达26 exaFlops 的算力,将有助于减少训练更大模型的时间和成本。
升级安卓系统查找设备功能 安卓手机可用生成式AI定制壁纸
谷歌将在今年夏季为安卓系统用户升级查找、锁定或清空设备的功能“找我的设备”(Find My Device)。这种新功能将利用安卓设备的网络,同多种生态系统的设备合作,帮助用户寻找设备,和苹果的FindMy功能依赖其他苹果设备定位遗失设备类似。
本月初,谷歌和苹果宣布,将联手为用户提供受到非必要跟踪的警报,作为重视隐私和安全的部分工作。谷歌将在今年夏天晚些时候上线这一服务,让用户知道,是否被未知的追踪方式跟踪。
此外,安卓手机将很快能依靠谷歌的生成式AI技术,根据用户的提示词,生成可定制的壁纸。该功能将在今年秋季上线。
谷歌发布新手机Pixel 7a、首款可折叠手机Pixel Fold 平板电脑Pixel
在硬件方面,谷歌发布了新一代安卓手机Pixel 7a,售价499美元,搭载谷歌自研的Tensor G2芯片,运行内存8GB,比Pixel 7和Pixel 7 Pro更平价。
谷歌还发布了首款可折叠手机Pixel Fold,售价1799美元,也搭载Tensor G2芯片,全部展开时手机显示屏为7.6英寸大小,本周三开始接受预订,下月发货。
谷歌宣布从本周三起,新版平板电脑Pixel接受预订,同样配置Tensor G2芯片,起售价499美元,有128GB和256GB两种内存的版本可选。