出品 | 搜狐科技
作者 | 梁昌均
拉响红色警报、匆忙应对微软持续进攻的谷歌,终于迎来绝地反击,打响和微软的全面AI之战。
在今日凌晨举办的谷歌开发者大会上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)正式发布全新大语言模型PaLM 2,称其在部分任务上已超过GPT-4,并已用在旗下超过25款产品和应用上。
此前演示翻车、对标ChatGPT的AI聊天机器人Bard基于PaLM 2迎来更多功能升级,同时在更多地区开放,并有望支持中文等更多语言,谷歌还像微软一样推出新的AI办公助手。
此外,保持谨慎的谷歌终于在搜索上加入对话功能,排队通道已经开放。同时谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务。
如果说此前微软和谷歌的攻防仅仅是拉开了这两家科技巨头AI大战的序幕,如今谷歌发布全新的AI技术和产品则吹响了全面大战的号角。两家在搜索、云计算等领域的对手,再次迎来新的制高点争夺战。
PaLM 2部分能力超GPT-4,Bard将支持中文
GPT-4竞品大语言模型PaLM2是谷歌此次开发者大会的重头戏。它是谷歌全面AI化的核心引擎,谷歌CEO皮查伊亲自对PaLM2进行了介绍。
皮查伊称,PaLM 2接受了100多种语言的训练,因此它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。
据介绍,训练PaLM 2的海量论文和网页中包含了大量数学和科学数据集,比如非常多的数学表达式,这使得PaLM 2能轻松解决数学问题,甚至是制作图表。
同时,在编程方面,PaLM 2可以支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。总体而言,相比去年的PaLM模型,PaLM 2 在多语言处理、推理和编码能力上有了很大的提升。
根据官方发的基准测试,对于具有思维链prompt(提示)或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。
值得注意的,PaLM 2模型还提供了不同规模的四个版本,从小到大依次为“壁虎”(Gecko)、“水獭”(Otter)、“野牛”(Bison)、“独角兽”(Unicorn),分别对应不同算力需求的设备;其中轻量级的Gecko模型可以在手机等移动设备上运行,不联网也能运行出色的交互式应用程序。
不过,谷歌并没有透露PaLM 2具体的参数规模,只提到PaLM 2利用谷歌最新的TPU算力基础设施提升了训练速度。由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务效率更高,同时整体表现更好。
基于PaLM 2,谷歌还推出了一些专业领域大模型。谷歌的健康团队打造了Med-PaLM 2,它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。
另一个专业大模型是面向网络安全维护的Sec-PaLM 2,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。
PaLM 2对标的是GPT-4,而对标ChatGPT的Bard在此前匆忙推出演示翻车后,此次也基于PaLM 2迎来升级。Bard将全面接入PaLM 2,所以它在编程和推理方面的能力会有很大的提升,代码生成、调试和解释都更加专业。
应广大开发者要求,Bard还加入了一键导入功能,程序员可以将Bard生成的代码直接导出到Colab。除了代码,用Bard生成的任何内容,如电子邮件草稿、表格等也都可以直接拖到Gmail、Docs和Sheets中谷歌办公产品中,形成不同应用之间的联动。
Bard目前的内容生成也可以支持图片形式,当然也可以输入图片,比如上传猫或狗的照片,它就能编出好玩的故事,这个功能由Google Lens(一款能让机器学会看图说话的AI应用)提供支持。此前推出的GPT-4也具备看图说话的能力,可以说多模态输入或输出已经成为大模型的趋势。
此外,谷歌还宣布Bard取消排队试用,在全球180+国家和地区进行全面开放。在语言能力上,除英文之外,Bard也新增直接用日语和韩语对话的功能。谷歌表示,很快就会新增到40种语言版本,其中也会包括中文,同时Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。
全线产品全面AI化,谷歌微软迎来决战时刻
跟微软全家桶产品全面接入GPT一样,谷歌也在此次开发者大会上宣布将全线产品都接入PaLM 2模型。目前,谷歌包括Bard、搜索等在内共有超过25个产品和应用正在使用PaLM 2的能力。
一个具体的表现形式,就是Duet AI,是一个能够内嵌在各种办公软件中的AI助手,类似于微软365的Copilot功能。
谷歌在发布会现场展示了Duet AI在Gmail、Google Docs、Google Sheets等办公应用上的能力,包括自动分析优化邮件或文档内容并提取重点,根据提示生成图片素材,一键生成表格或PPT,以及帮助快速调整合适的布局等。
同样,Duet AI也能提供编程帮助。基于谷歌云,它能实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。
在相较微软更具优势的移动端(包括智能手机、平板电脑及操作系统等),谷歌也开始发力AI。下一代移动操作系统Android 14就将推出一些新能力,包括基于AI生成模型的Magic Compose,其将在谷歌的默认短信应用Message中推出测试版。
这一功能可以让用户在回短信的时候根据聊天内容获得大量提示,并学习用户的说话方式或模仿其他风格回信。谷歌还将使用生成式AI制作独一无二的手机壁纸,和AI画图一样使用语言提示完成。
在外界更为关注的搜索方面,谷歌正式推出由PaLM 2驱动的全新搜索引擎,谷歌搜索开启AI对话的能力。根据谷歌的演示来看,谷歌搜索对话生成的内容都有具体的依据链接供查看,并可以显示来自不同网站的链接,用户也可以对它的回答进行进一步对话式的提问。
比如用新的谷歌搜索进行购物,它会详细说明购买时应注意的事项,并提供多个购买指南的链接和购物的链接,每个旁边还有AI生成的摘要。这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。
谷歌似乎也想好了新的搜索引擎的商业模式,称更新后的AI搜索界面照样会植入广告,但它只会在专用广告位中出现,不会混进用户的搜索结果中。谷歌还宣布推出搜索实验室,以便让用户和谷歌的想法进行碰撞。
不过,谷歌搜索的新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。而就在上周,微软宣布新版Bing和浏览器全面开放,新 Bing日活跃用户已超过1亿,累计进行了超过5亿次聊天。显然,谷歌搜索在进度方面已远远落后于微软。
在云服务领域,谷歌也不忘新动作。谷歌为自家云端机器学习平台Vertex AI上新了三款大模型,包括帮助程序员写代码的Codey(text-to-code),可以生成高质量图像的Imagen(text-to-image)和用于沟通协作的Chirp(speech-to-text)。
Vertex AI上现在还能使用文本和图像的嵌入式API,它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。
此外,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和英伟达 H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。谷歌将以多种方式提供A3:客户可以自己运行,也可以将其作为托管服务运行。
除自身产品,谷歌还多发布多个AI新产品,与 Adobe合作发布新应用Adobe Firefly,可以使用AI模型直接生成图像;发布全新的基于AI的笔记研究工具Project Tailwind,用户可以向AI提问来帮助自己提高学习水平,并推出AI工具MusicLM,可以将文本描述转化为音乐。
在AI方面有长期积累和布局的谷歌,在过去的一段时间里,似乎总会缺乏Amazing的时刻。如今,它终于抛却谨慎和包袱,开始完全拥抱趋势。谷歌股价最近交易日收涨超过4%,一定程度上也验证了市场对谷歌迈出大胆一步的认可。
可以说,随着微软、谷歌纷纷先后将旗下全线产品都接入大模型等AI技术,这两家巨头在搜索、办公、云服务等领域也将迎来全面决战时刻。枪声一响,就看谁跑得更快更稳。