大语言模型,谷歌还想赢。
来源|AI蓝媒汇
ID:lanmeih001
作者|伊柒
编辑|魏晓
“ Seven years into our journey as an AI-first company, we’re at an exciting inflection point (作为一家以人工智能为先的公司,经历七年的旅程后,我们正处于一个令人兴奋的转折点).”
谷歌首席执行官Sundar Pichai的这句开场白,或许代表了谷歌下一段AI旅程的原点。
北京时间5月11日凌晨,加州山景城海岸线圆形剧场举办的2023谷歌I/O大会上, “AI”这个词在两小时内被提了超过40次,包括不仅限于AI大语言模型、搜索引擎、谷歌地图、相册……很多很多。
正如Sundar Pichai所说,AI正在经历非常忙碌的一年。
同样忙碌的还有谷歌。
作为一家曾在搜索引擎及AI赛道领先许久的科技巨头,谷歌在2022年底OpenAI发布ChatGPT后屡遭唱衰,ChatGPT也被业界认为是“几十年来谷歌最重大的威胁”。
GPT4接入微软Bing后,人们发现AI第一个颠覆的便是谷歌引以为傲的搜索引擎,公司内部发出“红色警报”的消息流传甚广。尽管Sundar Pichai在接受访时否认了这个说法,称他从未在公司内部发布过“红色警报”,但他也承认, 谷歌确实需要“尝试新的技术”。
2023年未半,对标ChatGPT的Bard、PaLM 2大模型相继问世, I/O大会上更是官宣AI技术将接入包括谷歌搜索引擎在内的全线产品。
押注大语言模型,剑指微软和OpenAI,2023年的谷歌,比以往任何时候都更着急。
对标ChatGPT
4月份,谷歌微软两家科技巨头前后脚发布了最新一季财报。
知名科技分析师、深水资产管理公司执行合伙人Gene Munster在推特上比较了两家公司。在他看来,当人工智能的话题出现时,“感觉谷歌的管理层在喝茶,而微软在喝红牛。”
而在这一次的I/O大会之前,谷师傅应该也喝了两罐红牛,很是激动。
“PaLM 2 is a state-of-the-art language model (PaLM 2是目前最先进的大语言模型)…… ”
作为谷歌最新一代大语言模型,未来一段时间应该也是公司与ChatGPT角力的匕首之尖,谷歌高层在会上用了相当长的篇幅介绍PaLM 2的各项功能、数据、未来预期。
甚至,直接用了“最先进”一词来强调PaLM 2的能力。
根据官方发布的数据,PaLM 2的功能包括多语种生成、推理和编程等等。
多语种:PaLM 2在多语种文本方面进行了严格训练,模型包含了100多种语言,大大提高了它理解、生成和翻译各种语言的细微文本(包括习语、诗歌和谜语)的能力,这曾是行业内很难解决的问题。PaLM 2还通过了“精通”级别的高级语言能力考试。
推理:PaLM 2的广泛数据集包括包含了数学表达式的科学论文和网页。因此,它的逻辑、常识推理和数学方面的能力相较于之前都有所改进。
编码:PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长主流的编程语言,如Python和Java,但也可以用Prolog,Fortran和Verilog等语言生成专门的代码 。
仅从文字描述的功能来看,PaLM 2或许难言惊喜:这些功能在ChatGPT身上早已实现,谷歌现在做的也只是看齐和追赶。
但另一份同样来自官方的报告,则让部分人眼前一亮:相关测试数据显示,对于具有思维链prompt(提示)或自洽性的MATH、GSM8K和MGSM基准评估, PaLM 2的部分结果已经做到了超越GPT-4。
在发布会上,尽管谷歌没有直接说他们的产品“超越了GPT-4”,但在介绍PaLM 2的时候,谷歌DeepMind副总裁Zoubin Ghahramani说了这样一句话:
“PaLM 2不只是功能更强大,它比以前的模型们都更快速、高效。”
至于这个“以前的模型”说的是第一代PaLM,还是暗示包括ChatGPT在内所有已发布的大语言模型,不得而知。
与此同时,曾在与ChatGPT横向比较中状况百出的谷歌Bard大语言模型,也在迁移到PaLM 2内部后完善了功能—— 谷歌现场演示了利用Bard进行图像理解,和与谷歌地图配合进行分析两项功能。这些功能目前都并未在GPT-4接入的Bing当中实现。
按照计划,Bard正在取消过去的“等待名单”,未来将在180个国家和地区提供英语版本的应用。
显然,谷歌的目标,并不只是追赶。
“AI全家桶”
在介绍完PaLM 2功能之后,谷歌高层表示,PaLM 2将为谷歌的25种产品和功能提供AI技术支持。
而这,只是谷歌AI全家桶的一部分。
以PaLM 2作为底层技术支持,谷歌计划将全线产品接入到自研的AI生态当中。
首先是办公——谷歌在办公领域的AI项目名为Duet AI,一个类似于微软365 Copilot的产品、内嵌在包括Gmail、Google Docs、Google Sheets在内各种办公软件中的AI助手。
根据现场演示的功能,除了已被外界熟知的在编程提供帮助外,Duet AI已经能够根据用户的表述生成内容对邮件进行补充,制作表格及PPT文档,或者利用AI作图技术直接将PPT内容生成为图片素材。
此外,与GPT-4接入微软Bing类似,谷歌也在发布会上宣布, “生成式AI”将接入自家搜索引擎。
现场演示,谷歌搜索被提问“对于有3岁以下孩子和狗的家庭,布莱斯峡谷或拱门国家公园哪个更好”后,页面给出的回答不再只是链接,而是在链接的最上方给出了一段文字回答,简单比较了提问的两个地点。
在搜索自行车购买建议时,给出了整理好的对照列表。
根据官方提供的信息,谷歌的生成式AI搜索将会在未来应用到手机和PC端,但目前还并未像Bing和GPT-4一样能够公开使用。用户需要在支持的国家和地区先注册SGE( Search Generative Experience),然后和几个月前的Bing一样,等通知。
手机端,谷歌同样没落下:安卓系统副总裁Sameer Samat提到了包括AI作曲、制图、垃圾信息隔离等各项功能。并且,在之前介绍大语言模型PaLM 2时,谷歌方面曾提及“PaLM 2有不同规格的四个版本”,使其更易于针对各种特殊情况进行本地部署。 最轻量级的“Gecko”模型可以在手机移动设备上运行,速度快,无需联网。
用公司高层的话说,谷歌“正在重新构想所有核心产品”。一场没有暂停键的角力,自此展开。
今日话题
谷歌VS微软,你看好谁?
来评论区我们聊聊~
往期经典回顾