估计大家已经被各种 AI 应用冲击得趣味疲劳了吧——无论是忽然声名赫赫的 OpenAI,还是每天被花样繁多的生成式 AI 应用搞得眼花缭乱,更不用提一下子各种“GPT”大乱斗……
在一顿尝鲜和试用之后,极尽各种调戏之外,忽然觉得怅然若失:你说它没用吧,确实能时不时地给你来上些惊喜;你说它多有用吧,频繁地胡说八道、繁琐地调教训练,最烦的还是在一条任务中不停地跳转各种页面和应用……
简洁又沉浸的操作、完整全面的场景生态,以及一个言而有信对自己负责的表现,是人们对生成式 AI 近在眼前的期待,就像是期望一个青春期的少年快快成熟长大。
我们去现场啦丨作者提供
在 5 月 10 日的 Google I/O 大会(Google 最重要的年度开发者大会)上,看上去更靠谱的 AI 来了: PaLM 2 模型发布,Bard 开放自由使用,并接入 Google“全家桶”应用,新安卓系统整合进更多的 AI 实用功能……
虽说 AI 靠谱 ,但发布会暖场看起来是蛮不正经的丨作者提供
虽迟但到,被 OpenAI 以及各种 GPT 拉进“AI 新时代”之后,直到今天很多人才想起一家多年前就保持“AI First(AI 为先)”的公司。
Google I/O 现场丨作者提供
来点真格的一条龙服务!
Bard(你可以简单理解为 Google 的 ChatGPT)发布两个月了, 这次它迁移到了 PaLM 2 模型之上——这也是今天 Google I/O 大会的发布重点。
相比上一代模型,PaLM 2 拥有更强的推理和编程能力,而且进行了超过 100 种语言的文本训练。
大会现场展示了一段用 PaLM 2 生成代码,然后自动添加韩语批注|Google
大会现场就展示了一段用 PaLM 2 生成代码,然后自动添加韩语批注,然后又自动优化修改的全自动流程。这对于说不同母语的程序员之间协作起来,很友好。
PaLM 2 有大小轻重不同的四种版本可选,分别被命名为:Gecko(壁虎)、Otter(水獭)、Bison(野牛),和 Unicorn(独角兽)。
PaLM 2 四个量级版本丨Google
目前有两个已经精调训练好的专家版本:专注安全的 Sec-PaLM 和专注医疗健康的 Med-PaLM 2——这也是目前对于 AI 人们最期待的,也最重要的两个应用领域。
据称,Bard 将很快支持 40 种语言(包括中国和中文)|Google
迁移到它之上的 Bard 首先是开放了免费自由访问(之前需要排队),支持超过 180 个国家和地区,按计划将很快支持 40 种语言(包括中国和中文)。
新公布的 Bard 功能中包括了“给图”和“读图”:比如你问它去某某城市哪里好玩, 它的回答就也会包括各个景点名胜的照片,甚至地图标记,你也可以让 它把这些景点生成旅行计划表格;再比如你发给他一张图,让它给你编一句搞笑的描述或台词,也没问题。
Bard 可导出丨Google
最实用的是, Bard 在每个对话框下面增添了一个导出按钮(目前可以选择内容导出到 Google 邮箱和 Google 文档应用,以后还将接入图表、网盘、地图等等)——想想自从“用 AI 武装了自己”,是不是最烦的就是频繁地在各种页面和应用之间来回切换?这下好了,胡编报告、自动写作业、发邮件怼老板……一气呵成、无缝连接。
文生图功能演示丨Google
大会上还展示了未来将接入 Bard 的第三方应用,比如前一段火热的 AI 绘画工具 Adobe Firefly:对 Bard 说“绘制一张斗志昂扬的老板鼓励大家疯狂加班的插画海报”,几秒之后就大功告成(对于生成内容会同时遵守 Google 和 Adobe 双方的质量和道德标准)。
把 AI 装进手机
还记得一年前,当你尝鲜那些需要本地部署的 AI 绘图工具时电脑力不从心的样子么?现在在手机安卓系统上就能实现 AI 绘制手机桌面背景了(它甚至还会帮你优化提示词)。
AI 绘制手机桌面丨Google
你看,自己还没来得及被 AI 武装起来,手机都武装起来了。要是觉得 AI 画桌面大材小用了,那让它帮你自动回复信息怎么样? 大会上展示了安卓系统中 AI 自动根据消息上下文进行回复的功能, 你还可以加入特定的“风格和语气”设定:模仿 HR 跟老板智斗上几个回合,想想就刺激……
另一个实用功能是手机上 P 图:美颜、优化、打字等等早就过时了。既然叫了这么多年“智能手机”,那有了 AI 才是真智能: Google Photo 新公布 Magic Editor 功能,可以直接实现对图像特定部分的编辑,人物、背景都可以,而其他部分会自动通过 AI 补充到理想又逼真的样子。什么“背景太假啦”、“构图太差了”再也不是情侣分手的借口。
用上 Magic Editor 后,可以把图中的椅子拖拽到自己满意的位置,还能让 AI 将天空变得更蓝一些丨Google
搜索算是 Google 老本行。属于这个 AI 时代的搜索,让你可以像前面提到的那样通过 Bard 对话来进行,也可以在传统搜索引擎中实现一种更新的体验:通过 Google 搜索框,你可以 输入极其复杂的一句话来获得准确的搜索结果(之前你可能要不停地把你问题拆分或者把限制条件拆分):比如“对于我这种又懒又想探索大自然户外运动旅行的人在带着 80 岁腿脚不便的老奶奶和 3 岁的娃以及两条狗的情况下应该在即将到来的端午节假期去什么地方旅行?”
图文并茂的搜索回复丨Google
搜索引擎会充分理解这个长句,然后在结果中给出带有预览的网页答案, 还会自动提供引导问题,比如:假期玩多久?可以住哪里?交通怎么安排?等等。
而与此同时,AI 模型还会主动筛选掉那些虚假的和恶意诱导类型的结果。
这种体验被 Google 成为“搜索实验室”,今天就正好开放注册( labs.google.com/search),你可以试试排队等待体验。
“大胆而负责的”
成熟负责的第一步是能够承担自己的行为和后果,对于 AI 来说也一样。
让 AI 为自己负责丨Google
大会现场就以“登月是假的、照片是摆拍”的所谓“摆拍图”来展示了这一功能。
对于所搜得出的文字内容,Google 在一部分需要的搜索问题之下加入了一个新的 Perspective Filter(“视角”过滤器)。在这个过滤器处于打开状态的时候, 搜索结果会优先把来自真实经历的内容放在更靠前的位置,而那些没什么关联通过关键词蹭热度的、那些低质量看似相关又不知所云的、那些虚假的无法被求证的,都将被“过滤”。
Google I/O 强调做“大胆而负责”的AI丨Google
“大胆而负责”,是这次大会上 Google CEO 劈柴(Pichai)强调最多的,也是现场收获欢呼最多的。用 AI 作为工具,让 AI 负起责任,也许是缓解我们现在对于 AI 恐惧和厌烦的最好办法。
小知识:Google I/O 是什么?
Google I/O 是 Google 的年度开发者大会,也是科技行业最重要的年度大会之一。大会每年 5 月举办,今年刚好是第 15 周年。
互联网与人工智能历史上很多里程碑式的产品都是在这个大会上发布的:安卓系统、上一代 AI 明星 AlphaGo、如今大语言模型基石 Transformer……
大会名称 I/O 的解释有三种:
一是代表了“输入(Input)与输出(Output)”,这是计算机系统与世界交互的基础行为;
第二是代表了“开放的创新(Innovation in the Open)”,这是 Google 产品形象中最有辨识度的两个特质;
第三是代表了一串二进制数字当中开头的 1 与 0,有一个英文单词用来表示 1 后面一百个零,googol——这就是 Google 公司名的由来。
作者:卧虫
编辑:沈知涵、biu
封面图由作者拍摄
如有需要请联系sns@guokr.com