从机器学习的角度来看,谷歌比 Open AI 和微软有几个优势。
人工智能战争已经达到了一个新的水平。谷歌宣布发布 Bard,这是他们对 ChatGPT 的回应。谷歌首席执行官桑达尔·皮查伊 (Google Sundar Pichai)在他们的公告帖子An important next step on our AI Journey 中发表了以下言论:
很快,您将在搜索中看到基于 AI 的功能,这些功能将复杂的信息和多个视角提炼成易于理解的格式,因此您可以快速了解全局并从网络中了解更多信息:无论是寻找其他视角,例如既弹钢琴又弹吉他的人的博客,或深入探讨相关主题,例如作为初学者的入门步骤。这些新的 AI 功能将很快开始在 Google 搜索中推出。
一些互联网评论员一直在评论谷歌推出这种模式是否太晚了。既然微软已经开始将 ChatGPT 整合到他们的系统中,他们能否终结谷歌在搜索市场的霸主地位?目前,围绕巴德的负面宣传很多,很多互联网知识分子预测,ChatGPT 将因其资历而独占鳌头。巴德最近在其介绍中犯下的错误使情况更加复杂
显然,他们广告中的错误导致谷歌损失了超过 1000 亿美元的估值。
然而,纵观双方进行的 AI 研究,却呈现出截然不同的景象。在本文中,我将介绍 Google 的 Bard 相对于 ChatGPT 的一些优势。正如您将看到的,这些优势将很难克服。最后,我还将介绍如何利用这种情况并从这场价值数十亿美元的 AI 军备竞赛中获益。
Mitchell Luo在Unsplash上拍摄的照片
谷歌相对于 ChatGPT 的最大优势之一是谷歌人工智能系统的多模式能力。简单地说,Bard 将远不止于一个语言模型。它将语言、图像、声音等感官融为一体。引用他们的文章《Introducing Pathways: A next-generation AI architecture》他们在其中介绍了他们的机器学习模型的 Pathways 训练系统
多模式功能具有很大的潜力。综合来自多个来源的信息的能力意味着更深入、更丰富的最终输出。它也可能被起诉以提高其产品的可访问性(你能想象实时翻译成不同的语言/手语)。它还将释放智能手机的潜力,让我们更有可能通过视频和图片进行搜索。这是我们已经可以在这个视频中看到的东西,其中谷歌的 AI 能够描述图片,甚至在出错时更新它的视图。
得益于在其搜索和 YouTube 上索引的内容,Google 已经拥有一个庞大的多模态信息库。毫无疑问,ChatGPT 令人印象深刻。它可以很好地解释概念。但是你能想象当你给 Bard 代码时询问潜力,它可以帮助你可视化不同的组件吗?多模态能力不仅增加了系统的效用,而且使效用呈指数级增长。
我无法理解这有多重要,尤其是当我们将它与下一个优势结合起来时。
到目前为止,我已经看到数百人谈论 ChatGPT 和 Bard。我还没有看到一个人提出这个问题。可能是因为他们都忙于被闪亮的新事物分散注意力。
谷歌一直在其 AI 中构建多模式功能。然而,这并不是谷歌及其子公司所取得的全部成就。去年,DeepMind 发布了 GATO,它在众多任务中表现出了非凡的流畅性。
具有相同权重的同一个网络可以播放 Atari、字幕图像、聊天、用真实的机器人手臂堆叠块等等,根据其上下文决定是否输出文本、关节力矩、按钮按下或其他标记
这让 Google 可以通过 ChatGPT 无法触及的方式将 Bard 和 ML 货币化。物理代理具有一组独特的约束和挑战,ChatGPT 无法轻易转化为这些约束和挑战。鉴于 Pathways 所围绕的一劳永逸的培训理念,Bard 很有可能拥有一些面向硬件的能力。这让谷歌有机会通过其他收入来源获利,因为它们可以提供比 ChatGPT 更多的增值服务。
人们还忽略了另一个因素,这个因素可能会决定性地让事情向谷歌有利的方向发展。谷歌的模型绝对更好。一段时间以来,谷歌一直在多项任务的基准测试中名列前茅
Flamingo 是另一个 Google 模型,在Tackling multiple tasks with a single visual language model中介绍过。
在大多数情况下,更好的基准性能是毫无意义的。额外的 2-3% 的性能并不是一个巨大的差异。但是,这里有两个重要的原因 -
这还有另一个因素。谷歌在 2021-23 年取得了突破性进展。他们在蛋白质建模、癌症、数学等方面取得了进步。例如,他们的革命性“ AlphaFold 可以准确预测蛋白质结构的 3D 模型,并且正在加速几乎所有生物学领域的研究”。
这超越了传统的深度学习。Google 的 AI 博客有一篇名为“ AutoML-Zero:Evolving Code that Learns ”的文章使用 EA 来创建 ML 算法。结果令人印象深刻,进化方法甚至优于强化学习。这令人印象深刻。以下是作者的引述,
“我们提出的方法称为 AutoML-Zero,从空程序开始,仅使用基本数学运算作为构建块,应用进化方法自动查找完整 ML 算法的代码。鉴于小图像分类问题,我们的方法重新发现了基本的 ML 技术,例如研究人员多年来发明的具有反向传播、线性回归等的2 层神经网络。这一结果证明了自动发现更多新颖的 ML 算法以解决未来更难问题的可行性。”
将其与 ChatGPT 和 Open AI 进行比较。虽然它令人印象深刻,但它并没有以同样的方式开创先河。是的,微软的研究与谷歌一样出色。但谷歌花了更长的时间将其各个分支机构整合到一个有凝聚力的系统中。