神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:OpenAI 发展如此迅速,它会成为下一个科技巨头吗?或许很难。本文来自编译,希望对您有所启发。
图片来源:every
一家公司在短短几年内从研究实验室转变为开发基础设施供应商,再转变为庞大的消费者应用程序,这是相当罕见的。但考虑到此前 ChatGPT 插件的发布,这很有可能就是 OpenAI 的发展路径。
插件允许 ChatGPT 浏览网页,并与 Kayak 和 Instacart 等服务进行交互,为用户执行任务,而不仅仅是生成文本。这一消息标志着 OpenAI 走出了研究领域,进入了一个雄心勃勃、充满不确定性的新世界,与谷歌(Google)、微软(Microsoft)、苹果(Apple)和 Facebook 一道,力争成为最新的科技巨头。
帕基·麦考密克(Packy McCormick)从不回避大胆的乐观主张,他用下面的表情包表达了对结果的预测:(详见文章《OpenAI无意间发现了一个有史以来最赚钱的商业模式》
即使你不像帕基那么乐观,很明显这也是一个重要时刻。我的预感是,在不久的将来,我们几乎每天都会使用 ChatGPT 插件,或者类似的东西。我不知道谁会成为市场的主导者,也不知道如何获取价值,但这种新兴的人工智能聊天产品是非常契合市场需求的。认真地说,它的重要性与个人电脑、网页浏览器、搜索引擎和智能手机相同。
在 ChatGPT 插件发布的当天,我参加了红杉在旧金山举办的人工智能会议,山姆·奥特曼(Sam Altman)在会上发言。上午 10 点,插件发布的消息在推特上传开,你几乎可以看到这条消息在与会者中产生的涟漪。你听说了吗?你试过了吗?哇,你有测试版?好用吗?
另外,请记住,这些人可并不是易受影响或容易激动的乡巴佬!许多人工智能领域最聪明的投资者和首席执行官都参加了这次活动,他们立刻就明白了这个消息的意义。
OpenAI 现在有可能认为自己主要是一家消费者企业。它最初可能是一个研究实验室,近年来演变为人工智能基础设施供应商,但这可能不是它的最终形式。写作 Stratechery 博客的本·汤普森(Ben Thompson)甚至预测 OpenAI 应该并且最终可能会关闭开发者的所有 API 访问,称这是浪费资源和分散注意力。
那么,到底发生了什么?问题太多了:
显然,这是一个正在迅速变化的情况,但我会尽自己所能来回答所有这些问题。
简而言之,插件可以让 ChatGPT 执行除了生成文本之外的操作,并且允许 ChatGPT 访问不包含在其训练数据中的外部信息。
在过去,开发人员可以在他们自己的产品中使用 OpenAI 的 API。而现在,OpenAI 正在其产品中使用开发者的 API。
到目前为止,OpenAI 已经构建了三个第一方插件:
1. 网络浏览器:能够搜索网页、点击链接和查找当前信息。
2. 代码解释器:可以在沙盒环境中运行 Python 代码并读取输出。
3. 检索:这一个与前两个略有不同,因为它更像是一个模板,而不是一个完整的插件,其他人可以使用它来构建自己的插件。这个过程基本上是让你上传一堆文本,并允许 ChatGPT 使用这些文本来回答问题。如果你曾经见过像“与书聊天”这样的项目,那么这基本上是在 ChatGPT 中实现的一种方式。
除了这三个第一方插件,OpenAI 还与 11 家公司合作为 ChatGPT 构建第三方插件。它似乎想要演示各种各样的用例。以下是公告页面的截图,其中包括每种产品的描述:
图片来源:every
像 GPT-4 这样的大型语言模型(LLMs)擅长理解文本、推理和遵循指令,但它们无法储存世界上所有的事实,也无法准确地检索它们。而且,就其本身而言,大型语言模型只能够生成文本。
插件一举解决了 ChatGPT 的许多大问题:
1. AI 幻觉。又称“胡编乱造”,这是很难让我们依赖 ChatGPT 的主要原因之一。当你问 ChatGPT 一个问题时,它有时会给出一个错误的答案,而不是告诉你它不知道。然而,当你从外部来源给人工智能提供准确的信息时,它就几乎能完全解决这个问题——插件可以实现这一点。
2. 信息过时。训练一个大型语言模型是很昂贵的,而且一旦训练完后,你就很难更新新的信息。而插件可以通过在提示中注入新的信息来解决这个问题。
3. 私人信息。你不能向 ChatGPT 询问你的银行账户余额。这些数据一直在变化,而且是私人的。但是通过插件,银行可以允许你将帐户连接到 ChatGPT。
4. 采取行动。虽然我喜欢阅读文本,但不得不承认,这并不总是我想要的。行动更为重要。插件不仅允许大型语言模型生成文本,还允许大型语言模型在外部服务中采取行动。你在电脑或手机上做的任何事情,ChatGPT 将来都可以为你做。
通过解决这四个问题,插件可以让 ChatGPT 轻松地变得更有用 10 倍,甚至 100 倍。这是一件大事,因为它已经足够有用了,吸引了历史上增长最快的用户群。
而且,除了使产品更有用之外,插件也有可能为 OpenAI 创造一个“飞轮”(flywheel)。飞轮可以创造良性循环。每个科技巨头都有一个强大的飞轮。例如,杰夫·贝佐斯(Jeff Bezos)曾在一张餐巾纸上勾勒出亚马逊的飞轮,展示了较低的价格和更广泛的选择将使亚马逊吸引更多的客户,而这将有助于他们提供更低的价格,吸引更多的卖家,从而吸引更多的客户。就是这样。飞轮越转越快,你公司发展会跟着加速。
插件可能是 OpenAI 的一个“飞轮”:
图片来源:every
你可能会问,很多初创公司不是已经这样做了吗?
是的,可能是这样。许多开发者已经建立了一些应用程序,将外部信息引入大型语言模型,并使大型语言模型能够采取行动。但它们都没有 ChatGPT 的使用量和影响力大。到目前为止,只有 ChatGPT 有足够的规模让大多数大公司采用它。
这与 ChatGPT 本身在去年 11 月推出时的情况类似。其他人已经使用 GPT-3 构建了类似的产品,但没有一个像 ChatGPT 那样爆发。OpenAI 比大多数开发者更有可信度,可以接触到更多的用户。
这就是事情变得非常有趣的地方。到目前为止,这个故事相对简单:ChatGPT 有点像 iPhone,而插件有点像应用程序。但这并不是故事的全部。还差得远呢。
ChatGPT 插件的工作方式与 iPhone 应用程序的工作方式非常不同。首先,iPhone 应用程序的构建要复杂得多。且应用程序构建完毕后,只能在 iPhone 上运行。但是 ChatGPT 插件要简单得多,而且构建完毕后,可以在任何其他大型语言模型上运行。
因此,OpenAI 肯定会对插件的工作方式产生很大的影响,但我认为,它很有可能扮演的是更类似于苹果在播客领域的角色。
在播客方面,苹果定义了一种标准格式,所有播客都必须符合这种格式,才能将其节目放到苹果播客应用程序中。但之所以有这么多的播客应用,是因为任何人都可以制作一个应用,读取相同的格式,而且任何人都可以制作一个目录,列出所有的播客。它不像 YouTube 那样是集中控制的。OpenAI 插件的工作方式基本上也是如此。
这就是为什么我之前在推特上说,应该有人建立一个开放的人工智能插件目录,这样其他任何人就都能将插件构建到他们的产品或服务中了。
需要注意的是,这种开放的行业架构有优点,但也有缺点。有利的一面是,一个开放的、基于标准的生态系统非常棒,因为它的进入门槛很低,任何人都可以创造一些东西并发布出去。但另一方面,有时标准会停滞不前,当有一个中心参与者时,它们更容易改变。迈克·米尼亚诺(Mike Mignano)曾在 Spotify 运营播客,他几个月前在 Every 上写过一篇相关文章。几年前我也写过关于这个话题的相关文章。
这是一个价值万亿级的问题,对吗?
我目前的观点是,OpenAI 绝对比我所知道的任何其他公司都更有可能达到谷歌、苹果、微软、亚马逊和 Facebook 那样的高度(就影响力、用户量和利润而言)。我同意派奇(Packy)在早些时候提出的大部分乐观分析。但我仍然认为这会是一个漫长的机会。
有几个关键原因:
1. 一般来说,如果我们想成为优秀的贝叶斯主义者,并在估计事件的未来可能性时考虑到事件的先验概率,那么我们应该非常怀疑那些巨头是否会发展到那么大。自然界是混乱的,而混乱导致大多数公司在某个时候会比巨头们更早地碰到天花板。
2. 大多数人在分析插件的用处时,都没有充分考虑到这样一个事实:这对 OpenAI 来说将很难控制和驾驭,就像苹果也需要想方设法来控制和驾驭 iPhone 的软件体系一样。
3. 我甚至不认为 OpenAI 想要以苹果的方式控制其插件生态系统。OpenAI 本可以很容易地做出一个更加封闭的系统,但它没有选择这样做,因为这可能会限制它的增长。
4. 正如我几周前解释的那样,大型语言模型的界面非常简单:文本输入,文本输出。如果一个模型和另一个模型一样好,那么在用户不太注意的情况下,将模型换掉是相当容易的。现在我们都知道这个市场很重要,因此我们大概率会看到一些强势的竞争对手开始迎头赶上。
鉴于此,我认为 OpenAI 将会成为一家非常庞大而重要的公司,但很难看到它变得像如今的巨头一样庞大或重要。话虽如此,我对此并没有很大的把握。有可能我是错的。
我认为这是极不可能的。就连本·汤普森(Ben Thompson)也表示,他认为 OpenAI 在很长一段时间内都不会这么做。
ChatGPT 可能会持续吸引消费者的青睐,但仍有很多不确定性。谷歌刚刚觉醒,如果它决定让大型语言模型为用户执行的每一次搜索生成文本,那么让用户直接使用 ChatGPT 的理由就少得多了。
此外,OpenAI 与微软有着不同寻常的深厚合作关系,它在许多方面都依赖于微软。如果没有微软的基础设施,OpenAI 将无法像现在这样迅速扩大规模。那么,OpenAI 真的会全力成为一家消费者公司,并与必应聊天竞争吗?我认为不太可能。
微软在 Azure 和开发者服务上赚的钱比他们在必应上赚的多得多。即使微软最终收购了 OpenAI,我也认为微软更有可能将其纳入 Azure 团队,而不是将 OpenAI 的 API 专门保留给必应聊天(Bing Chat)使用。
而且,一方面,OpenAI 关闭 API 的可能性极小,另一方面,哪怕真的关闭了,开发人员也可以迅速切换到其他大型语言模型提供商。比如来自 Anthropic 的 Claude 就相当不错,每周都有更大更好的开源模型发布。我不担心这方面的进展速度。
对我来说,最重要的是,这在科技领域是一个令人兴奋的时刻。我在科技行业已经有十几年了,从未见过任何事物发展得如此之快。我记得 iPhone 的 App Store 推出之时,与此相比,那简直是小巫见大巫。
对于建设者来说,重要的是要专注于你的用户,保持稳定的进展。如果你想等待竞争环境稳定下来,前景变得更加明朗了再行动,那就太晚了。最好的办法很简单:做人们想要的东西。
你做了什么呢?
译者:Jane