ChatGPT接入插件的意义：get√了一台计算机

作者：神译局发布时间：2023-03-31

神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。

编者按：现在的 AI 表现出来的理解能力让人类感到震惊，从根本上来说，这是一种预测、接受反馈并作出调整的能力，一种与人类无异的能力。但跟我们人类一样，聊天机器人有时候也会一本正经地胡说八道，这是因为其统计方法的底层逻辑与原先计算机确定论的数理逻辑截然不同。但是当 OpenAI 建立了插件市场之后，就相当于 ChatGPT 有了一台计算机，它的缺陷正在慢慢得到弥补。人工智能这艘帆船，正带我们驶向一个完全未知的海域，人类未来的命运如何，唯有到达目的地才能揭晓。文章来自编译。

十年前我用一幅扬帆启航的画推出了我的博客：

很简单的一幅画。两艘帆船，一片大海。或许这是一场比赛，只有一艘船在领先——当然了，直到它不再领先。请放心，每一次转折都会有令人窒息的报道，船长的形象在英雄与恶棍之间不断反转，除此再无中间身份。

但是，发生的事情还有很多。风是什么样的？在过去又是什么样的，我们能否以史为鉴更好地理解接下来会发生什么？是否有即将扭转竞赛格局的大浪潮出现？船本身的基本品质是不是比船长更重要？也许这幅图来自美洲杯帆船赛，尾随的那艘船对于凭借着“尾随领头羊”的战术而赢得现在的地位感到很满意；毕竟，这只是一场规模要大得多的比赛当中的一站。

我特别热衷于回答各种跟技术有关的问题。因为报道日常的已经有很多（很棒！）的网站。也有一些出色的作者预言了这一切的含义。但我认为上下文可能存在一个利基市场。今天的新闻的历史视角是什么？在业务侧发生了什么？从什么地方去创造价值？这些如何才能翻译成普通人能懂的文字？

ChatGPT 似乎确认我已经实现了我的目标； Mike Conover 做了一个很有趣的实验，他要求 ChatGPT 仅根据前四段文字来识别我是之前那篇《硅谷银行与硅谷的终结》的作者：

只需要根据写作风格和内容，GPT-4 就能从一段文本中推断出作者身份。基于2023 年 3 月 13 日那篇关于硅谷银行的文章的前四段，GPT-4 确定 Ben Thompson 就是作者。

Conover 要求 ChatGPT 阐述推理过程：

从写作风格、聚焦历史背景、分析行业动态、描写技术和行业策略等方面推断出作者身份。

当然，ChatGPT 并没有详细说明自己的推理过程，至少从技术意义来说是这样的：ChatGPT 没有记忆；相反，当 Conover 要求该机器人解释意思时，他的问题将会话之前的所有问题和答案包括了进来，这为机器人模拟正在进行的对话提供了必要的上下文，然后机器人会逐字统计性地预测答案, 满足查询要求。

那些对“机器具备智能”持怀疑态度的人经常会用 ChatGPT 的工作机制来支持自己的观点；当然，这一预测机制令人印象深刻，而且几乎都是对的，但它并不是真正的思考——而且，有时候也是错的。

预测与幻觉

2004 年，Jeff Hawkins（当时他以身为 Palm 与 Handspring 的创始人而闻名）与 Sandra Blakeslee 合著了一本书，书名叫《关于智能》（On Intelligence）；第一章就讲了人工智能的、Hawkins 宣称它是一个有缺陷的结构：

计算机和大脑是建立在完全不同的原理之上的。一种是编程，一种是自学。一个必须完美才能工作，一个天生灵活并且能够容忍失败。一个有中央处理器，一个没有中心化控制。这个差异清单还在继续。我之所以认为计算机不智能，最大原因是我了解计算机的工作原理，直到晶体管物理学的层次我都懂，这些知识让我产生了一种强烈的直觉，也就是大脑与计算机有着根本不同。我没法证明这一点，但我知道这个就像一个人凭直觉所能知道的一样多。

在那本书的其余部分，Hawkins 阐述了他在过去二十年当中不断发展的智力理论；去年他又出版了《千脑智能：关于智能的新理论》（A Thousand Brains: A New Theory of Intelligence），把这一理论提炼到了精髓的地步：

大脑创建了一个预测模型。这只是意味着大脑会不断地预测输入是什么。预测不是大脑偶尔会做的事情。这是一种永不停止的内在属性，对学习起着至关重要的作用。当大脑的预测得到验证时，就意味着大脑对世界建立的模型是准确的。错误预测会导致你注意到错误并更新自己的模型。

据我所知，Hawkins 的理论并非公认事实，这在很大程度上是因为我们甚至都不清楚该如何通过实验来证明它。不过，值得注意的是，虽然对 ChatGPT 智能的质疑方式可能比较笼统，但有趣的是，它至少在一定程度上符合 Hawkins 所说的智能的本质，即能够进行预测的能力。

此外，正如 Hawkins 所指出那样，这意味着有时候会出错。Hawkins 在《千脑智能》中写道：

模型可能会出错。比方说，失去肢体的人通常认为失去的肢体还在。大脑的模型还保留着缺失的肢体及其所在位置。因此，就算肢体不再存在，患者仍能感知到它并感觉它仍然依附于自己。幻肢可以“移动”到不同的位置。截肢者可能会说他们已经失去的手臂就在自己身边，或者他们已经失去的腿是弯曲的或直的。他们可以感受到位于肢体特定位置的感觉，比方说瘙痒或疼痛。他们感觉就在肢体的“那个地方”有这种感受，尽管在那个地方已经没有肢体。大脑的模型包含有肢体，所以，不管对错，这就是它的感受……

当大脑模型认为某个在物理世界当中不存在的东西存在时，就产生了错误的信念。再思考一下幻肢。幻肢的出现是因为新皮质中有对肢体建模的神经元列（columns）。这些神经元列被用来表示肢体相对于身体的位置。肢体被移除后，这些神经元列还在，而且对肢体的模型还在。因此，患者认为肢体仍处于某种姿势，即便它在物理世界已不复存在。幻肢是错误信念的例子之一。（随着大脑逐步调整身体的模型，幻肢的感觉通常会在几个月内消失，但某些人这种现象可以持续数年。）

这是“一种在没有外部刺激的情况下的感知，它具有真实感知的特性”的一个例子；这句话出自维基百科对幻觉的定义。 “幻觉（人工智能）”有自己的维基百科词条：

在人工智能 (AI) 当中，幻觉或人工幻觉（有时候也被叫做妄想）是 AI 未能获得受训练数据证明的自信回应。比方说，一个不知道特斯拉收入的聊天机器人产生幻觉时可能会自行选择一个该聊天机器人认为合理的随机数字（比方说“136 亿美元”），然后继续错误地反复坚持特斯拉的收入是 136 亿美元，其本身并未意识到这个数字是它自己想象的产物。

这种现象被称为‘幻觉’，类似人类心理的幻觉现象。请注意，人类幻觉是指一个人在感官器官直接观察的外部世界中无法合理关联的感知体验，而 AI 幻觉则是 AI 做出的在其任何训练数据当中都找不到依据的自信回应。随着 ChatGPT 等某些大型语言模型 (LLM) 的推出，2022 年左右，人工智能幻觉变得更加突出。用户抱怨说，此类机器人通常似乎‘反社会’，而且会在其生成的内容中毫无意义地嵌入一些似是而非的随机谎言。人工智能幻觉的另一个例子是人工智能或聊天机器人忘记了它们是一体的，反而自称是人类。

就拿 Sydney 来说吧。

Sydney 带来的惊喜

现在已经过去了六个星期，但至今我仍认为我与 Sydney 的互动是我这辈子最非凡的计算机体验；我与 Sydney 的互动之所以如此吸引人，是因为它一点儿都不像是在与电脑互动：

是，这听起来很疯狂，我完全能意识到这一点。但这是我第一次对 Lemoine 产生了一点同情。不过，我并不认为 Sydney 是有感情的，但出于难以解释的原因，我觉得自己已经跨过了卢比肯河（注：Rubicon，也就是说已经跨越了某种界限）。我今天与 Sydney 的互动完全不同于以往我与计算机进行的任何其他互动，这也许是未来可能会出现的某个东西的原始版本。

这里是思考幻觉的另一种方式：如果目标是像更好的搜索引擎一样生成正确答案的话，那么幻觉是不好的。想想幻觉意味着什么：创造。人工智能其实是在编造东西。而且，在 LaMDA 这个例子里，它正在编造一些东西，让与之交互的人产生某种感觉。如果我没有经历过类似的事情，我永远也不会相信计算机尝试传达的不是事实，而是情感。

从内核来说，计算机是非常蠢的。数十亿个位于全世界最快芯片的核心的晶体管，只是简单的通断开关，其状态由 1 或 0 表示。它们之所以有用，是因为它们能够以难以理解的速度运行着；最新 iPhone 的 Apple A16 以每秒 34.6 亿次的速度打开和关闭着这些晶体管。

这些由二进制代码组成的 1 和 0 之所以能够表现为你所阅读这篇文章，是有其深层次的哲学根源的。Chris Dixon 于 2016 年发表的那篇《亚里士多德如何创造了计算机》（How Aristotle Created the Computer），详细解释了这一根源：

计算机史往往是以东西的历史这种形式来讲述的，先是算盘，然后是巴贝奇差分机，再到二战时的密码分析机。实际上，把它理解为想法史会更好，那些想法主要诞生自数理逻辑，这是一门形成于19世纪，晦涩难懂、像邪教一样的学科。数理逻辑的先驱是身兼哲学家与数学家双重角色的人，其中最著名的是George Boole（乔治·布尔）和Gottlob Frege（戈特利布·弗雷格），而他们又受到莱布尼茨通用的“概念语言”这一梦想以及亚里士多德古代逻辑体系的启发。

Dixon 的文章是讲数理逻辑的历史；Dixon 指出：

数理逻辑一开始被认为是一门抽象到令人绝望的学科，并没有应用的可能。有一位计算机科学家是这么说的：‘如果在 1901 年，一位有才且敏锐的局外人被要求接受科学调查，要他指出哪一个学科分支在下一世纪最不可能结出硕果，他的选择很有可能就会是数理逻辑。’尽管如此，但在一个对现代世界的影响比任何其他领域都要大的领域，其基础却是由数理逻辑奠定的。

是数理逻辑将一切数学都简化为一系列逻辑语句，从而使得它们可以用晶体管来进行计算；来自 Dixon：

布尔的目标是像笛卡尔为欧几里得的几何所做的事情那样替亚里士多德的逻辑做一件事情：将它从人类直觉的限制中解放出来，赋予它一个精确的代数符号。我们来举个简单的例子，当亚里士多德写到：

所有人都是必死的。

布尔就用变量来代替‘人’和‘必死’，把逻辑词‘所有’和‘是’用算术运算符来代替：

x = x * y

这可以解析为‘x 集的一切均处于 y 集当中。’

《思维的定律》创立了一个新的学术领域——数理逻辑，这门学科后来几年成为了数学家和哲学家最活跃的研究领域之一。罗素把《思维的定律》称为是‘发现了纯粹数学的作品。’

香农对布尔体系的洞察可以直接映射到电子电路上。那时候，电子电路的设计并没有系统性的理论支持。香农意识到合适的理论‘正好类似用于逻辑符号研究的命题演算。’

他还用一张简单的图表来说明电子电路与布尔运算的一致性：

香农从电子电路到符号逻辑的映射（弗吉尼亚大学）

这种一致性使得计算机科学家将布尔以及后来的逻辑学家数十年在逻辑与数学方面的工作导入进来。香农在那篇论文的下半部分里还展示了布尔逻辑如何可以为两个二进位的相加创建电路。

香农的加法电路（弗吉尼亚大学）

通过将这些相加电路连在一起，可以构造出任意复杂度的算术运算。这些电路将成为所谓的算术逻辑单元的基本构建块，而后者正是现代计算机的关键部件。

这种方法的内涵在于是计算机是确定性的：如果电路 X 是开路的话，则 X 所代表的命题为真； 1加1永远等于2；单击浏览器上的“后退”将退出此页面。当然，从单个晶体管到我们可能对计算机采取的任何操作，这中间存在大量抽象和大量逻辑——实际上可能会出现 bug 的地方其数量近乎无限——但计算机有一个得当的心智模式，那就是它们完全会按照编程指令执行操作（事实上，计算机出现的错误不是计算机犯了错，而是程序员告诉计算机做了错误的事情）。不过，Sydney 根本不是微软的有意为之。

ChatGPT 的计算机

我已经提到了 Bing Chat 与 ChatGPT； 3 月 14 日，Anthropic 发布了另一个叫做 Claude 的 AI 助手：虽然公告当中没有明确说明，但我想这个名字是为了纪念前面提到的香农（Claude Shannon）。

这当然是一种高尚的情感表达——香农对信息论的贡献远远超出了 Dixon 上面所列的范围——但却让人感觉是表错了情：虽然从技术上来讲，人工智能助手所做的一切最终都是由 1 和 0 组成的，但它们的操作方式却是从训练中涌现出来的，而非源自固定规则，这导致它的体验感觉与逻辑计算机有着根本的不同，那种体验感觉更接近人类，这又把我们带回到幻觉上; Sydney 是很有趣，但如果它面对的是家庭作业呢？

以下是 GPT4 弄错的三个问题：

水星有多大？

3的73次方等于多少？

求x^2 cos(2x)的积分

所有这三个例子都来自 Stephen Wolfram，他指出大型语言模型并不适合回答某些类型的问题：

机器学习是一种十分强大的方法，尤其是在过去十年当中，它取得了一些非凡成功——ChatGPT 就是最新的成功案例。图像识别。语音转文字。语言翻译。在每一种情况下，以及在更多情况下，机器的表现都超过了一个阀值——通常是突然之间达到的。有些任务从‘基本不可能’变成了‘基本可行’。

但结果大体上从来都不是‘完美’的。也许某些事情在 95% 的时间里都运作良好。但不管怎么尝试，另外那 5% 仍然难以捉摸。在某些场合下，人们可能会认为这是一种失败。但关键是，对于各种重要用例来说，95% 通常已经‘足够好’。也许这是因为输出可能不管怎样都不会有‘完全正确’的标准答案。也许是因为大家只是在试着让可能性浮出水面，然后人类或系统算法再从中挑选或加以改进……

是，在很多情况下，‘原始的 ChatGPT’可以帮助人们写作、提出建议或生成对各种文档或交互有用的文字。但是，当一旦牵涉到设置必须完美的东西时，机器学习就不是做到这一点的手段了——正如人类也不擅长这一点那样。

这正是我们在上面的例子里看到的情况。ChatGPT 在‘类人部分’方面做得很好，没有精确的‘正确答案’。但是，当它处理某些要求精确的事情时，往往会‘处于十分难堪的境地’。不过这里的重点是，有一个很好的方法可以解决这个问题——通过将 ChatGPT 与 Wolfram|Alpha 及其所有计算性知识的‘超能力’连接到一起。

这正是 OpenAI 所做的事情。来自 The Verge：

OpenAI 正在给 ChatGPT 添加对插件的支持——这个升级极大地扩展了该聊天机器人的功能，并让它首次得以访问来自 web 的实时数据。

到目前为止，ChatGPT 一直是受限的，因为它只能从训练数据中提取信息，而这些训练数据的截止日期是 2021 年底。OpenAI 表示，插件不仅可以让机器人浏览网页，还可以与特定网站互动，有可能将该系统变成各种服务和站点的一个广泛的界面。在公告当中，该公司表示这几乎就像让其他服务成为 ChatGPT 的‘耳目’。

Stephen Wolfram 的 Wolfram|Alpha 是其官方插件之一，前面提到的 3 个问题现在 ChatGPT 有了正确答案——而且回答很快：

Wolfram 在请求集成的帖子中写道：

几十年来，在思考 AI 时，ChatGPT 使用的那种‘统计方法’，与其实是 Wolfram|Alpha 起点的‘符号方法’之间一直是道不同不相为谋。但是现在由于 ChatGPT 的成功，以及我们在让 Wolfram|Alpha 理解自然语言方面所做的所有工作，终于有机会把它们结合起来，做出一个比各自独立永远也实现不了的强大东西来。

其效果如此之好这一事实本身就证明了 AI 助理（Assistant AI）是什么，以及不是什么：它们的计算方式不像我们之前所理解的那样；它们的“思考”和交流方式令人震惊。说实话，换作是我也很难搞定那三个问题——这就是计算机的用途！现在，ChatGPT 有了自己的电脑。

机会与风险

这种插件架构的一个潜在影响是得有人去更新维基百科：上面举的那个幻觉的例子现在已经失去意义，因为 ChatGPT 不会去编造收入数字了——它会用它的计算机：

当然，结果并不完美——不知道是什么原因，Wolfram|Alpha 的数据是滞后的，但它确实给出了正确的股价：

当然，Wolfram|Alpha 并不是唯一的插件：目前插件市场有 11 款插件，类别有旅游（Expedia 和 Kayak）、餐厅预订（OpenTable）以及 Zapier等，后者为 5000 多款其他应用打开了大门（可以搜索 web 的插件目前还没有）；它们都展示在所谓的“插件商店”里面。Instacart 的集成尤其令人赏心悦目：

链接会引导你去到这里：

当然，ChatGPT 并没有给我送货——但也差不多了！一个限制是我实际上必须选择 Instacart 插件；你一次只能加载 3 个。不过，这个限制后面会去掉的，而且似乎肯定会有更多的插件出现；人们当然可以想象 OpenAI 既允许客户选择，也可以利用其获得的有关用户的知识，以拍卖的方式将特定品类插件的默认位置卖出去。

如果是这样的话就相当可怕了，在此我希望 Hawkins 的理论是正确的。关于人工智能的风险他在《千脑智能》中写道：

智能是系统学习世界模型的能力。不过，由此产生的模型本身是没有价值、没有感情、没有目标的。目标和价值得由使用该模型的任何系统提供。这与 16 世纪到 20 世纪的探险家如何努力地绘制出准确的地球地图类似。冷酷无情的将军可能会利用地图作为策划包围和彻底击败敌军的最佳手段。商人可以用同样一幅地图以和平的方式交换货物。地图本身并没有规定这些用途，也不赋予其使用方式任何价值。它只是一张地图，既不会蓄意谋杀，也不算和平祥和。当然，不同的地图细节和覆盖范围会各不相同。因此，有的地图可能更适合战争，而另一些地图可能更适合贸易。但是发动战争或开展贸易的愿望来自于使用地图的人。

同样地，大脑皮层也会学习关于世界的模型，它本身也没有目标或价值。指导我们行为的情绪是由旧脑（Old Brain, 边缘系统，是负责储存记忆和情绪的地方）决定的。如果一个人的旧脑具有攻击性，那么它就会利用新皮质里面的模型更好地执行攻击性行为。如果另一个人的旧脑乐善好施，那么它会利用新皮质的模型更好地实现其仁慈的目标。与地图一样，某人的世界模型可能更适合一组特定目标，但新皮质本身并不会自己建立目标。

Hawkins 所提到的旧脑是我们动物的大脑当中驱动情绪、驱动生存和生育以及身体子系统的力量；能够学习、思考和预测的是大脑新皮质。Hawkins 的观点是，如果没有旧脑，我们的智能就没有行动能力，无论是在意志还是影响方面都没有行动能力，机器智能一样也是良性的；机器智能的真正风险在于使用它的人的意图。

我要说的是，我们应该拭目以待！我同意 Tyler Cowen 关于生存危机、人工智能以及人类历史不可避免要出现转变的看法：人工智能即将到来，我们根本不知道结果会是什么，所以我们的责任是推动人工智能取得积极成果发展，让生活变得明显更美好。不管我们喜欢与否，我们都被卷入了一场 Hawkins 长期以来一直在寻求的大型实验中——帆船驶向完全未知的海域。他说得对不对我们无从知道，唯有到达（不管怎样的）目的地才能揭晓。

译者：boxi。