最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？

作者：果壳网发布时间：2023-04-17

来源 | 科研圈（ID：keyanquan）

可用于 ChatGPT 的 11 个插件。｜OpenAI

撰文杜若云

编辑吴兰、魏潇

北京时间 3 月 23 日，OpenAI 发布了第一批可接入 ChatGPT 的插件。这些插件由 11 个第三方提供，同时 OpenAI 官方也提供了两个官方插件 Browsing 和 Code Interpreter。

根据 OpenAI 官网的介绍[2]，第三方的插件可以用来查询航班，订机票（Expedia，KAYAK），对比商品价格，购物（Klarna Shopping，Shop，Instacart），检索实时消息（FliscalNote），进行数学计算（Wolfram），学习语言（Speak）等等。在这些插件的加持下，ChatGPT 终于可以走出 2021 年之前的世界，与当下“联网”了。

Wolfram 加持，数学能力显著提高

第三方插件的接入使得 ChatGPT 更加强大。作为大型语言模型（LLM）神经网络，ChatGPT 强大的生成文本材料能力有目共睹，但它并不能去做复杂的计算推理工作，也无法系统地产生正确的（而不是“看上去正确”的）数据。但在接入计算功能强大的 Wolfram 插件后，ChatGPT 不仅可以做这些事情， 在计算层面上“胡言乱语”的习惯也可以被改正。

通过下面这道大学数学题，就能看出接入插件前后 ChatGPT 的不同表现。图 1 中的 Genie 来自代码编辑器 VScode，它是该软件的 ChatGPT 扩展，能够代表没有接入插件前的 ChatGPT。

图 1 没有接入计算插件 Wolfram 前，ChatGPT 的“胡言乱语”。｜作者

图 2 接入插件的 ChatGPT 给出了正确的答案。｜[1]

通过简单的检查我们发现，在没有接入 Wolfram 插件时，ChatGPT 给出了一个“看起来过程很完美”但是结果完全错误的回答，但是在接入 Wolfram 插件后的回答是完全正确的。那么， 这个插件是如何避免 ChatGPT “胡说”的？解决方法听起来很简单：ChatGPT 会通过插件将问题发送给 WolframAlpha 进行计算，然后根据返回的结果来“决定”回答什么。同时用户可以点击“Used Wolfram”按钮来检查 ChatGPT 是否“编造”回答。这意味着，通过 Wolfram 插件我们可以判断出哪些信息（计算相关）是正确的，哪些是“编造”的。

对于与现实世界有关的问题，ChatGPT 也可以靠这种方法给自己打上“补丁”。比如向无插件版 ChatGPT 提问土耳其的畜牧数量有多少时，它“郑重其事”地引用了土耳其统计局（Turkish Statistical Institute），并“编造”了一个看似合理的数据（图 3）。当使用接入Wolfram 插件的 ChatGPT 时（图 4），这个回答和 WolframAlpha（Wolfram 公司的一款软件，也是 Wolfram 插件背后的“回答者”）中给出的答案完全相同，这也从侧面验证了该插件的工作原理。

图 3 无插件的 ChatGPT 对土耳其畜牧业问题的编造回答。

图 4 有插件后 ChatGPT 能够给出正确答案。来源：[1]

目前，Wolfram 和 ChatGPT 的联动，仅限于 ChatGPT 将用户用自然语言询问的问题通过插件发送给 WolframAlpha。由于 WolframAlpha 的构建初衷就是处理各种“混乱”的类人自然语言并给出答案，因此它可以处理来自 ChatGPT 的用户询问，并通过插件返回答案[1]，因此目前的 Wolfram 插件对于 ChatGPT 是一个简单版本， 未来也许可以通过训练使 ChatGPT “搞懂”更复杂更强大的 Wolfram 语言，这对于 ChatGPT 的计算能力提高更为关键，对科研职业的作用也更为明显。

数学家危险了？

那么这是否意味着，插件的接入会使 ChatGPT 的功能足够强大到影响以至于取代某些职业呢？

根据 OpenAI 最近发表在预印本网站 arXiv.org 上的研究论文[3]，我们可以看到 不同职业对于 GPT 的“暴露”程度。这里的“暴露”是指将完成任务的时间减少至少一半，即当“暴露”程度达到 100%，GPT 能至少帮你将完成任务的时间减少一半。不同职业的“暴露”程度有所不同，最令人惊讶的是， 数学家的暴露程度超越了很多看似技术含量不太高的工作，达到了 100%。作为对比，财务经理和平面设计师的暴露程度为 13%，公关专家和创意作家的暴露程度分别为 67% 和 69%，而经常“被失业”的翻译和口译的暴露程度，也只有 77%。

图 5 OpenAI 关于 AI 对不同职业影响程度的研究结果来源：[3]

从论文发表的时间来看，这些数据是 GPT-4 发布后和 ChatGPT 插件发布前的数据，但从插件的作用和机制来看， 插件的引入或许导致这些职业的“暴露”程度更高，同时会减少用户检查 ChatGPT 是否在“胡说八道”的时间。但这并不意味数学家将被取代，他们可以将大量繁琐的计算和代码工作交给 ChatGPT 来完成。 这将大大提高科学家的工作效率，让他们有时间思考并进行原创性工作。如果 ChatGPT 可以帮助数学家和理论物理学家完成繁琐的计算，并得到大量结果，这也会对我们理解新科学大有帮助。

图 6 陶哲轩分享的 ChatGPT 使用心得来源：[7]

图 7 利用 ChatGPT 生成的 arXiv 论文检索结果的 RSS。｜作者

除此之外， 陶哲轩还会用 ChatGPT 帮自己备课，比如询问它在线性代数课堂中聪明的学生可能会提出的问题，来启发自己课程讲授以及布置作业的方向。在博客中他提到：“虽然这些 AI 工具无法直接帮助我完成核心任务——如尝试解决一个尚没有答案的数学问题，但是它们对于各种次要（但仍与工作相关）任务时非常有效（尽管之后需要一些手动调整）。”

隐私隐患如何解决

目前来看，这些职业是否会被 AI 取代，取决于后者的未来发展，但这毫无疑问会深刻改变我们的生活生产方式。OpenAI 公共政策主管 Anna Makanju 表示：“这项技术将深刻改变我们的生活方式。我们现在仍有时间来指导其发展轨迹、限制滥用并确保最广泛有益的结果。”[6]

除了职业安全问题，我们还需要关心一下自己的隐私。 担心“聪明”的 ChatGPT “窃取”用户隐私是一个 AI 诞生起就如形随形的问题，而第三方插件的引入使得这个问题更加复杂——我们难以保证这些插件不会利用 ChatGPT 获得用户隐私来牟利。3 月 20 日，ChatGPT 出了一个几乎引发全网骚动的 bug，一些用户可以在自己的聊天页面里看到他人的聊天记录。OpenAI 不得不将 ChatGPT 强制下线修复[4]，这令大批打工人叫苦不迭。更糟糕的是，ChatGPT 下线的几个小时里，一部分活跃用户的姓名、电子邮件地址、支付地址、信用卡号的最后四位和信用卡到期时间也被泄露，尽管 OpenAI 官方认为泄漏的数据量很少，但如何采取措施确保用户隐私安全将成为所有 AI 公司的首要任务。

如上所述，ChatGPT 这样的 AI 在未来肯定会深刻地影响目前社会的生产生活格局，改变人们的工作生活方式，因此如何确保新的“人+AI”模式顺利进行并对人类社会产生有益影响，对于政策制定者和 AI 公司有着极大的考验。

参考文献

[1]https://writings.stephenwolfram.com/2023/03/chatgpt-gets-its-wolfram-superpowers/

[2]https://openai.com/blog/chatgpt-plugins

[3]https://arxiv.org/pdf/2303.10130.pdf

[5]https://openai.com/blog/march-20-chatgpt-outage

[6]https://openai.com/safety

[7]https://mathstodon.xyz/@tao

封面图来源：Pixabay。

本文经授权转载自 科研圈（ ID：keyanquan），如需二次转载请联系原作者。欢迎转发到朋友圈。

最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？？？

推荐体验

相关资讯

最容易被ChatGPT抢饭碗的科学家，竟然真的是数学家？

科学家被ChatGPT骗了

数学家丘成桐：人工智能不会取代数学家

AI要“抢饭碗”？OpenAI新基准揭露真相：数据科学家们慌不慌！

“数学之王”谈AI：对最尖端的数学家不会有任何影响

近期资讯

洛阳隆中重工取得一种超声波擦洗机专利，拆卸维护更方便

西安热工研究院有限公司取得多场复合的活性炭深度清洗设备专利，提高活性炭的清洁度

无锡市美极超声设备取得一种超声波清洗机的双层清洁装置专利，提高整体工作效率

益阳仪纬科技取得铝合金件铸造用清洗装置专利，有效提升铝合金件清洗效率和质量

温州博宇机械取得冷镦机用清洗装置专利，具备及时清洗工件表面碎屑的效果

安凯微：已量产的0.5T OPS和2T OPS算力的视觉SoC适用于家用摄像机等

镇江金裕精密零件取得一种针孔件加工清洗槽专利，避免杂质和污染物引入，提高清洗环境洁净度

无锡市美极超声设备取得应用于超声波清洗机烘干炉专利，可实现工件均匀烘干

苏州辰旭取得超声波清洗机的吊架结构专利，解决下料不便及噪音问题

镇江金裕精密零件取得一种针孔件加工清理组件专利，提升装置的清理效率

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响