让ChatGPT长“手”！Meta爆火新论文，让语言模型学会自主使用工具

作者：量子位发布时间：2023-02-13

ChatGPT

鱼羊 Pine 发自凹非寺

量子位 | 公众号 QbitAI

ChatGPT爆火，Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢，谁想Meta冷不防抛出一篇新论文，顿时吸引全场目光：

瞄准ChatGPT的“软肋”，让大语言模型 自行学会了使用工具！

简单来说，基于Meta的这个思路，ChatGPT这些大语言模型可以缺啥补啥：

不会算数，就自己掏出计算器计算；需要最新信息，就自己连接搜索引擎搜索……

是不是有点AI自己操作自己内味儿了？

论文一出，不少AI研究者就将其视作“ 过去几周里最重要的论文”。

这篇论文给人们打开了思路，让大语言模型未来可以成为所有事情的起点。

还有网友表示：我老婆原本不太关心AI，听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回，Meta给这个会使工具的语言模型起名 Toolformer。

Toolformer的内核逻辑，总结下来很简单，就是：

专业的任务交给专业的工具来做。

在生成文本的过程中，遇到特定的任务，Toolformer会直接调用所需工具的API。

比如说，在执行这个任务：1400名参与者，有400人通过了测试，占多大比例？（为了让ChatGPT掌握数学运算，OpenAI可没少折腾【加链接：ChatGPT连夜迭代：你老婆不好使了】）

Toolformer丝毫不慌，直接“掏出”计算器，现场计算得出结果： 29%。

又或者说，想要备注个事情，只知道是周五，具体日期还不知道？

没关系，翻出日历查一下就好了。

除了这些工具之外，Toolformer还能够调用Q&A以及搜索引擎等工具。

这时，就已经有网友开始畅想未来了：

现在，ChatGPT版必应能帮你比较酒店价格，那未来有了Toolformer，预定性价比高的酒店岂不是也可以甩给AI去做了。

不过话说回来，Toolformer面对不同的任务都能行云流水般地调用对应的工具，它是怎么做到的呢？

一言以蔽之，Toolformer经过训练，能够在生成文本中插入API调用，直接将任务外包出去。

在这其中，训练的过程是以 自监督的方式完成的。这意味着无需大量人类标注好的数据，Toolformer只需要少量演示就能学会调用API。

具体来说，先给Toolformer提供少量已经手动标注好的例子，然后让语言模型在实践中 生成一个更大的包含示例的数据集。

这个过程主要分成三步：

首先是取样，通俗点讲就是看输入的文本提示中，哪个地方需要调用哪种工具，然后直接将“调用的API”插入到对应的地方；

其次是执行，执行上一步的“调用API”任务，将生成的文本直接插入进去；

最后是过滤，上一步中工具生成的文本如果对输入文本来说用处不大的话，就可以直接pass掉，保留对文本有用的地方。

这样一来，基于这些有用的数据集，Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多，Toolformer的真实效果到底如何，有没有一个横向的数据对比？

论文将Toolformer和多个其他大语言模型，包括GPT-J，OPT （66B）以及GPT-3 （175B）进行了对比，比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示，在学习使用工具后，GPT-J的零样本学习性能的到了显著的提高。

△Toolformer：是在GPT- J上微调，并加强了CCNet子集中的API调用/ Toolformer （disabled）：同上，但解码期间禁用API调用

并且在大多数任务上性能都有明显提高，在一些下游任务中Toolformer甚至已经超过了GPT-3。

“未来大语言模型发展的重要分支”

说到这里，不知道你怎么看这件事儿。

有不少网友是已经按捺不住，想着去拔AI电源了。

而引发更多讨论的，是这样一种观点：Toolformer可能是未来LLM（大语言模型）发展的一个重要分支。

大语言模型进化出使用工具的能力，知道应该在何时、使用何种工具来实现需求，也就意味着许多在今天还需要人类和AI协作完成的工作，未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手，如果背后有ChatGPT+Toolformer的技术能力支撑，那么从挑选符合需求的餐厅，到直接订座，这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI，那它不仅能帮人们完成搜索，还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至，ChatGPT这样的模型，借助各种API重写自己的代码，也将成为可能。

事实上，让AI掌握工具的使用方法这个研究方向，也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的 Bard，背后模型LaMDA就内置了一套工具箱，包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目 LangChain，也致力于将大语言模型与外部的计算、知识来源相结合，以开发真正可用的应用程序。

而现在，Meta又使大模型对工具的使用“熟练度”、“自主性”，更上一层楼。

不过，也有网友指出，Toolformer所展现出的“自学”能力，还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数：给定相同的输入（包括采样时的随机值），它将总是产生相同的输出。

有点像是在说，一个大语言模型能学会将特定领域的语言作为其自然语言的一部分，以此纳入来自外部工具的知识。

One More Thing

Meta新论文炸场，还挑动了人类的“反思”神经。

这不，新鲜梗图已经出炉：

人类在沉迷，而机器在学习。

— 完—

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”？最有竞争力和潜力的AIGC力量位于何方？

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

有事大家谈 | “小作坊下料就是猛”AI魔改视频让人眼前一亮还是一黑？

[图片] [图片] [图片] [图片] [图片] 文案朱海歌郭安兰恭灏唐瑷祺覃容琳宣推王奕婷熊沁怡蒋雯菁主播张巍耀制作杨自齐 ↓↓微信↓↓ [图片] ↓↓微博↓↓ [图片] ↓↓节目表↓↓ [图片]

CUC广播台 2024-12-27

御海蓝桉 2024-12-27

铬矿粉325目-2500目的典型用途有哪些？

铬矿粉325目-2500目在颜料、耐火材料、铸造和耐火材料行业中用途非常广泛。200 目、325目、400 目铬铁矿粉通常用于玻璃瓶、玻璃板、玻璃管、玻璃配件中的绿色着色剂。1600 目、2000 目、2500 目铬矿超细粉适用于绿色、棕色、红色的油墨颜料。325 目铬矿粉是铸造涂料中良好的铸造防粘砂材料。200 目和 325 目铬矿粉适用于刹车中的摩擦材料。它是道路和地板的耐磨材料。600 目、800 目、1000 目和 1200 目天然铬矿粉是陶瓷釉料的原料。铬铁粉的特点是耐高

hxml1919 2024-12-27

【防尘喷淋】-山东艾蓝设计-系统厂家

【防尘喷淋，实际现场效果】物联网智能喷雾降尘系统自主开发，三屏合一远程控制智能喷雾降尘系统主机采用变频恒压控制，对大面积喷雾降尘区可分区域控制，单独启动任何一个区域与启动全部区域压力均维持均一恒定，喷雾降尘主机自带微米级过滤，具有自动补水和缺水停机保护功能。喷雾降尘主机带有吹扫功能可以很好的解决冬季结冰难题。型号：ALDLP-5Z、ALDLP-10Z、ALDLP-15Z。【防尘喷淋，使用场所介绍】采石场、建材厂，采石场以及建材厂在自动化输送系统以及堆料区、各种物料运输系统的转运点位置会产生粉尘飞散到

山东艾蓝环保 2024-12-27

勤源FinOps：政务云精准容量规划与智能扩展性设计

勤源FinOps：政务云精准容量规划与智能扩展性设计在如今高速发展的数字化经济中，政府的IT架构面临着前所未有的挑战。从内部在线办公到在线政务，几乎所有业务都需要在保证稳定性的同时，能够灵活应对流量激增和业务扩展。为此，容量规划和扩展性设计成为政府IT架构的关键组成部分，它们直接影响到系统的性能、可靠性和成本控制。勤源科技（江苏）基于其全链路智能运维的理念，为政府提供了一套全面的政务云云资源容量规划和扩展性设计方案。通过智能化的工具和自动化的操作，勤源FinOps（成本运营中心）可

勤源全链路运维 2024-12-27

丹品科普——可调混响时间听音室与音乐设备：紧密关联与发展前景

大家好，欢迎来到丹品科普揭秘。今天来了解一下可调混响时间听音室与音乐设备之间的紧密联系。先看当下，这听音室对提升音乐设备音质作用很大。就音箱而言，其音质好坏不光取决于内部零件，所处声学环境也极为关键，听音室就成了音箱研发的重要场地。工程师在研发时，把音箱搬进听音室，调节混响时间。模拟家庭聚会听流行乐场景，调短混响，音箱传出的流行乐鼓点清脆、节奏明快，歌手嗓音清晰，歌词清楚可辨；模拟古典音乐厅，拉长混响，交响乐弦乐颤音悠长、管乐和声醇厚，能让人仿佛置身高雅艺术殿堂。经反复调试，音箱的扬声器振膜、分频器等部

广州丹品和丹测声学 2024-12-27

声学新突破：定向音响技术的奥秘与应用场景

声音，作为一种波动现象，在我们的日常生活中扮演着重要角色。声学，作为物理学的一个分支，研究声音的产生、传播、接收和效应。近年来，随着科技的发展，定向音响技术作为声学领域的一个创新应用，正在逐渐改变我们对声音的传统认知。声学基础声音是由物体振动产生的声波，通过空气、固体或液体等介质传播，并被人或动物的听觉器官所感知。人耳能够识别的声音频率范围大约在20Hz到20kHz之间。声音的传播特性是四面发散的，这意味着在没有障碍物的情况下，声音会向所有方向传播。 [图片] 定向音响技术原理定向音响技术，也称为定

静境科技声学院 2024-12-27

让ChatGPT长“手”！Meta爆火新论文，让语言模型学会自主使用工具

推荐体验

相关资讯

让ChatGPT等模型学会自主思考！开创性技术“自主认知”框架

OpenAI最新论文，让超强模型自己解释自己

教 ChatGPT 学会使用工具 —— LangChain Agent 调研

ChatGPT自己会选模型了！微软亚研院＋浙大爆火新论文，HuggingGPT项目已开源

ChatGPT自己会选模型了！浙大+微软亚研院爆火新论文，HuggingGPT项目已开源

近期资讯

有事大家谈 | “小作坊下料就是猛”AI魔改视频让人眼前一亮还是一黑？

硬盘数据被移走了怎么办？如何恢复

建筑装潢垃圾分拣设备-垃圾分选生产线

生活垃圾分拣生产线：填埋场陈腐垃圾处理的绿色革命

2025新年好物大集合！这十大数码好物让你新年倍儿有面儿！

铬矿粉325目-2500目的典型用途有哪些？

【防尘喷淋】-山东艾蓝设计-系统厂家

勤源FinOps：政务云精准容量规划与智能扩展性设计

丹品科普——可调混响时间听音室与音乐设备：紧密关联与发展前景

声学新突破：定向音响技术的奥秘与应用场景

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响