当前位置：首页|资讯|Hugging Face|微软|大语言模型|人工智能

HuggingGPT：借力 LLM 使用 Hugging Face 模型来解决复杂的 AI 任务

作者：InfoQ发布时间：2023-05-16

Hugging Face 微软大语言模型人工智能

作者 | Sergio De Simone

译者 | 平川

策划 | 丁晓昀

浙江大学和微软亚洲研究院的研究人员最近发表了一篇论文，探讨使用大型语言模型（LLM）作为控制器来操纵 Hugging Face 等社区中已有的人工智能模型。

这项研究背后的核心思想是使用 LLM（如 ChatGPT）的高级语言理解和生成能力将不同领域现有的 AI 模型连接起来。

具体来说，在接收到用户请求时，我们使用 ChatGPT 进行任务规划，根据 Hugging Face 社区提供的模型功能描述选择模型，然后使用所选的 AI 模型执行每一项子任务，并汇总执行结果生成响应。

研究人员宣称，他们的方法使解决语言、视觉、语音及其他领域的复杂人工智能任务成为可能。

为了在 ChatGPT 和 Hugging Face 模型之间建立连接，HuggingGPT 使用了 Hugging Face 库中的模型描述，并将它们提供给 ChatGPT 提示符。

这个过程的第一个阶段是 任务规划：ChatGPT 分析用户请求并将其分解为可以使用库中模型解决的任务。第二个阶段是 选择最适合规划任务的模型。下一个逻辑步骤是 执行任务并将结果返回给 ChatGPT。最后，ChatGPT 通过整合所有模型的预测来 生成响应。

在任务规划阶段，HuggingGPT 使用了任务规范（specifications）和示范（demonstrations）。一个任务规范包括 4 个槽，分别定义了ID、任务类型（如视频、音频等）、依赖关系（定义前置任务）和任务参数。示范将用户请求与任务规范序列关联在一起。例如，用户请求“In image /exp2.jpg, what is the animal and what is it doing?”会与一个包含 4 项任务的序列相关联：图像到文本、图像分类、对象检测以及最后的问题回答任务。

论文的 6 位作者表示，他们使用 HuggingGPT 进行了一系列实验，包括简单任务和涉及多个子任务的复杂任务。

HuggingGPT 以 ChatGPT 为中心整合了 Hugging Face 上的数百个模型，涵盖了文本分类、对象检测、语义分割、图像生成、问答、文本转语音、文本转视频等 24 项任务。实验结果证明了 HuggingGPT 在处理多模态信息和复杂人工智能任务方面的能力。

根据其创建者的说法，HuggingGPT 还有一些局限性，包括：效率和延迟，这主要与每个阶段都至少要和大型语言模型交互一次有关；上下文长度限制，这与 LLM 可以接受的最大词元数有关；系统稳定性可能因 LLM 偶尔不遵守指令而降低，也可能因为 LLM 控制的某个模型失败而降低。

原文链接：

https://www.infoq.com/news/2023/04/hugginggpt-complex-ai-tasks/

相关阅读：

一部手机就可运行，精通 Python 等 20 种语言！谷歌终于能与 OpenAI 打擂台了，全新 PaLM 2 比肩 GPT-4](https://www.infoq.cn/news/8rtmSJNmCIZauii2I7ju)

AIGC 在保险行业有哪些应用落地的可能性？](https://www.infoq.cn/article/vuj21tZF1q1qiB9zOQhw)

IBM 加入 AI 大战！发布生成式 AI 平台 watsonx，最早将于 7 月推出](https://www.infoq.cn/news/wAM6PJiYjiyyj3l2jt4x)

声明：本文为 InfoQ 翻译，未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网，获取更多精彩内容！

今日好文推荐

因低薪、高强度工作感到被公司“虐待”，一程序员跳槽前炮制惊天数据窃取案，勒索上千万终获刑

阿里取消 CTO 岗位；星火大模型“套壳”OpenAI？科大讯飞回应；近一半微软员工担心被 AI 抢饭碗｜Q资讯

“Type不值得！”前端框架Svelte作者宣布重构代码，反向迁移到Java引争议

谷歌终于能与OpenAI 打擂台了！全新PaLM 2比肩GPT-4：一部手机就可运行，精通Python等20种语言

推荐体验

相关资讯

HuggingGPT：借力LLM使用Hugging Face模型来解决复杂的AI任务

用LLM作为控制器来操纵Hugging Face等社区中已有的人工智能模型。

Hugging Face 人工智能

Sergio De Simone 2023-05-15

如何使用Hugging Face LLM DLC部署大型语言模型到Amazon SageMaker?

如何使用Hugging Face LLM DLC部署大型语言模型到Amazon SageMaker?[本文由亚马逊云渠道商[聚搜云] [www.4526.cn]撰写]一、介绍Hugging Fa

Hugging Face 大语言模型亚马逊

朱玲利 2023-08-18

LLM+模仿学习，解决真实世界中的复杂任务：AI2提出SwiftSage

GPT-4等大型语言模型（LLM）在许多推理任务上表现出色，然而，大部分现有研究仅关注静态环境下的任务，如回答问题或解数学题。那么，LLM能否在真实世界中完成复杂的交互式任务呢？进一步地，我们还可以将SwiftSage等模型视为一种利用LLM作为控制器或规划器，用于分解复杂任务并调用API工具。

GPT-4 大语言模型

机器之心Pro 2023-06-15

使用 Hugging Face 微调 Gemma 模型

来自 Google Deepmind 开放权重的语言模型 Gemma 现已通过 Hugging Face 面向更广泛的开源社区开放。该模型提供了两个规模的版本：2B 和 7B 参数，包括预训练版本和经过指令调优的版本。它在 Hugging Face 平台上提供支持，可在 Vertex Model Garden 和 Google Kubernetes Engine 中轻松部署和微调。Gemma 模型系列同样非常适合利用 Colab 提供的免费 GPU 资源进行原型设计和实验。在这篇文章中，我们将简要介绍如何

Hugging Face 谷歌

HuggingFace 2024-02-25

如何使用🤗hugging face的模型库?

🤖 开始你的Hugging Face🤗之旅: 快速上手快速熟悉 Hugging Face 的基本功能，并展示一些简单实用的例子

freecoder 2023-04-24

近期资讯

Rust同步代码中桥接异步代码

背景使用tracing透传trace_id的时候，为了能读取到span中写入的trace_id，最后只查到一种自定义Layer的方式，然后将当前Span的Id作为Key，上下作为Value，存放到M

用户469465159783 2024-12-26

[nodejs] RibbitMQ nodejs实践

最近突然对 RabbitMQ 产生了兴趣。虽然以前了解过消息队列的原理，但毕业后一直没有在实际项目中应用。最近有空闲时间，于是决定重新学习并记录过程，方便日后查阅，也希望能为社区的小伙伴提供一些参考。

37_Tse 2024-12-26

Java中抽象类和普通类的区别

在Java编程中，理解抽象类和普通类的区别是非常重要的。它们虽然都是用来定义类的结构和行为的，但在设计模式和面向对象编程（OOP）中扮演着不同的角色。

Huooya 2024-12-26

用 Cursor 写出第一个程序

大家好，我是汤师爷最近几个月，Cursor迅速走红，成为一款强大的编程助手。Cursor不仅使用简单，而且通过集成各种大模型技术，编程能力一流。 ## **Cursor是什么？** Curs

架构师汤师爷 2024-12-26

记录一次ceph的安装过程

Ceph 安装全攻略一、引言在当今的数据存储领域，Ceph 以其强大的分布式存储能力备受瞩目。无论是大规模的数据中心，还是对存储性能、可靠性有高要求的企业环境，Ceph 都能发挥关键作用。

苏奇伦 2024-12-26

HTML&CSS：手把手教你实现优雅的汉堡菜单图标

这段代码是一个 HTML 页面，它包含了内联的 CSS 样式，用于创建一个汉堡菜单图标，这个图标可以通过复选框控制显示和隐藏。点击获取更多演示效果 HTML&CSS HTML 结构 burger：定

前端Hardy 2024-12-26

语音识别在教育技术中的创新

语音识别技术在教育技术中的应用逐渐成为创新的关键点。通过将语音识别融入教学过程，可以提供更个性化、互动性强的学习体验。

数字扫地僧 2024-12-26

ES的分布式处理简析

本文对ElasticSearch的分布式处理做了一些简单的分析，主要集中在节点发现和master节点的选取这些流程，以帮助读者对ES的内部逻辑有进一步的了解。

sky_ph 2024-12-26

Three.js可视化系统课程WebGL

Three.js可视化系统课程WebGL Three.js矩阵Matrix4 Three.js 是一个基于 WebGL 的 JavaScript 3D 库，它允许开发者在网页上创建和显示 3D 图形。

用户67745296279 2024-12-26

Springboot 如何将本地jar包打入 jar包中的BOOT-INF\lib 目录下

要将本地 JAR 包打包到 Spring Boot 项目中，并确保它位于生成的 JAR 文件的 BOOT-INF/lib 目录下，可以通过以下几种方法实现。Spring Boot 使用 BOOT-IN

马艳泽 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1