Hugging Face x LangChain: 全新 LangChain 合作伙伴包

作者：HuggingFace发布时间：2024-05-29

我们很高兴官宣发布 langchain_huggingface，这是一个由 Hugging Face 和 LangChain 共同维护的 LangChain 合作伙伴包。这个新的 Python 包旨在将 Hugging Face 最新功能引入 LangChain 并保持同步。

源自社区，服务社区

目前，LangChain 中所有与 Hugging Face 相关的类都是由社区贡献的。虽然我们以此为基础蓬勃发展，但随着时间的推移，其中一些类在设计时由于缺乏来自 Hugging Face 的内部视角而在后期被废弃。

通过 Langchain 合作伙伴包这个方式，我们的目标是缩短将 Hugging Face 生态系统中的新功能带给 LangChain 用户所需的时间。

langchain-huggingface 与 LangChain 无缝集成，为在 LangChain 生态系统中使用 Hugging Face 模型提供了一种可用且高效的方法。这种伙伴关系不仅仅涉及到技术贡献，还展示了双方对维护和不断改进这一集成的共同承诺。

起步

langchain-huggingface 的起步非常简单。以下是安装该软件包的方法:

pip install langchain-huggingface

软件包地址：https://github.com/langchain-ai/langchain/tree/master/libs/partners/huggingface

现在，包已经安装完毕，我们来看看里面有什么吧！

LLM 文本生成

HuggingFacePipeline

transformers 中的 Pipeline 类是 Hugging Face 工具箱中最通用的工具。LangChain 的设计主要是面向 RAG 和 Agent 应用场景，因此，在 Langchain 中流水线被简化为下面几个以文本为中心的任务: 文本生成 、 文生文 、 摘要 、 翻译 等。

Pipeline 文档：https://hf.co/docs/transformers/main_classes/pipelines

用户可以使用 from_model_id 方法直接加载模型:

也可以自定义流水线，再传给 HuggingFacePipeline 类:

使用 HuggingFacePipeline 时，模型是加载至本机并在本机运行的，因此你可能会受到本机可用资源的限制。

HuggingFaceEndpoint

该类也有两种方法。你可以使用 repo_id 参数指定模型。也可以使用 endpoint_url 指定服务终端，这些终端使用无服务器 API，这对于有 Hugging Face 专业帐户或企业 hub 的用户大有好处。普通用户也可以通过在代码环境中设置自己的 HF 令牌从而在免费请求数配额内使用终端。

无服务器 API：https://hf.co/inference-api/serverless
专业帐户：https://hf.co/subscribe/pro
企业 hub：https://hf.co/enterprise

该类在底层实现时使用了 InferenceClient，因此能够为已部署的 TGI 实例提供面向各种用例的无服务器 API。
InferenceClient：https://hf.co/docs/huggingface_hub/en/package_reference/inference_client

ChatHuggingFace

每个模型都有最适合自己的特殊词元。如果没有将这些词元添加到提示中，将大大降低模型的表现。

为了把用户的消息转成 LLM 所需的提示，大多数 LLM 分词器中都提供了一个名为 chat_template 的成员属性。

chat_template：https://hf.co/docs/transformers/chat_templated

要了解不同模型的 chat_template 的详细信息，可访问我创建的 space！

Space 地址：https://hf.co/spaces/Jofthomas/Chat_template_viewer

ChatHuggingFace 类对 LLM 进行了包装，其接受用户消息作为输入，然后用 tokenizer.apply_chat_template 方法构造出正确的提示。

上述代码等效于:

嵌入

Hugging Face 里有很多非常强大的嵌入模型，你可直接把它们用于自己的流水线。

首先，选择你想要的模型。关于如何选择嵌入模型，一个很好的参考是 MTEB 排行榜。

MTEB 排行榜：https://hf.co/spaces/mteb/leaderboard

HuggingFaceEmbeddings

该类使用 sentence-transformers 来计算嵌入。其计算是在本机进行的，因此需要使用你自己的本机资源。

sentence-transformers：https://sbert.net/

HuggingFaceEndpointEmbeddings

HuggingFaceEndpointEmbeddings 与 HuggingFaceEndpoint 对 LLM 所做的非常相似，其在实现上也是使用 InferenceClient 来计算嵌入。它可以与 hub 上的模型以及 TEI 实例一起使用，TEI 实例无论是本地部署还是在线部署都可以。

总结

我们致力于让 langchain-huggingface 变得越来越好。我们将积极监控反馈和问题，并努力尽快解决它们。我们还将不断添加新的特性和功能，以拓展该软件包使其支持更广泛的社区应用。我们强烈推荐你尝试 langchain-huggingface 软件包并提出宝贵意见，有了你的支持，这个软件包的未来道路才会越走越宽。

英文原文: https://hf.co/blog/langchain
原文作者: Joffrey Thomas，Kirill Kondratenko，Erick Friis
译者: Matrix Yao (姚伟峰)，英特尔深度学习工程师，工作方向为 transformer-family 模型在各模态数据上的应用及大规模模型的训练推理。

Hugging Face x LangChain: 全新 LangChain 合作伙伴包

源自社区，服务社区

起步

LLM 文本生成

HuggingFacePipeline

HuggingFaceEndpoint

ChatHuggingFace

HuggingFaceEmbeddings

HuggingFaceEndpointEmbeddings

推荐体验

相关资讯

Hugging Face全面拥抱LangChain：全新官方合作包

谷歌云和Hugging Face建立新的战略合作伙伴关系

Hugging Face 表情包来啦！

langchain

微软首席合作伙伴官：合作伙伴将获得更多生成式AI资源

近期资讯

掌握iPad屏幕录制技巧，轻松记录生活与工作瞬间

掌握iPad截图与录屏技巧，让你的数字生活更高效便捷

抖音客服联系指南：解决常见问题的有效方法与注意事项

掌握标准正态分布表：轻松计算概率的实用指南

如何轻松打开RAR文件：实用方法与技巧分享

如何选择和操作游戏机，享受健康游戏乐趣

如何高效查询公交车实时位置与到达时间的多种方法

掌握抖音录屏技巧，让你的精彩瞬间轻松记录与分享

掌握喇叭线接法，提升音响音质与设备使用寿命的技巧与注意事项

定期清理手机存储空间，提升使用体验与性能的实用指南

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响