10.如何让大模型回答更准确？RAG检索增强生成是个好办法

作者：人工智能大讲堂发布时间：2024-03-26

ChatGPT Copilot

在前面多轮对话聊天机器人中，为了得到更准确的回答，我们将历史聊天记录作为上下文传递给大模型，逐渐地，这种模式发展成为RAG，也就是检索增强生成。

像ChatGPT这类大模型，它的原理是学习训练数据的分布来生成新内容，在训练数据不足或者上下文不充分的情况下，就会产生幻觉，也就是胡编乱造；除了幻觉问题，如果你问它最近的新闻，它可能完全不知道，因为它的训练数据只包括一两年以前的。

为了解决这个问题，像Copilot或者Kimi Chat都会先搜索互联网，然后根据搜索内容进行回答，我们称这种模式为搜索增强生成。

除了搜索互联网数据，也可以搭建本地知识库，这种模式被称为RAG，或者检索增强生成。也就是让大模型基于本地知识库中的内容进行回答。

上面这张图展示了构成RAG的模块以及它们之间的交互。

我们使用llama-index这个开源库搭建知识库，其它与大模型交互的部分仍然使用langchain。

为了方便演示，我们使用鲁迅的《藤野先生》作为知识库中的内容，假设我们把txt放到了./data/tysir目录下。仅通过下面这几句代码就搭建好了知识库。

输出结果：

首先，我们通过一个叫做SimpleDirectoryReader的数据加载器加载目录，目录里面的每一个文件，都会被当成是一篇文档。

然后，我们将所有的文档交给了 GPTSimpleVectorIndex 构建索引。顾名思义，它会把文档分段转换成一个个向量，然后存储成一个索引。

如果不知道如何将文本段转换成向量，请回头看看下面这篇文章。

最后，把对应的索引存下来，存储的结果就是一个json文件。后面，我们就可以用这个索引来进行相应的问答。

结果：

要进行问答也没有几行代码，我们通过 GPTSimpleVectorIndex 的 load_from_disk 函数，可以把刚才生成的索引加载到内存里面来。然后对着Index索引调用Query函数，就能够获得问题的答案。可以看到，通过外部的索引，我们可以正确地获得问题的答案。

Query函数先计算"鲁迅先生在日本学习医学的老师是谁？"的Embedding向量，然后与index_mr_fujino.json中索引挨个计算余弦夹角。取出距离最近的索引内容作为context_str与用户问题query_str按照一定格式组织成prompt传递给大模型。

总结：

本文通过langchain和llama-index搭建了一个RAG系统。

相关资讯

杨大 2024-01-25

四、OpenAI之检索增强生成模型(RAG)

梁主任在办公室中翻看着黑8提供的文章，眉头微皱。虽然文章内容生动精彩，但他对其中提到的 OpenAI API 的功能还不够了解。于是，他决定和黑8进一步交流。梁主任：黑8，这篇文章写得不错，但我对

OpenAI

挑大梁 2024-03-27

人工智能|RAG 检索增强生成

简介现有的ChatGPT的大语言模型中，虽然它本身的功能已经非常强悍了，但是它依然存在一些致命的问题：偏见：大语言模型没有分辨好坏的能力，所以在回答问题的时候，如果不做任何调整，可能会返回一些不好的内容，比如性别歧视，种族歧视。幻觉：大语言模型有时候并不那么靠谱，返回的内容会让人觉得驴唇不对马嘴。包括信息也无法完全可信。信息过时：因为没有联网能力，那么代表着从 2023 年 x 月 x 日之后所有的信息，它都是不了解的。那么大模型 LLM 如何解决这些问题，使其生成的内容质量更高，就成了一个难题。而 RA

人工智能 ChatGPT 大语言模型

测吧测试开发 2024-07-24

10.如何让大模型回答更准确？RAG检索增强生成是个好办法

推荐体验

相关资讯

检索增强生成（RAG）：如何让AI大模型更懂我？

简介检索增强生成（RAG）

全面剖析检索增强生成 (RAG)

四、OpenAI之检索增强生成模型(RAG)

人工智能|RAG 检索增强生成

近期资讯

李继刚：当我们说「提示词」时，到底在说什么？

24年的独立游戏，被什么绑架了？

清华梁正教授：为什么AI替代不了人类？

IPO折戟后，芯片初创公司们“卖身”上市

《中国餐饮供应链指南2024》（设备用品及数字化篇）

2025 年的十个营销趋势

2024年大模型融资全景：最高800亿，独角兽洗牌，地方国资猛扑

没那么简单，就能找到，辞退的理由

大红看命，网红孵化“流水线”上的概率游戏

5毛钱帮过关，年轻人的小游戏代打又肝又穷

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响