当前位置：首页|资讯

小钢炮技术教程05｜4G显存玩转MiniCPM RAG实战

作者：OpenBMB发布时间：2024-09-30

｜原文章发布于2024年07月29日

今天，为大家带来的是「MiniCPM RAG教程」 ➤ 模型介绍
🔗 MiniCPM：揭示端侧大语言模型的无限潜力 ➤ GitHub地址

🔗 https://github.com/OpenBMB/MiniCPM

➤ B站配套视频，搭配食用更佳
🔗 https://space.bilibili.com/493282299/channel/collectiondetail?sid=3433564

「面壁小钢炮MiniCPM通关宝典」会在接下来一段时间内持续上新，从技术拆解到部署推理到量化微调，手把手教你速通MiniCPM模型！公众号后台回复“小钢炮”，可解锁知识库全文。

简单说说RAG

RAG是什么

RAG指的是Retrieval-Augmented Generation，通过首先检索与query相关的文本，生成式语言模型llm再基于相关文本对query进行回复。

为什么需要RAG

大语言模型确实已经可以对很多问题进行回复，但是由于大语言模型llm仍然是基于历史数据进行训练的概率模型，因此对于训练过的问题可能有较为准确的答案，但仍存在幻觉问题。对于历史训练数据未提及或者实时性较强的问题，仅靠靠语言模型的概率生成容易出现胡说八道的问题。

因此，在给予大语言模型llm query的同时给予和query相关的背景知识，可以通过llm在历史数据中获取的context learning能力进行分析，这样可以获得更加可靠的回复。

说人话版：一个学霸（大语言模型）在原来思想政治、古代史、地理等等学科（历史数据）中拿到了优秀的分数，但是现在问他从没学过的近代史学科（query），学霸也难以获得高分。但是如果现在给他一本近代史的教材，并且告诉他答案在哪几页（Retrieval-data），学霸可以根据古代史等学科（历史数据）学习到的综合分析能力（context learning）获得一个好得多的分数。

RAG的基本流程是怎么样的

训练（或下载）一个用来Retrieval的模型，比如bge-base-zh，大部分Retrieval模型使用encoder模型进行对比学习进行训练获得,Retrieval模型的作用是将query和知识data编码成向量logits。
使用Retrieval模型对query和待召回文本data进行编码获得向量query_logit,向量data_logits.
使用query_logit和所有的data_logit计算相似度（大部分采用余弦相似度），取出前k个相似度高的data_logit对应的文本data_related。
对找到的和query高度相关的文本在进行rerank（optional）
将query和高相关文本data_related根据构建的prompt_template模版组合喂入大模型,获得最终答案。如下：

langchain_cpm_demo

Github地址：https://github.com/OpenBMB/MiniCPM/blob/main/demo/langchain_demo.py

1. 参数设置

2. 继承langchain.llm

继承后此处可适配langchain，传入langchain的各种llm接口，也可以使用vllm的后端推理：

3. 加载embeding模型（retrieval模型）

4. 对文本进行embedding

5. 找到与query相似度最高的k个文本

6. 定义prompt_tamplate

7. 定义langchain流程

首先将输入的query和高相关数据docs放入prompt这个模版中形成组合数据然后就会调用llm对组合数据进行推理，llm是继承langchain.llm的minicpm

8. 调用以上qa链

9. Gradio前端

10. 最低使用显存

已经是本次调用过程中最大使用显存

4G显存使用方法

1. 根据「MiniCPM量化教程」对「openbmb/MiniCPM-1B-sft-bf16」进行int4量化，推荐awq

2. 修改MiniCPM/demo/langchain_demo.py的以下参数：

3. 执行MiniCPM/demo/langchain_demo.py

速度优先方法

1. 使用非量化模型

2. 使用vllm作为后端

3. 将embeding模型放入gpu

4. 执行MiniCPM/demo/langchain_demo.py

➤ 欢迎加入 OpenBMB 社区一起讨论

后台回复“小钢炮”，解锁「面壁小钢炮MiniCPM通关宝典」全文。

官方网站

https://www.openbmb.org

GitHub

https://github.com/OpenBMBhttps://github.com/thunlp

长期开放招聘｜含实习

开发岗 | 算法岗 | 产品岗

交流QQ群

735930538

推荐体验

相关资讯

4G显存玩转AI绘画！Stable Diffusion WebUI Forge来了！

对于8GB显存GPU，生成速度可以有大约30%至45%的提升，GPU内存峰值下降约700MB至1.3GB，最大扩散分辨率将提升约2到3倍，同时最大扩散批次大小将增加约4到6倍。

AI绘画 Stable Diffusion WebUI Stable Diffusion

萤火架构 2024-03-25

聊聊AI绘画的本地部署(GPU 4G显存)

开源免费的AI绘画Stable Diffusion，终于本地部署成功了，稍微分享一下过程。一、效果描述双击启动脚本，几秒钟后，弹出一个网页。在文本框内输入一些提示词，然后点击Generate，等待几秒钟，即可生成相应的图片。二、设备笔记本电脑，英伟达的独立显卡，4G显存，Win10系统。 1、为什么需要独显我如果不用独显（只用CPU）大约4分钟画一个图，用独显只要不到8秒钟。 AI绘画可以固定种子，尝试不同提示词，生成整体相似而细节不同的图片，做各种微调。此时，分钟级的延迟就难以接受了。 2、显

AI绘画提示词 Stable Diffusion 英伟达

chuweifensi 2024-04-26

4G显存跑SDXL，老显卡迎来AI绘画大模型

SDXL刚刚发布的时候，对于小显存用户来说简直是一场灾难。我12G显存的3060动不动爆掉，很难心平气和的跑出满意的画面。好在stable diffsion是开源产品，很多开发者夜以继日的对程序进行优化。一边是comfyUI路线，大大减轻了显存压力，8G甚至6G显卡也可以跑图；一边是Fooocus路线，作者是ControlNet的创作者，在底层重构了跑图效率，实现了8G显卡快速跑图；以性能较差闻名的WebUI（作者用一块4090当然不愁性能），也在11月份进行了一次大的更新，大幅优化了显存使用，基本不再爆

铁华团的黄金船 2023-12-15

面壁智能完成新一轮数亿元融资，发布性能小钢炮 MiniCPM 第二弹

以小博大的励志故事不只发生在创业历史上，也发生在端侧大模型上。今年2月份，面壁智能正式发布了2B旗舰端侧大模型面壁MiniCPM，不仅超越了来自「欧洲版OpenAI」的性能标杆之作，同时整体领先于GoogleGemma2B量级，还越级比肩7B、13B量级模型，如Llama2-13B等。

AppSo 2024-04-11

4G显存低配畅玩AIGC！ControlNet作者新作：小白也能画大片

玩AI画画，现在终于不用担心被老黄刀法“背刺”了！只需要一块4年前的GTX 1650（显存4GB），AI出图效果堪比当前最好的开源模型SDXL。△图源：推特@ナビ这是最近在GitHub上连续

2023-08-26

近期资讯

YOLOv10s训练代码解析10：图像测试1

本专栏会手把手带你从源码了解YOLOv10(后续会陆续介绍YOLOv8、RTDETR等模型)，尽可能地完整介绍整个算法，这个专栏会持续创作与更新，大家如果想要本文PDF和思维导图，后台私信我即可(创作不易，不喜勿喷)，大家如果发现任何错误和需要修改的地方都可以私信我，我会统一修改。新建test.py [图片] 调动第四行初始化YOLOv10 (ultralytics/models/yolov10/model.py) [图片] YOLOv10继承自BaseModel类，继续做初始化 (ultralytic

Bestsongc 2024-09-28

关于SumatraPDF看漫画的[分割线]设置

就是看条漫时候把分割线去掉pc端上看漫画大多采用ComicsViewer，但是相比普通看图软件，只是多了书签管理等无关痛痒的功能。因此这类以文件夹形式存储的漫画用wps看图或者honeyviewer等普通看图软件就可以解决，只是没有书签管理等功能。因此在条漫阅读这一方面，用SumatraPDF能较好解决这点（tip：不过SumatraPDF只适合看pdf、cbz等单个文件，如果是针对文件夹中的多个图片就没办法）软件不大，很轻便如图，把连续阅读时的黑色分割线去掉。以cbz漫画为例图中例子的漫画名字是“小狐狸

蔚蓝萌新SG 2024-09-28

改装案例 | 奔驰GLC260改装MUC前轮MF631大六刹车卡钳套装

车型介绍 GLC260 乃奔驰旗下一款中型 MPV，其车身线条流畅自如，且蕴含着雄浑的力量感。前脸运用奔驰家族式设计语言，辨识度甚高。动力范畴，搭载 2.0T 涡轮增压发动机，具备上佳的动力表现。此款发动机能够赋予优良的加速性能与驾驶体验。与之匹配的是 9 挡手自一体变速箱，换挡平滑顺畅且响应敏捷，对提升驾驶的舒适性及燃油经济性颇有助益。车身结构采用 5 门 5 座 SUV 之设计，车身尺寸适度，既保障了车内空间的宽敞阔绰，又利于城市驾驶与停车。前置四驱系统，提供了出色的通过性与稳定性，不管是在城市道

MUC刹车卡钳 2024-09-28

心系国民图创新，青年成长正当时

2024届八省名校联考T8作文题《人民日报》副总编辑王一彪在一部优秀新闻文集的后记中，用三句话来概括这些文章的写作经验和切身体会：天安门上看问题，努力做到胸怀“国之大者”；田间地头找感觉，努力做到心里装着人民；鉴古学今求突破，努力做到笔端葆有乾坤。新闻写作的道理，对青年的成长也会有所启发。请写一篇文章，谈谈你对上述材料的思考和感悟。心系国民图创新，青年成长正当时昂首观穹宇，胸怀国之大者；俯身怜草木，心系生民黎庶；鉴古以突破，笔写时代波澜。揆诸新闻撰写之道，此言得之。而以吾观之，其中道理，又何尝不适合于青年

霜霂薪苇 2024-09-28

国庆内卷计划！108个python项目七天吃透它！

在国庆假期期间，选择完成108个Python项目是一个极具挑战性和收获的学习计划。这些项目不仅涵盖了Python的基础知识，还深入到了实际应用和进阶技能。以下是对这一计划的概述和建议：一、项目选择首先，确保所选的108个项目涵盖了Python的各个方面，包括但不限于：基础语法与数据类型：通过项目实践巩固Python的基本语法、数据类型（如整数、浮点数、字符串、列表、元组、字典、集合等）以及控制结构（如循环、条件语句等）。函数与模块：学习如何定义和使用函数，以及如何利用Python的模块系统来组织代

阿庆有点懵 2024-09-28

哈勃望远镜观测到黑洞光束增强恒星爆发

在一个出人意料的发现中，使用NASA/ESA哈勃太空望远镜的天文学家发现，位于一个巨大星系核心的超大质量黑洞喷射出的类似喷灯的喷流似乎会导致其轨迹沿线的恒星爆发。这些被称为新星的恒星并没有被捕捉在喷流内部，而是显然位于附近的危险区域。 [图片] 这一发现使寻找解释的研究人员感到困惑。“我们不知道发生了什么，但这是一个非常令人兴奋的发现，”美国斯坦福大学的主要作者亚历克·莱辛说。“这意味着我们对黑洞喷流如何与周围环境相互作用的理解中遗漏了一些东西。” 新星在双星系统中爆发，其中一颗老化、膨胀的正常恒星将氢气

开普勒186f 2024-09-28

2025款深蓝SL03正式上市，售价11.99万元起。

今日，深蓝2025款SL03正式上市，新车将推出增程与纯电两种动力，并增加了运动型新版本，以满足不同用户的个性化需求。此次上市新车共推出4款车型，售价区间为11.99-14.69万元。 [图片] 另外，在月27日-10月31日下订（支付定金），并在2024年11月30日24:00前提车（客户收车）的深蓝2025款SL03用户，均可享受八大驾趣礼。包括驾趣置换礼、驾趣金融礼、驾趣充电礼、驾趣互联礼、驾趣管家礼、驾趣用车礼、驾趣养车礼以及驾趣品质礼。 [图片] 外观方面，深蓝2025款SL03的整车设

辣车TV 2024-09-28

华为副总裁：全球 Top100 银行中有 53 家选择华为数据存储

华为副总裁周跃峰在2024中国算力大会上发表的演讲显示了华为数据存储服务的广泛影响力。截至演讲时，华为的数据存储技术已经为全球超过28,000家客户提供了服务，覆盖了150多个国家和地区。这些客户中，全球前100大银行中有53家选择了华为的数据存储服务。这一数据凸显了华为在金融行业的强大竞争力。周跃峰强调了中国半导体制造工艺在未来一段时间内可能面临的挑战，并提出基于实际可获得的芯片制造工艺打造的算力是长期可持续的。他认为，智能时代是数据的黄金时代，AI大模型、具身智能、AI for science等核心A

文言科技丶 2024-09-28

如何打造在线音乐网站？java springboot架构，vue前端开发

计算机毕业编程指导师计算机毕业编程指导师个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。大家都可点赞、收藏、关注、有问题都可留言评论交流实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！获取源码主页-->：计算机毕业编程指导师在线音乐网站-研究背景课题背景随着互联网技术的不断进步，数字音乐已成为大众文化生活的重要组成部分。在线音乐网站作为数字音乐传播的主要渠道，其用户体验和功能创新一直是业界关注的焦点。然而，目前市场上的

计算机毕业编程指导师 2024-09-28

星息 · IM开发团队创立招新

大家好，我是星息项目的创始人。我正在开发一个市面未有的项目，目前正处于设计与开发阶段，已经拥有主要发展方向。目前开发者本人的情况：由于本人已大四，最近考研压力紧张，需要全心用于考研，暂时无法继续开发项目的主要方向：IM系统（任何应用系统离不开IM，交流是应用保持活跃的根本）多元应用微App（任何人都能高效构建网页微app应用，即任何人都能构建自己的应用界面、应用功能、以及发布应用，每个人的微app都会开放给任何人使用。后期设想：无需SEO，只需我们推送、推荐、转发共享。技术上：面向C端的低代码，完

PANdeng攀登 2024-09-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1