当前位置：首页|资讯

小钢炮技术教程03｜MiniCPM量化最佳实践

作者：OpenBMB发布时间：2024-09-27

｜原文章发布于2024年07月24日

🎉 好消息！小钢炮技术教程上架飞书社区首页与知识合集啦！后台回复“小钢炮”，可解锁「面壁小钢炮MiniCPM通关宝典」全文。

「面壁小钢炮MiniCPM通关宝典」会在接下来一段时间内持续上新，从技术拆解到部署推理到量化微调，手把手教你速通MiniCPM模型！

➤ B站配套视频，搭配食用更佳

🔗 https://space.bilibili.com/493282299/channel/collectiondetail?sid=3433564

今天，为大家带来的是「MiniCPM量化教程」

➤ 面向人群：有基本的bash和python基础

➤ 模型介绍：MiniCPM：揭示端侧大语言模型的无限潜力

➤ Github地址：https://huggingface.co/openbmb/MiniCPM-2B-sft-bf16

➤ 模型地址：https://huggingface.co/openbmb/MiniCPM-2B-sft-bf16

AutoAWQ 量化

➤ 设备要求：至少存在一张 Nvidia 20系以上显卡

➤ 量化2b需要6g显存，量化1b需要4g显存

1. 获取MiniCPM开源代码：

2. 获取MiniCPM模型权重，以MiniCPM-2b-sft为例：

3. 修改脚本配置参数：

在MiniCPM/quantize/awq_quantize.py 文件中根据注释修改配置参数：

4. 制作量化校准集：

根据选择的数据集，选择以下某一行代码替换 quantize/awq_quantize.py 中第三十八行：

5. 开始量化：

运行MiniCPM/quantize/awq_quantize.py，开始量化，完成后可得量化权重。

AutoGPTQ 量化

➤ 设备要求：至少存在一张 Nvidia 20系以上显卡

➤ 量化2b需要6g显存，量化1b需要4g显存

1. 获取Minicpm模型权重：

以MiniCPM-2b-sft为例：

2. 获取量化脚本：

由于Autogptq不再更新，这里获取分支代码。

3. 安装Autogptq分支：

4. 开始量化:

BNB 量化

➤ 设备要求：能够加载模型便足够量化

1. 安装bitsandbytes

2. 修改量化脚本参数

修改 MiniCPM/quantize/bnb_quantize.py 中以下参数

3. 更多量化参数可根据注释以及llm.int8()算法进行修改

4. 运行以下代码，执行量化

llama.cpp 量化

1. 下载llama.cpp

2. 编译llama.cpp

3. 获取MiniCPM的gguf模型

step1: 创建llama.cpp/models/MiniCPM路径

cd lama.cpp/model

smkdir MiniCPM

step2: 下载 MiniCPM pytorch模型所有文件(也可以是训练后的模型)并保存到llama.cpp/models/Minicpm

MiniCPM pytorch模型下载链接：https://huggingface.co/openbmb/MiniCPM-2B-sft-bf16

step3: 将模型转换为gguf格式

在这之前检查llama.cpp/convert-hf-to-gguf.py文件，如果class MiniCPMModel(Model)下存在：

将其替换为：

然后运行：

4. 将fp16的gguf文件进行量化

量化测试

➤ 设备要求：至少存在一张12g显存的Nvidia 20系以上显卡

1. 获取MiniCPM开源代码：

2. 命令行进入到 MiniCPM/quantize 目录下：

3. 修改脚本参数：

修改MiniCPM/quantize/quantize_eval.sh：

4. 开始测试：

5. 结果展示：

以下是笔者对1b模型进行量化测试的结果，包括内存占用，困惑度，计算时间：

pretrained model：MiniCPM-1B-sft-bf16gpu usage: 3.16GBPerplexity 8.574: 100%|████████████████████████████████████████████████████| 164/164 [00:11<00:00, 14.24it/s]

awq model：awq_cpm_1b_4bitReplacing layers...: 100%|███████████████████████████████████████████████████| 52/52 [00:03<00:00, 17.16it/s]gpu usage: 1.62GBPerplexity 8.828: 100%|████████████████████████████████████████████████████| 164/164 [00:28<00:00, 5.81it/s]gptq model：gptq_cpm_1b_4bitINFO - The layer lm_head is not quantized.gpu usage: 1.67GBPerplexity 9.121: 100%|████████████████████████████████████████████████████| 164/164 [00:09<00:00, 17.60it/s]bnb model：gptq_cpm_1b_4bitgpu usage: 1.42GBPerplexity 8.836: 100%|████████████████████████████████████████████████████| 164/164 [00:17<00:00, 9.49it/s]

➤ 欢迎加入 OpenBMB 社区一起讨论

后台回复“小钢炮”，解锁「面壁小钢炮MiniCPM通关宝典」全文。

官方网站

https://www.openbmb.org

GitHub

https://github.com/OpenBMBhttps://github.com/thunlp

长期开放招聘｜含实习

开发岗 | 算法岗 | 产品岗

交流QQ群

735930538

推荐体验

相关资讯

面壁智能完成新一轮数亿元融资，发布性能小钢炮 MiniCPM 第二弹

以小博大的励志故事不只发生在创业历史上，也发生在端侧大模型上。今年2月份，面壁智能正式发布了2B旗舰端侧大模型面壁MiniCPM，不仅超越了来自「欧洲版OpenAI」的性能标杆之作，同时整体领先于GoogleGemma2B量级，还越级比肩7B、13B量级模型，如Llama2-13B等。

AppSo 2024-04-11

经典小钢炮全面升级，ChatGPT上车，买到就是赚到

别着急，燃油钢炮的传奇车型大众高尔夫GTI刚刚迎来了改款升级，在这些当下所关注的方面，它的表现都还不错。这是最后的燃油高尔夫了，欲购从速无论怎么升级改进，我们都无法否认这将是最后一代的燃油GTI。好在在“油电…

一起去SUV 2024-02-05

性能小钢炮！iPhone SE 4将配A18芯片：支持Apple Intelligence

快科技8月12日消息，苹果公司计划于2025年推出支持AppleIntelligence的iPhoneSE4，预计将搭载至少A18芯片以支持全新iOS18.1的生成式AI功能。据悉，新款iPhoneSE4将支持AppleIntelligence，这是一套预计与iOS18.1一同发布的全新生成式AI功能。

苹果生成式AI

快科技 2024-08-12

一加 Ace 3V：中端市场的性能小钢炮，你值得拥有！

一加Ace3V还具备端侧AI算力，支持AIGC修图功能，让你的照片更加精美。亲爱的朋友们，一加Ace3V无论是在性能、存储、显示、拍照还是续航方面都表现出色。如果你正在寻找一款高性价比的手机，那么一加Ace3…

数码熙然 2024-05-15

赛博朋克小钢炮微星星影14 Air 2024笔记本评测

ChatGPT可能是2023年最火，最深入人心的AI应用之一。在不知不觉之间，AIGC（人工智能内容生成）已经悄然进入我们的生活，工作以及学习。这几天，央视公布了2024年春晚吉祥物，就是一条以AI技术加持的“龙辰辰”。而在动漫，游戏，影视，出版物等领域，通过AI生成的绘图，文案，甚至于脚本，分镜比比皆是。它们或通过AI进行打样，打底；或使用AI工具检查问题，辅助设计。近期，微星推出的星影14 Air 2024同样带来了优秀的AI机制。强劲的硬件性能、定制化的微星AI智能引擎、14寸轻薄个性的外观令这款游

ChatGPT AIGC 人工智能

科技视讯 2024-03-19

近期资讯

智己CEO开LS6秀漂移失败：根本漂不动、两次压到桩桶

快科技9月27日消息，不得不说，雷军确实引领了汽车圈，他去考赛照、秀漂移，不少汽车掌门人、高管也纷纷跟进，昨晚在新款智己LS6的上市发布会上，智己汽车CEO刘涛就在现场玩起了漂移，不过局面多

落木 2024-09-27

“我”在马栏山修复红色经典电影！这支师生团队以《风云儿女》献礼新中国75周年华诞

9月27日清晨，阳光洒满长沙学院，一场别开生面的“科文融合·经典焕彩”文化和科技融合创新成果展示活动在此拉开帷幕，同时启动了马栏山红色文化数字呈现工程的爱国电影校园巡映之旅。据悉，在马栏山（长沙）视频文创园管委会的大力支持下，长沙学院艺术设计学院已成功完成了《湘西剿匪记》（上、下）、《打击侵略者》及《风云儿女》四部红色经典影片的修复工作。

潇湘晨报 2024-09-27

姿正腔媛 | 朋友圈也“预制”了？该如何看待这个“圈”

继“精装的朋友圈VS毛坯的人生”火了以后，“预制朋友圈”成为新的热点，并在十一长假前夕，再度引起热议。有博主极限拍照6小时，喊出“拍预制朋友圈，享预制人生”口号时，也有人不解，“现在朋友圈也预制了”？

新华日报 2024-09-27

首颗，成功！

记者从国家航天局获悉，9月27日18时30分，我国在酒泉卫星发射中心采用长征二号丁运载火箭，成功发射首颗可重复使用返回式技术试验卫星——实践十九号卫星，卫星顺利进入预定轨道。

光明网 2024-09-27

AI企业出海主题沙龙活动在京举办。

9月26日，由香港大学中国商业学院、集智未来、启迪之星联合主办的“解锁全球机遇，共绘智能未来蓝图”AI企业出海主题沙龙活动在集智未来举办。活动旨在搭建一个交流与合作的平台，帮助AI企业更好地了解国际市场动态和用户需求，共同探索出海新机遇和挑战，推动全球AI产业的健康发展，助力国内AI企业出海腾飞。

北京商报 2024-09-27

话剧《钱学森》应邀赴香港演出上海交大师生演绎“两弹一星”精神

员高璐刘怡丹）“如果我的爱能对祖国有一点点贡献，我将百死不辞，毕生有幸！”9月25日至26日，“共和国的脊梁——科学大师名校宣传工程”剧目《钱学森》应邀赴香港演出，以艺术的形式弘扬科学家精神。据介绍，2012年，上海交通大学根据新中国“两弹一星”元勋、该校杰出校友钱学森的传奇经历改编了大型原创话剧《钱学森》。

央广网 2024-09-27

喜马拉雅将帮助平台创作者在Apple，在Apple播客分发付费内容

借助Apple播客，全球用户现在可以欣赏更多喜马拉雅优质音频内容，包括《蒙曼讲红楼梦》、《甄嬛传》、《秦朔朋友圈》、《雪中悍刀行》、《郭论1·2·3》、《长安十二时辰》、《长夜难明》等等精品内容。

福布斯 2024-09-27

智能家居的未来蓝图：科技与生活的和谐交融

引言：智能家居的崛起Introduction:TheRiseofSmartHomes随着科技的迅猛发展，智能家居已成为现代生活的一个重要趋势。智能家居不仅仅是技术的应用，更是一种全新的生活方式，旨在通过自动化和智能化的手段，创造更加舒适、安全和高效的生活环境。

新报观察 2024-09-27

从跟跑、并跑到领跑国产黑马倍思加速跑出iPhone速度

北京时间2024年9月10日凌晨1点，苹果秋季新品发布会准时举行，备受全球消费者瞩目的iPhone 16正式发布。据了解，相较过往产品，iPhone 16在续航及充电效率等方面带来了革新，通过电池能量密度

朝晖 2024-09-27

智己CEO刘涛：很多增程车不受充电站待见

快科技9月27日消息，昨日晚间，智己全新LS6上市，共推出5款车型，权益价售价区间21.69-27.99万元。在发布会后的媒体群访上，智己汽车CEO刘涛发表了对增程式车型的看法。刘涛称，未来智己也会

若风 2024-09-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1