当前位置：首页|资讯|AI聊天机器人|Alpaca|LoRA|OpenAI

[AI对话]模型推荐Nous-Hermes-13b+chinese-alpaca-lora

作者：coyude发布时间：2023-06-11

AI聊天机器人 Alpaca LoRA OpenAI

最近NousResearch/Nous-Hermes-13b模型比较火（至少TheBloke/Nous-Hermes-13B-GPTQ的下载量已经高达160K了）。该模型自称在各种任务中表现不亚于GPT-3.5-turbo，长回复、低幻觉率和缺乏OpenAI审查机制的优点。群友和我测试了下感觉也挺不错的。

模型介绍

160K下载量

重点是，昨晚有个群友尝试把chinese-alpaca-13b的lora和Nous-Hermes-13b融合在一起，成功了，模型的中文能力得到提升，有兴趣可以试试。目前该群友以上传融合后的模型请在hugging face上搜索： Bandifishing/Nous-Hermes-13b-Chinese

网址：https://huggingface.co/Bandifishing/Nous-Hermes-13b-Chinese

该模型是原版非量化模型，要加载的话建议启动bitsandbyts的load-in-4bit或load-in-8bit功能（懒人包的启动程序的设置页面有选项），不然会爆显存。

今早我查阅了Chinese-LLaMA-Alpaca的文档，也把chinese-alpaca-13b的lora和Nous-Hermes-13b融合了，并制作了ggml模型（适合在无独立显卡/A卡/显存不足）的用户使用。目前已先上传q5_1模式到hugging face上，

请在hugging face上搜索：coyude/Nous-Hermes-13b-Chinese-GGML

网址：https://huggingface.co/coyude/Nous-Hermes-13b-Chinese-GGML

目前还有8个版本的模型正在上传中。下午打算看看能不能转成GPTQ量化模型。

GGML模型可以使用显卡加速，大致流程在这个文档上：

https://github.com/oobabooga/text-generation-webui/blob/main/docs/llama.cpp-models.md

即打开启动器→更新管理→打开环境

依次输入那四条指令

随后在启动参数的追加参数一栏上加上--n-gpu-layers xxx

其中xxx代表分配到GPU的层数。

如果您有足够的VRAM，请使用高数字，例如--n-gpu-layers 200000将所有层卸载到GPU上。

否则，请从低数字开始，例如--n-gpu-layers 10，然后逐渐增加它直到内存耗尽。

借了一张群友的图，当提示检测到显卡时代表成功。

推荐体验

相关资讯

我只用一个命令行就跨设备运行了 Nous-Hermes-2-Mixtral-8x7B-SFT

轻量 2MB AI 推理APP 可完全跨平台运行，在自己的 Mac 试试吧！想要快速开始，只需在自己的设备上运行一个命令[1]即可在本地跑 Nous-Hermes-2 大模型。这个命令行工具会自动下载并安装 WasmEdge 运行时、模型文件和用于推理的完全可移植 Wasm 应用。Nous Hermes 2 Mixtral 8x7B SFT[2] 是 Nous Research 基于 Mixtral 8x7B MoE 大模型上训练的受监督微调模型。它接受了超过 1,000,000 个主要由 GPT-4

Second_State 2024-01-23

大语言模型之羊驼（alpaca-lora）评测

一起因之前的推文中有介绍了dolly（见大语言模型之dolly（ChatGPT平替版）评测,含安装说明哦！）。现在，介绍另一种大语言模型，alpaca-lora，其作为斯坦福开发的新的大预言模型，最近也因为可以在消费级显卡应用而受到关注。二正文2.1 克隆仓库与安装依赖首先，肯定是官方地址了https://github.com/tloen/alpaca-lora然后，读者只需要通过以下操作git clone https://github.com/tloen/alpaca-lora.gitpip ins

大语言模型 Alpaca LoRA ChatGPT GitHub

生信小院 2023-05-25

如何使用 Colab 训练 Alpaca-LoRa

主要参考视频《AI大模型训练-第四课 | 模型微调与数据安全：部署属于你自己的“大”语言模型》，介绍如何使用 Alpaca-LoRa 训练和部署模型。在训练过程中使用租借的 A100，总耗时2小时。

Alpaca LoRA AI大模型

不二先生123 2023-07-23

Stable Diffusion Lora New Chinese Style Suit V10

L0017axebro20230508MAGNET0437afc6b7fb021aa50c6038fbdb055dfe247c02

Stable Diffusion LoRA

秋月仍圆夜 2023-08-09

如何仅需几个步骤在您的设备上运行Alpaca-LoRA？

本文介绍了类似ChatGPT的平台Alpaca-LoRA以及如何在您的设备上运行它。

Alpaca LoRA ChatGPT

51CTO 2023-06-20

近期资讯

华为余承东：坐飞机时捂着口袋，担心被别人偷拍到自己的Mate 70

华为余承东：坐飞机时捂着口袋，担心被别人偷拍到自己的Mate 70IT之家2024-11-15 11:11发布于湖北IT之家官方账号IT之家 11 月 15 日消息，今天上午的广州车展期间，华为常

IT之家 2024-11-15

美国短剧市场揭秘：年产千部，导演薪酬差4倍、爆款演员日薪超千美元

美国短剧市场揭秘：年产千部，导演薪酬差4倍、爆款演员日薪超千美元钛媒体APP2024-11-15 10:17发布于湖北钛媒体APP官方账号全文5214字，阅读约需15分钟，帮我划重点划重点012

钛媒体APP 2024-11-15

手机芯片的“抢蛋糕游戏”：苹果吃掉最多的利润，海思获得最快的增长 | 钛媒体焦点

手机芯片的“抢蛋糕游戏”：苹果吃掉最多的利润，海思获得最快的增长钛媒体焦点钛媒体APP2024-11-15 09:57发布于湖北钛媒体APP官方账号全文1972字，阅读约需6分钟，帮我划重点

钛媒体APP 2024-11-15

腾讯ima.copilot上线Windows版本，个人知识库越用越懂你

腾讯ima.copilot上线Windows版本，个人知识库越用越懂你腾讯科技2024-11-15 11:13发布于北京腾讯新闻科技频道官方账号11月15日，继推出Mac版本不到一个月，腾讯出品的

腾讯科技 2024-11-15

联想CEO：联想将2025年个人电脑出货增速预测上调至两位百分数

联想CEO：联想将2025年个人电脑出货增速预测上调至两位百分数36氪2024-11-15 10:45发布于北京36氪官方账号联想CEO表示，联想将2025年个人电脑出货增速预测上调至两位百分数。

36氪 2024-11-15

小米新形态分区洗衣机是真听劝，但用户真的买单吗？

小米新形态分区洗衣机是真听劝，但用户真的买单吗？人人都是产品经理2024-11-15 10:17发布于广东人人都是产品经理的官方账号现在的套路越来越深了，连个洗衣机，都要分开来洗。这种需求，到底是

人人都是产品经理 2024-11-15

货架电商价值回归可能是今年双11最大看点

货架电商价值回归可能是今年双11最大看点人人都是产品经理2024-11-15 11:17发布于广东人人都是产品经理的官方账号今年双11，当新兴电商模式的光环逐渐褪去，货架电商以其稳健的增长和深厚

人人都是产品经理 2024-11-15

RAG实践篇（二）：这些年，我们在测试中踩过的坑

RAG实践篇（二）：这些年，我们在测试中踩过的坑人人都是产品经理2024-11-15 10:17发布于广东人人都是产品经理的官方账号RAG目前在企业级应用中是最优解，但实践中的坑点不少，今天分享我

人人都是产品经理 2024-11-15

巨量引擎推出“上市前营销洞察”

巨量引擎推出“上市前营销洞察”36氪2024-11-15 10:40发布于北京36氪官方账号36氪获悉，巨量云图推出“上市前营销洞察”产品，通过挖掘对标品类SPU的颗粒度，为新品上市前期提供人群成

36氪 2024-11-15

暴涨128%！电纸书销量暴涨128%，彩色墨水屏立功

暴涨128%！电纸书销量暴涨128%，彩色墨水屏立功雷科技2024-11-15 12:03发布于广东科技领域创作者全文2540字，阅读约需8分钟，帮我划重点划重点01洛图科技市场报告显示，202

雷科技 2024-11-15

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1