当前位置：首页|资讯|AI大模型|LLaMA|GPT-4

通过Jan一键部署本地AI语言模型

作者：电工86发布时间：2024-02-23

AI大模型 LLaMA GPT-4

发现一个UI好看，使用方便的本地AI工具Jan，通过Jan用户可以一键部署开源的AI大模型比如Mistral，Llama还有基于Llama的零一万物或手动导入其他模型。也可以通过API Key访问GPT4。支持n卡加速，没有n卡也可以用纯cpu计算。

Jan可以在官网免费下载，支持win，苹果芯片的mac和linux。windows客户端为免安装的exe，自己打开即可，linux客户端提供了deb和appimage，deb安装snap报错的话可以用dpkg -i命令安装。我手上的mac mini才8g内存mac端就不折腾了。Jan官网地址https://jan.ai

Windows平台测试使用的硬件是i7 13700k和rtx 3090，内存64GB，显存24GB，cuda版本12.4.89。打开软件后再Advance Setting里可以打开N卡加速和设置文件地址。

左侧Hub中可以直接部署模型已经有很多，这里主要测试LlaMa 2 Chat 7B和Yi 34B。70B参数的LlaMa 2在吃完我所有内存和显存后直接报错。

Max Tokens直接拉满。开启N卡加速的情况下，LlaMa 2 7B只占用约8G显存，Token Speed来到了50/s，可以说非常快了，知识类提问回答质量还不错，但回答优先英语。

同样基于的LlaMa的零一万物中文支持明显更好。但由于参数更大，Token Speed只有约11/s，使用时吃满3090的24GB显存的同时，还吃了20GB+的内存。

Linux平台使用的是一台i5 8350U的笔记本电脑，内存16GB无独显。系统为Ubuntu 22.04。

受限于内存只能跑参数少些的模型，首先还是7B的LlaMa 2。

内存占用抛开系统开销其实只有3GB不到，比Windows平台的同模型略少，Token Speed当然低得多只有5/s左右，生成时间长了由于cpu降频，Token Speed会掉到4/s左右。同样回答内容为英文。

接下来换只有10亿参数的TingLlaMa。

参数降低之后Token Speed显著提升，来到20/s左右，内存占用也非常低只有1GB左右。TingLlaMa可以做中文回答。但是知识类提问的回答质量对比7B的LlaMa 2显著降低。

总得来说对于知识类的问题，有一台算力还不错，内存/显存够大的本地PC用本地AI大模型完全可以满足工作学习的大部分需求，即使是老笔记本运行低参数的本地大模型也不会有太大压力。最近的移动平台如骁龙8gen3也已经可以本地运行10B级大模型，也许AI很快就能标配到所有终端设备中。

推荐体验

相关资讯

AI绘画Fooocus 2.1汉化版一键安装本地部署无需魔法

在数字艺术的海洋中，Fooocus 2.1汉化版如一股清流，给AI绘画爱好者带来了新的创作可能。这款软件结合了Midjourney（MJ）的简洁操作和Stable Diffusion（SD）的技术优势，提供了一个既免费又高效的本地图像生成解决方案。汉化作者是：站大佬刁璐璐汉化。在这里感谢作者汉化。 [图片] #Fooocus 2.1汉化版 Fooocus 2.1的亮点特性简洁界面：Fooocus 2.1继承了MJ的用户友好界面，使得操作直观而简单，即便是AI绘画领域的新手也能快速上手。本地部署：不同

AI绘画艺术 Midjourney Stable Diffusion

木易毛毛 2023-11-17

最好用的AI绘画工具，Stable Diffusion 本地部署教程，免费、一键安装！

一、先将下载的Stable Diffusion 懒人一键部署包解压！二、解压后，在文件夹内找到”启动器运行依赖”，双击安装！三、文件内找到“A启动器”，双击打开！首次打开会自动加载一些必要程序。稍微等待！四、打开SD-WebUI 启动器后4.1，高级选项中选择生成引擎为你的N卡显卡、勾选云端页面汉化（适用于英文不好的小伙伴）4.2，版本管理中一键更新版本4.3，模型管理中下载/更新你需要的模型注意：在高级选项中，如果你选择不了你的显卡，可以尝试更新显卡驱动！A卡不能用五、一键启动点击右下角一键启动即可运行

AI绘画 Stable Diffusion Stable Diffusion WebUI

西安北大青鸟校区 2023-04-18

Colab一键部署Chilloutmix炼丹

最近Chilloutmix + Lora 生成人像挺火的，前两天也体验了一把。在两台机子上都部署了，一台rog gm501 ，显卡是满血1070那款，另一台m1 pro mbp，rog风扇呼呼的响，mbp效果不太行，还是上colab吧，毕竟白嫖16g显存，不用白不用啊。你别说速度比我这俩台机子快多了。添加了几个Lora，直接放链接：https://github.com/plsy1/stable-diffusion-webui-colab如果想自己加Lora，但是看不懂代码的，看着那一坨wget命令照葫芦画

Stable Diffusion Stable Diffusion WebUI 编程 LoRA

西子不来 2023-02-22

Stable Video Diffusion 本地一键整合包！

Stable Video Diffusion 本地一键整合包！Stable Video Diffusion是一种基于人工智能技术的模型，由初创公司Stability AI开发。它是基于之前发布的Stable Diffusion文本转图片模型的延伸，能够通过现有的图片生成视频。这款模型在AI领域具有很大的应用潜力，可以为用户提供更多创作和娱乐的可能性，支持：文本到视频图像到视频14 或 25 帧，576 x 1024分辨率多视图生成帧插值支持3D 场景通过 LoRA 控制摄像机Stable Video Di

人工智能 Stability AI Stable Diffusion LoRA

学术Fun 2023-11-25

川虎Chat本地一键整合包！

川虎Chat本地一键整合包！川虎 Chat Chuanhu Chat为ChatGPT等多种LLM提供了一个轻快好用的Web图形界面和众多附加功能支持 GPT-4基于文件问答LLM本地部署联网搜索Agent 助理支持 Fine-tune 开源项目地址https://github.com/GaiZhenbiao/ChuanhuChatGPT, 使用效果如下视频所示：https://xueshu.fun/3292/学术Fun将上述工具制作成一键启动包，点击即可使用，避免大家配置Python环境出现各种问题，下载

ChatGPT GPT-4 GitHub

学术Fun 2023-11-30

近期资讯

国网河北电力申请自激发再生骨料混凝土及其制备方法专利，提升自激发再生骨料混凝土的力学性能

金融界2024年12月25日消息，国家知识产权局信息显示，国网河北省电力有限公司经济技术研究院申请一项名为“自激发再生骨料混凝土及其制备方法”的专利，公开号CN119176706A，申请日期为2024年8月。

金融界 2024-12-25

重庆众德承模具取得连续模收料装置专利，实现金属材料平稳缓慢下落

金融界2024年12月25日消息，国家知识产权局信息显示，重庆众德承模具有限公司取得一项名为“一种连续模的收料装置”的专利，授权公告号CN222198682U，申请日期为2024年4月。专利摘要显示，本实用新型公开了一种连续模的收料装置，涉及连续模加工技术领域。

金融界 2024-12-25

青岛迈朗格智能制造有限公司取得一种分模装置专利，方便了对零部件进行分模

金融界2024年12月25日消息，国家知识产权局信息显示，青岛迈朗格智能制造有限公司取得一项名为“一种分模装置”的专利，授权公告号CN222198688U，申请日期为2024年3月。

金融界 2024-12-25

东莞市博钛泽金属制品科技公司取得一种金属冶炼压延模具专利，减少定模组件内模具取出难度

金融界2024年12月25日消息，国家知识产权局信息显示，东莞市博钛泽金属制品科技有限公司取得一项名为“一种金属冶炼压延模具”的专利，授权公告号CN222198687U，申请日期为2024年3月。专利摘要显示，本实用新型公开了一种金属冶炼压延模具，涉及模具技术领域。

金融界 2024-12-25

中材高新氮化物陶瓷申请一种大尺寸氮化硅陶瓷球阀阀芯专利，减少制备和使用中出现裂纹的情况

金融界2024年12月25日消息，国家知识产权局信息显示，中材高新氮化物陶瓷有限公司申请一项名为“一种大尺寸氮化硅陶瓷球阀阀芯及其制备方法与应用”的专利，公开号CN119176719A，申请日期为2024年11月。

金融界 2024-12-25

惠合影智能科技取得一种自动收取接料装置专利，节省劳动力

金融界2024年12月25日消息，国家知识产权局信息显示，惠合影智能科技（江苏）有限公司取得一项名为“一种自动收取接料装置”的专利，授权公告号CN222198685U，申请日期为2023年12月。

金融界 2024-12-25

青岛三诚众合取得平板断续伺服计数装置专利，有效解决现有技术问题

金融界2024年12月25日消息，国家知识产权局信息显示，青岛三诚众合智能设备科技有限公司取得一项名为“平板断续伺服计数装置”的专利，授权公告号CN222198683U，申请日期为2024年4月。

金融界 2024-12-25

包头钢铁集团取得用于矫直辊的锁紧装置专利，能对钢管矫直机矫直辊进行牢靠固定

金融界2024年12月25日消息，国家知识产权局信息显示，包头钢铁（集团）有限责任公司取得一项名为“一种用于矫直辊的锁紧装置”的专利，授权公告号CN222198593U，申请日期为2024年4月。

金融界 2024-12-25

重庆有诚取得一种立边折弯模具组件专利，将折弯结束后的加工件从模具内推出

金融界2024年12月25日消息，国家知识产权局信息显示，重庆有诚模具有限公司取得一项名为“一种立边折弯模具组件”的专利，授权公告号CN222198686U，申请日期为2024年3月。

金融界 2024-12-25

滁州美杰取得一种冲压成型机专利，提高冲压成型机工作效率

金融界2024年12月25日消息，国家知识产权局信息显示，滁州美杰精密部件制造有限公司取得一项名为“一种冲压成型机”的专利，授权公告号CN222198691U，申请日期为2024年5月。

金融界 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1