当前位置：首页|资讯|清华|ChatGPT|文心一言|ChatGLM|GitHub

011. 清华大学 ChatGLM-6B 模型，支持本地部署

作者：姚千山发布时间：2023-03-29

清华 ChatGPT 文心一言 ChatGLM GitHub

前言

前有 ChatGPT，后有文心一言，最近几个月 AI 圈的产品可谓是爆发式发展。但这些语言大模型动辄需要上百 G 显存，对于个人电脑实在是负担不起。而近期由清华大学推出的开源对话 AI——ChatGLM-6B，最低只要 6G 显存，使得用户可以在大部分消费级的显卡上进行本地部署，为广大 AI 爱好者带来了福音。发布不过短短两周，Github 已有 9.8K Star，受认可程度可见一斑。

简单部署

1. 下载

首先需要下载源代码：

以及从抱脸上下载模型文件，可能需要较长时间：

将下载的模型文件目录 chatglm-6b 移动到源代码目录下的 THUDM/chatglm-6b 目录。

2. 使用

建立 Python 虚拟环境，并安装依赖库：

如果 Pytorch 和 CUDA 未安装，需自行下载安装。网上教程极多，不再多讲。

直接运行根目录下 web_demo.py 文件，即可使用。

默认情况下，模型以 FP16 精度加载，运行上述代码需要大概 13GB 显存。如果 GPU 显存有限，可以尝试以量化方式加载模型，使用方法如下：

运行成功后会自动打开一个由 Gradio 搭建的 http://127.0.0.1:7860 页面，即可使用。

体验效果

GPU 显存占用较高，本人电脑勉强能用：

占用显存

Web 部署

原始界面比较简陋，自己写一套新的界面，主要适配移动端。

后端

使用 FastApi 开发，支持流式响应：

前端

使用 Vue3 + Vant 开发，支持流式渲染输出：

界面效果

简单界面

由于时间和个人水平有限，界面其实写得并不很好。但主要功能包括流式输出已经实现，减少了等待时间，还是有一些使用价值。

至于 ChatGLM-6B 的使用效果，虽然离 ChatGPT 仍有差距，但对于一个只有 60 亿参数的小模型来说，已经很不错了。期待正在内测的 ChatGLM-130B 有着更好的表现。

推荐体验

相关资讯

清华大学开源中文版ChatGPT模型-ChatGLM-6B发布

ChatGLM-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua Universit

清华 ChatGPT ChatGLM

开比努尔 2023-03-31

电脑小白挑战本地部署ChatGLM-6B

观前提示：这不是一个教程，只是个人的使用经历，遇到问题的话也许Bing AI是比我更好的解决方案ChatGPT是去年爆火的一款语言模型，它实现了人类与AI的"对话"。ChatGPT是基于英文的语言环境训练的，我之前试玩的时候常常是用英语来进行对话的。最近，我了解到了还有一款由清华大学参与联合开发的对中文语言环境进行了优化的语言模型：ChatGLM-6B，有望解决我文案写不出来的问题ChatGLM-6B 是一个人工智能助手，基于清华大学 KEG 实验室与智谱 AI 于 2023 年联合训练的语言模型 GLM

ChatGLM ChatGPT 清华人工智能

C2H6S 2023-06-25

使用anaconda部署清华开源ChatGLM-6B

写在前面本人也只是一个计算机小白，写这篇文章的目的主要是记录自己折腾的过程。若是这篇文章能帮助到其他人部署的话我会非常开心。关于ChatGLM-6B ChatGLM-6B是一个基于GLM-130B模型的人工智能助手,通过GLM模型对语言进行处理,从而生成相应的回复。项目的主要特点是智能化回复和语言理解能力,能够对用户提出的问题和输入的文本内容进行理解和回答,可以理解为本地部署版的，资料更少的ChatGPT。关于显卡首先，确定一下我们是什么显卡。AMD显卡很难使用，我没有AMD显卡，所以我也不知道要如何

清华人工智能 ChatGLM ChatGPT

早夜初雪 2023-05-30

新手搭建ChatGLM-6B踩坑记录，有人说ChatGLM-6B可以达到ChatGPT的七八十，支持本地跑

使用指北最近AI很火，刷到Jack-Cui的视频，所以跟着视频和他的链接去做的，现在AI绘画已经有那种一键启动器了，所以我在搭建ChatGLM-6B这个之前已经搭建过了stable-diffusion-webui，当时搭建stable-diffusion-webui主要看的下面的文章和视频：搭建参考文章：AI绘画保姆级教程，革命性进展！ - 哔哩哔哩 (bilibili.com)视频：AI作画保姆级教程来了！逆天，太强了！_哔哩哔哩_bilibili所以总结起来AI相关的环境其实主要是cuda，anaco

ChatGPT Stable Diffusion ChatGLM Stable Diffusion WebUI AI绘画

我是ISFP呀 2023-03-20

2023-03-15 来聊下 ChatGLM-6B 清华大学开源版 ChatGPT 的使用感受

想必有不少人之前已经用过 ChatGPT 和 New Bing 了，但这两者都是闭源的，在使用上略有不便，接下来给各位读者介绍一个开源的类 ChatGPT 模型——ChatGLM-6B。

清华 ChatGPT ChatGLM New Bing

草梅友仁 2023-03-18

近期资讯

我的2024：裁员，退市，协和，副业，剑来；全赶上了！！

一点都不夸张，就是这么惊悚！这么刺激！裁员，退市，协和，副业，一个不落，全赶上了。大家看看，剑不剑来！

韦德说 2024-12-25

Windows蓝屏崩溃排查思路

Windows蓝屏崩溃排查思路前言之前电脑几乎是一天一次蓝屏，甚至有时候会是一天两次，很是苦恼现在换了新电脑，重新配置完环境，安装完之前的软件。发现还是蓝屏所以需要赶紧排查

懿瑾 2024-12-25

高效调试利器：IntelliJ IDEA 调试小技巧全解析

调试代码是开发过程中的重要环节，而 Intellij IDEA 提供了强大的调试工具，可以帮助开发者快速定位问题并优化代码。本文将介绍一些 Intellij IDEA 调试的小技巧，帮助你更高效地解决

Java移动技术栈 2024-12-25

探索鸿蒙的蓝牙A2DP与访问API：从学习到实现的开发之旅

在掌握了鸿蒙系统的开发基础后，我挑战了蓝牙功能的开发。通过Bluetooth A2DP和Access API，实现了蓝牙音频流传输、设备连接和权限管理。

李游Leo 2024-12-25

部署自己的git托管平台

如何使用docker部署git托管平台对于不同开源库的对比，可以根据自己的实际情况选择适合你的一款； https://docs.gitea.com/zh-cn/installation/compar

前端_库日天 2024-12-25

【性能优化】经常被忽视但是很有用的并发执行策略(CompletionService)

本文介绍与总结了经常被忽略的并发执行策略——CompletionService。实际上其有妙用：它可以实现异步任务的生产与消费的解耦，提高并发性能。本文提供了一些代码示例、源码分析和实践建议。

桦说编程 2024-12-26

我拉屎的时候，vscode还在自己写代码？

最近写了一个小玩具，能让你拉屎的时候 vscode 仍然表现出 coding 的状态，会不会让同事觉得很震惊，这个人不在，怎么电脑自己在写代码 hhh 插件叫做 vscode fake coding，

Simon_He 2024-12-26

Rust使用tracing记录日志

依赖介绍：概念介绍： tracing配置： main函数初始化配置使用span：同步方法使用span：输出：异步方法中使用span： async修饰的函数/方法不能手动 span.enter

用户469465159783 2024-12-26

从零开始学Java-Lambda

在现代编程世界中，函数式编程范式正变得越来越受欢迎。Java 8引入了Lambda表达式，为Java开发者提供了强大的函数式编程能力。Lambda表达式以其简洁、灵活和高效的特性，在Java开发中发挥

Fred_W 2024-12-26

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

C5GAME 通过采用云消息队列 RocketMQ 版 Serverless 系列，有效解决了现有架构中存在的性能瓶颈，极大增强了交易系统的灵活性和稳定性，有效实现了流量的削峰填谷，显著提升了整体运维

阿里云云原生 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1