Stable Diffusion零基础从入门到入土（保姆级教程）

作者：进击的阿钛发布时间：2023-06-22

前言

大家好，我是阿钛老师。最近一直在整合和AI相关的一些资源，接下来我打算做stable diffusion（以后简称SD）的系统课，目的是改善国内课程体系不完善的情况，这是现在的一个重中之重的问题，因为我发现网络上对于stable diffusion的相关课程都是各有千秋，但是又很难做到由点到线，由线及面的全方位的覆盖。对于高级一点的课程，我们只能通过阅读大量的国外的文章和教程一点点的去摸索，可能需要实验很多次才能达到理想的效果。对于入门一些的课程，网上资源虽然很多，但又过于零散，相对一些纯小白十分的不友好。很难不发现，至今仍有人再走我们走过的弯路，重复着我们的痛苦，比如基础教程中的软件安装到进阶教程中的dream booth模型训练。可以说，很多人是根本不懂电脑上的一些操作，更别说涉及到原理的什么AI算法、各种参数。只能盲人摸象在这个坑里越陷越深投入了大量的时间却得不到回报。

本教程首先通过最基本的软件的安装和使用，由浅入深的进行讲解，其次通过对模型的讲解，主要让大家了解必要的神经网络、SD模型炼制的基本原理。用最通俗易懂的语言帮助大家理解这些原理，从而高效的进行学习、研究。然后我还会讲解 dream booth、Lora、embedding的各种参数以及训练的方法。有些同学可能看到这些名词已经开始头疼了，看到这些晦涩难懂的名词甚至想要放弃了。阿钛老师在这里给大家打个预防针，既然大家决定来学这门课程，就一定要抱有必胜的信心。首先，涉及高等数学、线性代数、编程写代码的专业知识咱们不回去深入研究，其次不管你是学生、文职工作、美术相关专业、还是其他的不想关的专业、又或者那你是老板、投资人又不懂计算机，只要大家跟着我的这个课程一步一步的走，就一定能基本掌握其中的基本原理。给大家讲个亲身经历，我的弟弟是学体育专业、他看我一直在研究这个东西，就想跟我学，现在人家已经开始在教同学玩这个了。咱们以前经常开玩笑说人家数学不好就说，你数学是体育老师教的吧！可现在来看，体育老师不止会教数学哈。扯远了，扯远了。说这个主要想表达什么的就是说，咱们体育专业可以说跟这个AI绘画是没有什么太大的关系，你要非说有，那倒也能说出一些，咱们不去深究。既然咱们这么不相干的专业都能掌握这门技术，所以大家更应该充满信心去学习这门课程。

通过通俗易懂的语言和一系列相关的案例去讲解这些原理和参数，目的在于能够让大家快速的构建知识体系，确保绝大多数人不掉队都能赶上 A I 这趟快车，不会去深入研究专业的知识体系，所以大家不要纠结我讲的专业知识的深度太浅，如果想吐槽，那我也欢迎。

一、Stable Diffusion简介：

Stable Diffusion 是由 Comp Vis、Stability AI 和 LAION 共同开发的一个文本转图像模型，它通过 LAION-5B 子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文本，Stable Diffusion 就可以迅速将其转换为图像，它的特点是可以控制生成过程中的随机性和多样性，以及使用不同的采样器来优化生成效果。

起初Stable Diffusion被一个叫 Anlatan 的公司用在他们的NovelAI这个项目上。NovelAI是一个AI辅助小说创作平台，Stable Diffusion模型用于根据小说内容生成插图，是该公司的内部项目并未开源。但是该模型原始的机器学习训练数据来源与各个网络的免费资源，该公司却将其用于他们的付费服务，该行为一度引起争议。

2022年10月6日，NovelAI 发生了一起数据泄露，其服务源代码被泄露。泄露原因不明，传闻NovelAI服务器采用了弱密码，导致黑客攻击，模型数据被泄露。之后NovelAI被迫开源，逐渐在圈内火爆起来。

Stable Diffusion WebUI（Automatic1111）是一个图形化界面，可以让我们方便地使用Stable Diffusion来进行文本到图像（txt2img）和图像到图像（img2img）的转换。它提供了丰富的功能和设置选项，例如：

文本反转：根据图像输入，生成描述该图像的文本输出
文本加权和负文本：通过在文本中添加括号或减号，来增加或减少对某些词语的关注度
图像编辑：可以使用遮罩和裁剪功能，来对图像进行局部修改或重绘
图像增强和放大：可以使用GFPGAN和realESRGAN等技术，来提升图像的清晰度和分辨率
生成预览：可以实时观察生成过程中的图像变化
提示矩阵：可以使用竖线分隔多个文本输入，来生成多个图像输出的组合
词语种子：可以使用词语代替数字作为种子，来控制生成结果的随机性

这些基于 Stable Diffusion封装的Web Ui 开源项目，可以通过界面交互的方式来使用 Stable Diffusion。当然，国内也有很多大佬封装了很便利的傻瓜式整合包比如：秋叶一键整合包、星空一键整合包等......极大的降低了使用门槛。本文将以秋叶一键整合包为例进行教学讲解，带您逐步去了解AI绘画。

Stable Diffusion简单应用示例：（TxT2Img）

Prompt: In a cyberpunk city, a police car is on the street, raining, light effect, Simon Stalenhag, Ian McQue, Ghibli Studio, Beeple, Kaino University 在一个赛博朋克城市中，一辆警车在街上行驶，下着雨，灯光效果非常炫酷。这个场景可能是由Simon Stalenhag、Ian McQue、吉卜力工作室、Beeple或Kaino大学等艺术家或机构创作的。 Prompt: Glowing crystals in the depths of the black valley, Simon Stalenhag, Ian McQue, Ghibli Studio, Beeple, Kaino University, high-definition picture, unreal engine 黑暗峡谷深处闪耀着晶莹剔透的水晶，这个场景可能是由Simon Stalenhag、Ian McQue、吉卜力工作室、Beeple或Kaino大学等艺术家或机构创作的。这幅高清晰度的图片可能是使用虚幻引擎制作的。 Prompt: A silver mech horse running in a dark valley, in the night, Beeple, Kaino University, high-definition picture, unreal engine, cyberpunk. 一匹银色机械马在黑暗的峡谷中奔跑，夜晚里闪耀着光芒。这个场景可能是由Beeple或Kaino大学等艺术家或机构创作的。这幅高清晰度的图片可能是使用虚幻引擎制作的，属于赛博朋克风格。

二、Stable Diffusion的工作原理：

维基百科中的解释是：“Stable Diffusion由3个部分组成：变分自编码器（VAE）、U-Net和一个文本编码器。与其学习去噪图像数据（在“像素空间”中），而是训练VAE将图像转换为低维潜在空间潜在空间。添加和去除高斯噪声的过程被应用于这个潜在表示，然后将最终的去噪输出解码到像素空间中。在前向扩散过程中，高斯噪声被迭代地应用于压缩的潜在表征。每个去噪步骤都由一个包含残差神经网络（ResNet）中坚的U-Net架构完成，通过从前向扩散往反方向去噪而获得潜在表征。最后，VAE解码器通过将表征转换回像素空间来生成输出图像。”

三、安装与使用 Stable Diffusion ：

（一）Stable Diffusion web ui的部署主要有两种：

1、本地部署

2、云端部署

（二）如何判断自己得电脑性能是否能够流畅运行SD

Stable Diffusion是一个开源项目，完全免费，如今可以实现本地部署，在个人电脑上运行Stable Diffusion 。

虽然在本地运行的门槛虽然降低了很多，但是本地部署对电脑的配置是有一些要求的，接下来就讲一讲如何判断自己的电脑能不能使用SD web ui 。

（1）、首先在---任务栏，点击---鼠标右键，点击打开---任务管理器

（2）、打开任务管理器后，点击顶部菜单栏中的---性能，打开性能界面

（3）、点击下方 GPU 一栏。

第一步：查看这个位置的名字是否为 NVIDIA 开头，也就是我们所说的N卡、英伟达显卡，如果是AMD的显卡的话，那你使用SD 可能有些困难，建议您更换英伟达显卡的电脑或设备。

第二步：查看这一栏专用GPU内存中的两个数字，图中为 3.6/24.0GB 如果后面一个数字最小值建议大于等于4，如果低于4，那么您的设备可能运行SD会非常的困难。流畅使用，没有训练模型的需求，建议8GB。如需升级建议你找专业人士升级配置。

（4）、点击内存这一栏；

第一步：点击内存栏

第二步：查看这个位置的数值大小，最小值建议为8GB，流畅使用建议32GB，如果小于8建议你找专业人士升级配置。

（5）、查看自己显卡在SD绘图中的性能可以参考下图(以下统计数据由国外大神测试制作，仅为Windows系统下测试结果，理论上Linux系统性能更优，但考虑到大多数同学的操作系统为windows，所以不对Linux下的SD作介绍)

各型号显卡出图能力参考表

原文链接：https://docs.getgrist.com/3mjouqRSdkBY/sdperformance/p/1

（6）、最后避免后期的一些兼容性问题建议您使用windows10、windows11系统以获得稳定的使用效果。（需要重装系统请私信）

（三）开始本地部署之前得前置操作——环境配置

运行环境配置简单来说就是设置SD软件所需要得环境，打个比方，淡水鱼需要用淡水养殖才合适；而海水鱼则需要用海水养殖最为合适。那么对于计算机来说，软件就是鱼，运行环境就是水，用合适得水养合适的鱼，鱼也就能正常生长发育，同理安装了合适的运行环境的计算机，也能够让软件流畅的运行。那么，我们该如何检查或安装这个运行环境到我们的电脑呢？

（1）下载整合包

打开下面网盘链接，下载网盘中的“00.Stable Diffusion整合包”

网盘百度网盘https://pan.baidu.com/s/1Zi5M0MFT2kJ9rcDPreE8_Q?pwd=8888
提取码：8888123云盘

1.下载完后打开下载文件的文件夹，找到.环境搭建.rar——右键点击——1.环境搭建.rar——点击解压到1.环境搭建——等待解压完成。

2.解压完成后文件夹内会出现一个1.环境搭建文件夹，点击打开——1.环境搭建文件夹——获得三个安装包

（2）安装python

双击1-python-3.10.6-amd64.exe——点击打开第一个安装包——开始安装python

如果出现以下界面代表已经安装过python，请查看第一部位置的前两个数字是否为3.10，如果不是，建议执行第二步，点击Uninstall卸载当前版本。如果是3.10.xx版本则关闭此窗口。

2.如果是第一次安装，则会显示以下界面。点击下方两个方框——勾选Use admin privileges when installing py.exe和Add python.exe to PATH两个选项——然后点击——Customize installation

3.进入可选功能设置Optional Features——防止出现问题建议勾选所有选项——点击Next到下一步

4.高级选项设置Advanced Options——按图中提示勾选相应的

选项后——点击install

5.开始安装——出现进度条——安装完成后出现Setup was successful——点击Close关闭页面——python安装完成

（3）安装git

双击2-Git-2.39.2-64-bit.exe——打开Git安装包——一直点击Next——直到出现install按钮——点击install——开始安装git——等待安装完成后——点击Finish——关闭页面——GIT安装完成

（4）安装CUDA

按键盘的win+r按键（如图所示）——弹出运行窗口

在弹出的运行窗口内输入cmd——点击确认——弹出一个控制台窗口——输入nvidia-smi——按键盘Enter键

出现如下界面后——如图查看这个位置显示的数字——我的是12.1，代表我可以安装的CUDA的最高版本是12.1

复制链接https://developer.nvidia.com/cuda-toolkit-archive到浏览器，推荐用edge浏览器——打开链接（如图）——这里按上一步的提示，我选择的是11.8的版本——点击方框内区域到下一步

如图根据自己的系统选择——1选择电脑系统（一般选windows）——2默认选择x86_64——3选择电脑系统版本（根据自己的系统版本选择，我是win10就点第一个10）——4选择exe（local）——5点击Download开始下载CUDA安装包

下载完成后，找到下载的安装包打开——点击ok按钮

弹出NVIDIA安装程序——检查系统兼容性

没问题后会弹出许可协议——直接点击同意并继续

弹出的安装选项，选择自定义，点击下一步

把CUDA选一下，然后一直点击下一步，直到安装完成。

（5）安装VS Code

点击打开文件夹内的第三个安装包3-VSCodeUserSetup-x64-1.68.1.exe——点击我同意此协议——点击下一步

按图中勾选相应选项——点击下一步

点击安装——等待安装完成后关闭窗口

至此前置运行环境安装完成下面开始安装SD本体软件。

（6）安装SD本体软件

回到从网盘下载的两个压缩包的位置——右键点击第二个压缩包2.绘画文件.rar——点击解压到2.绘画文件.——得到2.绘画文件文件夹

（a）安装启动器运行依赖

点击打开2.绘画文件文件夹——双击打开启动器运行依赖-dotnet-6.0.11.exe——安装启动器运行的环境

点击下方安装按钮会自动安装，无需其他操作

显示安装成功后点击下方关闭按钮

（b）解压SD本体文件

找到刚才的2.绘画文件文件夹——点击打开

点击打开novelai-webui文件夹

右键点击novelai-webui-aki-v3.rar压缩文件——带年纪解压到novelai-webui-aki-v3——获得novelai-webui-aki-v3文件夹——记住这个文件夹的位置

（c）解压sd-webui启动器文件

找到刚才的2.绘画文件文件夹——点击打开

点击sd-webui启动器文件夹

右键点击sd-webui启动器.zip压缩文件——点击解压到sd-webui启动器——获得sd-webui启动器文件夹

打开sd-webui启动器文件夹——右键点击A启动器.exe文件——点击复制

打开刚才SD本体文件夹novelai-webui-aki-v3文件夹——在空白处右键点击一下——点击粘贴

点击替换目标中的文件

（d）签署协议

点击打开文件夹内的A用户协议.txt文件——在最后一行的地方按要求填写我已阅读并同意用户协议——注意开头和末尾不要有空格空行——填写完后点击右上角关闭——提示是否保存——点击保存

至此，关于SD的运行环境和本体软件都安装完成了。接下来点击打开A启动器打开软件开始使用。

（四）开始使用

双击A启动器文件启动SD启动器

近期资讯

畜禽粪污资源化利用方式有哪些?覆膜堆肥技术真的实用吗?

畜禽养殖过程中产生的粪便往往伴随着强烈的异味，并且其直接利用效率相对较低。许多养殖场在未进行适当处理的情况下，将这些粪便直接排放到周边的水渠和土地上，这不仅使得周边环境弥漫着恶臭，还造成了严重的环境污染。对于大型养殖场而言，由于粪便处理不当的问题更为突出，往往导致更为严重的环境污染和资源的极大浪费。我国作为畜牧大国，随着畜禽养殖规模的扩展，有机粪肥利用成为一大难题。①有机肥市场发展潜力巨大，但没有严格明确的条款约束，导致市场混乱且不规范。②畜禽粪污有机肥行业的技术发展相对滞后，核心技术缺乏，使得化肥利用率

中海环境 2024-12-25

佰师网：公务员备考经验分享，成功考生的备考心得

在公务员考试的激烈竞争中，每一位考生都渴望脱颖而出，实现自己的职业梦想。作为一名成功上岸的公务员考生，我愿意分享我的备考经验，希望能为正在备考路上的你提供一些启示和帮助。一、明确目标，制定计划首先，明确自己的目标至关重要。公务员职位众多，不同岗位的考试内容和难度各有差异。因此，在备考初期，我就根据自己的兴趣和职业规划，锁定了目标岗位，并详细了解了该岗位的考试要求、历年真题及分数线等信息。随后，我制定了详细的学习计划，包括每日的学习任务、每周的复习进度以及每月的模拟测试安排，确保每一步都朝着目标稳步前进

佰师网 2024-12-25

统一精准把握市场，开启绿色发展新征程

在当今时代，绿色发展已成为企业不可忽视的重要课题。统一作为一家具有前瞻性的企业，在过去的五年里，以敏锐的洞察力和精准的市场把握，积极践行低碳战略，全面统筹业务发展，开启了绿色发展的新征程。企业低碳战略的实施，不仅有助于减少对环境的影响，还能为企业带来降本增效的实际效益，具有重要的现实意义和长远价值。统一始终保持对行业趋势的敏锐洞察，及时捕捉市场机遇。通过深入研究行业动态和市场需求，明确了低碳发展的方向和目标。为了更好地推动低碳战略的实施，统一筹建了绿色低碳供应联盟。联盟成员包括供应商、合作伙伴等，通过

江江的科技生活 2024-12-25

MTK6765核心板_MT6765安卓核心板参数_联发科MTK模块开发

MTK6765安卓核心板是一款创新的高性能硬件，基于联发科的前沿八核处理平台精心设计而成。该核心板搭载的MTK6765 CPU采用先进的12纳米制造工艺，拥有八个核心，其中四个CORTEX-A53核心的主频可达2.3GHz，另四个CORTEX-A53核心则主频为1.8GHz。这种强大的架构使得其在处理能力上表现尤为突出，适合多种应用需求。 [图片] 在内存和存储方面，MTK6765核心板提供了灵活的配置选项，用户可以选择2GB+16GB、4GB+64GB和6GB+128GB的组合，支持NandFlash和

深圳市智物通讯科技 2024-12-25

网友：您好，非常感谢您抽出时间接受我们的采访。首先，请您简单介绍一下自己在市场营销领域的经历吧。徐嘉祥：你好，我从事市场营销工作已经超过十几年了。最初从基层的市场专员做起，参与过多个品牌的推广活动策划与执行，后来逐步晋升到市场经理、营销总监等职位，涉及的行业包括耐消品、科技、金融等，在不同的市场环境和产品类型中积累了较为丰富的经验。网友：在您看来，当下市场营销环境和过去相比，最大的变化是什么？徐嘉祥：变化非常显著。首先是数字化的全面渗透，互联网和移动技术让信息传播变得前所未有的迅速和广泛，消费者获取

徐嘉祥 2024-12-25

为确保精密空调系统的正常运行及高效制冷效果，定期检测精密空调制冷剂是否充足至关重要。下面简单聊一下如何检测精密空调制冷剂是否充足。检测精密空调制冷剂的准备工作： 1、安全防护：佩戴好个人防护装备，如安全眼镜、手套等，确保操作过程中的安全。 2、工具准备：准备好制冷剂压力表、温度计、制冷剂充注工具等必要设备。 3、系统检查：在检测精密空调制冷剂前，先对精密空调进行全面的外观检查，确保无泄漏点及异常现象。精密空调制冷剂压力检测： 1、连接压力表：将制冷剂压力表连接到精密空调的制冷剂充注口上，确保连接紧密无

汇智天源 2024-12-25