Stable Diffusion新手完整入门指南（一）

作者：曦轩AI发布时间：2023-07-12

一：什么是Stable Diffusion

Stable Diffusion 是一种基于扩散过程的图像生成模型，可以生成高质量、高分辨率的图像。它通过模拟扩散过程，将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性，可以生成具有多样化效果和良好视觉效果的图像

二：Stable Diffusion对我们的起到的帮助有什么?

Stable Diffusion 可以通过生成多样化、高质量的图像、修复损坏的图像、提高图像的分辨率和应用特定风格到图像上等方式，辅助视觉创意的实现。它为视觉艺术家、设计师等提供更多的创作工具和素材，促进视觉艺术领域的创新和发展，给我们无限的灵感。

三：Stable Diffusion目前在整个AI绘画领域与其它绘画软件的优势是什么？

1：Stable Diffusion是开源软件，完全免费。2：可以自行下载很多模型使用，也可以炼制自己的LORA,3：有很多程序员高手都可以上传自己的开发的插件，这让Stable Diffusion成长的非常快。4：Stable Diffusion可以精准的控制画面的输出结果。

四：Stable Diffusion目前在整个AI绘画领域与其它绘画软件的劣势是什么？

1：对电脑的配置要求很高，建议8G以上显存GPU要求高，否则会有部分功能无法使用。2：生成的图片跟质量与每个使用者对软件的掌握程度有很大的关系，如果大模型配合LORA不是很熟练，可能很难生成高质量的图。3：出图的速度跟数量也跟自己的电脑的显卡有很大的关系，否则出图的画面会崩坏。

但现在小编发现了国内一个Stable Diffusion on line,线上版，它现在完全免去了线上自己部署运行环境的烦恼，而且机器的配置很高，不用小伙伴自己再花大价钱配置电脑，感兴趣的小伙伴可以尝试一下https://ai.zhizhucloud.com/?inviteKey=MQDXug

说了这么多，现在咱们开始正式介绍Stable Diffusion的一些基础功能

1. 提示词：

提示词分为两个部分

正向提示词：

生成图像时，我们可以使用正向提示词来指定想要生成的图像。正向提示词可以是脑子里想到的图片或一句话，将其拆分成不同的关键词，并用逗号隔开作为输入。

需要注意的是，相同的指令在不同的模型库和参数下，生成的输出图像可能会不一样。此外，提示词的顺序也非常重要，因为它们的顺序会影响到生成图像的权重。通常情况下，越靠前的提示词权重越大，越靠后的提示词权重越小。

排除词：

输入框内输入的标签内容就是你画面中不想要出现的东西，如：低质量的，缺手指，五官不齐等等

2. 符号的使用

正如前文所述，词汇在提示中的位置越靠前，其所占的权重就越大。为了进一步调整提示关键词的权重，我们可以通过以下语法来设置关键词的权重：在选中关键词的同时，按下键盘上的 Ctrl+⬆️ ⬇️来快速调整权重。每次调整的权重值为0.1，建议将权重值控制在0.7-1.4之间。简单来说，将每个提示词看作一个独立的个体，权重默认为1，而后面的数值就相当于在修改这个默认值。当然，我们也可以将权重调整为负数，从而在提示中产生与原意相反的影响。

通过这种方法，我们可以更加精确地控制提示关键词的权重，以达到更好的提示效果。同时，我们也需要注意保持提示内容的流畅性和自然性，避免过度的修改导致提示内容的语义不连贯或不符合实际情况。

3. 图像的输出

画面的信息量取决于输出图片的大小。在全身构图中，一些细节，例如脸部、饰品和复杂的纹样，只有在较大的图像中才能得到充分的展示空间，如图像太小，脸部，手部，一些细节就会被压缩成一团，无法得到充分的表现，以下图的风景为例，当画幅越大时，展示的内容越多。

总结：1：同一个提示词指令，根据是否添加排除词汇，所展示的内容效果质量存在一定差距。当提示词过多时，它们之间会相互影响，此时我们需要通过排除词来进行细节上的把控，以获得更精准和优质的生成结果。2：对于那些写提示词没有什么头绪的小伙伴，我给大家提供一些思路，Stable Diffusion 中自带反推功能，可以通过将想要拆分的图像拖入反推，点击按钮来获得生成该图像的提示词，或者我们也可以借助CHAT GPT也是可以的。