一:什么是Stable Diffusion
Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像
二:Stable Diffusion对我们的起到的帮助有什么?
Stable Diffusion 可以通过生成多样化、高质量的图像、修复损坏的图像、提高图像的分辨率和应用特定风格到图像上等方式,辅助视觉创意的实现。它为视觉艺术家、设计师等提供更多的创作工具和素材,促进视觉艺术领域的创新和发展,给我们无限的灵感。
三:Stable Diffusion目前在整个AI绘画领域与其它绘画软件的优势是什么?
1:Stable Diffusion是开源软件,完全免费。2:可以自行下载很多模型使用,也可以炼制自己的LORA,3:有很多程序员高手都可以上传自己的开发的插件,这让Stable Diffusion成长的非常快。4:Stable Diffusion可以精准的控制画面的输出结果。
四:Stable Diffusion目前在整个AI绘画领域与其它绘画软件的劣势是什么?
1:对电脑的配置要求很高,建议8G以上显存GPU要求高,否则会有部分功能无法使用。2:生成的图片跟质量与每个使用者对软件的掌握程度有很大的关系,如果大模型配合LORA不是很熟练,可能很难生成高质量的图。3:出图的速度跟数量也跟自己的电脑的显卡有很大的关系,否则出图的画面会崩坏。
但现在小编发现了国内一个Stable Diffusion on line,线上版,它现在完全免去了线上自己部署运行环境的烦恼,而且机器的配置很高,不用小伙伴自己再花大价钱配置电脑,感兴趣的小伙伴可以尝试一下https://ai.zhizhucloud.com/?inviteKey=MQDXug
说了这么多,现在咱们开始正式介绍Stable Diffusion的一些基础功能
1. 提示词:
提示词分为两个部分
正向提示词:
生成图像时,我们可以使用正向提示词来指定想要生成的图像。正向提示词可以是脑子里想到的图片或一句话,将其拆分成不同的关键词,并用逗号隔开作为输入。
需要注意的是,相同的指令在不同的模型库和参数下,生成的输出图像可能会不一样。此外,提示词的顺序也非常重要,因为它们的顺序会影响到生成图像的权重。通常情况下,越靠前的提示词权重越大,越靠后的提示词权重越小。
排除词:
输入框内输入的标签内容就是你画面中不想要出现的东西,如:低质量的,缺手指,五官不齐等等
2. 符号的使用
正如前文所述,词汇在提示中的位置越靠前,其所占的权重就越大。为了进一步调整提示关键词的权重,我们可以通过以下语法来设置关键词的权重:在选中关键词的同时,按下键盘上的 Ctrl+⬆️ ⬇️来快速调整权重。每次调整的权重值为0.1,建议将权重值控制在0.7-1.4之间。简单来说,将每个提示词看作一个独立的个体,权重默认为1,而后面的数值就相当于在修改这个默认值。当然,我们也可以将权重调整为负数,从而在提示中产生与原意相反的影响。
通过这种方法,我们可以更加精确地控制提示关键词的权重,以达到更好的提示效果。同时,我们也需要注意保持提示内容的流畅性和自然性,避免过度的修改导致提示内容的语义不连贯或不符合实际情况。
3. 图像的输出
画面的信息量取决于输出图片的大小。在全身构图中,一些细节,例如脸部、饰品和复杂的纹样,只有在较大的图像中才能得到充分的展示空间,如图像太小,脸部,手部,一些细节就会被压缩成一团,无法得到充分的表现,以下图的风景为例,当画幅越大时,展示的内容越多。
总结:1:同一个提示词指令,根据是否添加排除词汇,所展示的内容效果质量存在一定差距。当提示词过多时,它们之间会相互影响,此时我们需要通过排除词来进行细节上的把控,以获得更精准和优质的生成结果。2:对于那些写提示词没有什么头绪的小伙伴,我给大家提供一些思路,Stable Diffusion 中自带反推功能,可以通过将想要拆分的图像拖入反推,点击按钮来获得生成该图像的提示词,或者我们也可以借助CHAT GPT也是可以的。