Stable Diffusion 快问快答

作者：一点十六发布时间：2023-03-29

01、Stable Diffusion 是什么？

是一款开源免费的AI绘画工具，可以文生图，也可以图生图。

02、Stable Diffusion 的同类产品还有哪些？

同类产品只关注 Midjourney、DALL-E2 就好了，其他的要么没开放，要么效果一般，要么基于SD二次开发。

03、想要简单的试用一下 Stable Diffusion

那可以先不在本地安装，试下在线版本：

https://beta.dreamstudio.ai/generate?from=%2Fdream

https://dreamlike.art/create

04、stable-diffusion-webui 是什么？

Stable Diffusion 安装到本地的交互界面，开源免费，现在大部分用的就是这个，但这套界面技术大于设计，交互体验是有很大进步空间的。优势是拓展性很好，可以整合好多其他功能。

https://github.com/AUTOMATIC1111/stable-diffusion-webui

05、stable-diffusion-webui 的主要功能？

最好直接看开发者的Wiki：

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features

06、如何本地安装？

webui安装类教程很多，很容易找到；

如果懒得自己安装，可以选整合包，比如秋叶同学的，解压即用，还无私免费。

安好webui之后，记得还要自己安装模型，之后才能正常使。

07、本地安装对电脑配置有啥要求？

1、显卡要好，显存要大；

2、硬盘自然也是固态的好，但是机械的问题也不大，无非是读盘慢点儿；

3、对MAC用户不太友好。

08、模型是啥？

文字转化为图像的核心模块，生成图片主要靠它，不同的模型生成的类型会不一样。

09、去哪儿下载模型？

简单贴几个网站，模型看好了最好下载到本地，因为搞不好作者就删库跑路了

1、https://huggingface.co/models

2、https://civitai.com/

3、http://www.123114514.xyz/

10、stable-diffusion-webui怎么用？

简单流程就是：选好模型，输入正反描述词，然后点击生成就可以了，抽卡似的，抽到满意的为止。

11、Stable Diffusion 背后的工作原理是什么？

潜空间扩散模型，就是对着一团噪声图，不断的降噪，最后获得清晰图像。好像一两句也说不清，为此专门出了一期视频：

12、影响webui绘图结果的主要因素有哪些？

影响力排序：描述词 > 模型选择 > 随机种子 > 画面尺寸 > CFG > 采样方法 > 采样步数

13、各个配置项都是什么意思？

1、描述词控制生成的内容：要画什么东西；

2、模型影响生成的风格、类型：照片、插画、动漫；

3、随机种和尺寸影响生成的画面结构：主要是构图，姿势，样貌等；

4、CFG影响描述词的相关性大小：是让AI放飞自我，还是言听计从；

5、采样方法和步骤影响生成画面的细节：影响较小。

14、怎么控制每个描述词的权重？

1、从前往后，权重递减；

2、加括号可以单独控制权重，以下为简单示例：

Prompt = (Prompt:1)

(Prompt) = (Prompt:1.1)

[Prompt] = (Prompt:0.9)

15、常见的模型有哪些种类？

1、官方模型

Stable AI 花几十万美刀，从数亿图片上训练的大模型，范围非常广，但不太易用，如：SD 1.5、SD 2.1等；

2、微调模型

用Dreambooth技术在官方模型基础上，继续训练的第三方模型，一般有着明确的创作类型，如：摄影、插画、动漫；

3、小模型

Lora、Embedding（Textual Inversion）、Hypernetwork等，需要和大模型配合使用，一般有着更明确的图像特征，如：各类角色，风格的小模型；

4、VAE

潜空间图像编码的解码器，一般内置，也可以替换，单说结果的话，对色彩倾向的影响大一点儿；

16、ckpt格式和safetensors格式的模型有啥区别？

对使用来说，没啥区别，但safetensors格式可以防止Pickle反序列化攻击，更安全一点。

17、模型越大越好吗？

体积大不一定效果好，但一定会增加电脑负担。

18、模型的不同版本差异？

一般是更新了训练集，微调了细节表现，但目前不一定新版就比旧版的效果好，可能时间跨度再大一点，新版和旧版的差距会更明显吧。

19、如何自己训练模型

自己弄，挺耗电脑性能的。

练微调模型，搜Dreambooth插件；练Lora，搜kohya_ss；练Embedding，webui就可以。

20、最快的上手方法？

最快的学习方法依然是模仿，搜罗一些优秀的作品，看人家是怎么写提示词，设置参数的。

21、如何更精确的控制？

很难，虽然有插件帮忙，但也很难。

AI总有自己的想法，咱们或许可以转变下身份，从执行者，转变为决策者，给它自由度，只保留最终决策权。

22、要不要学一下AI生成？

新技术了解下自然是好的，但：千万不要被割韭菜！千万不要被割韭菜！千万不要被割韭菜！

23、AI有审美吗？是否会遵循形式美的法则？

目前来看，AI是懵懂的，依靠训练时图像的文字标签来识别画面，自己是不太理解美丑，对错的。

24、AI 绘画怎么应用到商业流程中去？

可以用来找灵感；可以用来出草稿；可以用来生成素材；

如果直接用于最终结果的生产，目前来说仍然有些激进。

25、会侵权吗？

如果明确的去复刻真人的样貌，那指定是侵犯人家肖像权；

如果对着别人原作，在内容，风格，色彩等多方面，1：1的抄，那也会侵权；

但如果只是参考借鉴，应该就很难构成侵权了；

抄袭和参考的界限，就还挺模糊的，需要自己把控，对得起职业操守。

故障、错误修复

01、整体结构、比例错乱

1、使用反向提示词，排除错误的结构；

2、使用controlnet插件，再引入一张图片，来纠正结构比例；

3、不管这个了，再多生成几张

02、人脸部结构错误

勾上Restore faces。

如果报错，估计是人脸修复模型没安好，可以找到对应文件夹，把下一半儿的模型删了，再点击生成，就会重新下了，要视网速等待一段时间。

模型文件夹：stable-diffusion-webui\models\Codeformer

03、生成了俩脑袋的问题

1、反向提示词写上：bad anatomy, bad proportions, 之类的，补救下；

2、修改画面比例，越接近正方形，越容易避免俩头的问题；

3、保持比例，但是输出全身像，再裁剪出需要的比例；

04、手指错乱

1、躺平，不画手了，手本来就很难画；

2、合上去一个正确的手，然后使用controlnet插件处理

3、在反向提示词中输入手的提示：extra limbs, bad hands,之类的；

目前SD技术上的不足

01、做不到精细的控制

抽卡模式很不可靠，精细处的调整还是需要人工；

难以预估，也有可能抽俩钟头都没满意的。

02、作品同质化

生成技术的廉价，必然会带来同类型产品的泛滥；

03、受限于训练集

没练过的不会画，倒也不是不能画，而是会乱画；

04、可能会不知觉的侵权

如果用了来路不明的模型，可能会抄袭到某位原作者；

05、描述词不支持中文输入

嗨，怪就怪冯诺依曼老爷子是歪果仁；

06、描述词对自然语言的理解也不太好

不然，大家也不会管描述词叫“咒语”了，目前的描述词状态就很不智能。

07、画面之外的抽象感觉无法控制

连语言都难以描述，它自然也无能为力。

近期资讯

霍尼韦尔第七次亮相进博会，100余项创新展品刷新纪录

2024年11月4日，全球高科技企业霍尼韦尔（纳斯达克代码：HON）以“创新质赢未来”为主题亮相第七届中国国际进口博览会（以下简称“进博会”）。霍尼韦尔展台位于技术装备展区3号馆B4-05展位，聚焦自动化、未来航空和能源转型三大发展趋势，全方位展示该公司在智能制造、智慧建筑、航空交通、能源转型等领域的创新技术、产品和应用。

观察者网 8小时前

华为最强影像旗舰！曝Pura 80系列明年5月登场

快科技11月8日消息，博主数码闲聊站暗示，华为Pura80系列会在5月份发布，这将是华为最强悍的影像旗舰。一直以来，Mate系列定位是商务旗舰，Pura系列（P系列）定位是影像旗舰。

快科技 8小时前

“智能换脸”引恐慌，生成式AI面临三大风险

以ChatGPT、Sora为代表的生成式AI（人工智能）技术，基于其强大的学习能力与内容生成能力，成为推动新一轮产业升级的核心技术工具。

财经杂志 8小时前

2024网聚美好安徽丨蚌埠：打造商业航空新赛道

2024年6月23日，酒泉东风发射场，我国首次10km级别飞行－回收试验取得圆满成功。11月8日，“2024网聚美好安徽·勇闯改革新路”采访团来到了发动机的研发企业九州云箭。安徽九州云箭航天技术有限公司是一家以提供商业火箭动力产品配套服务为主营业务，具备液体火箭发动机从设计、生产、装配、试验到发射场测试全链条研制经验和工作经历的公司。

千龙网 8小时前

懂王归来，科技大佬站队，立冬养阳？这周你搜狐号了吗？

本周热点轮番登场，这个初冬并不平凡1、那个男人又回来了！2、科技大佬纷纷站队？3、入冬了，台风还没完没了？4、立冬养生正当“食”如何让我们知道你的精彩文章？如何获得流量券瓜分百万流量池？

搜狐号 8小时前

2024深圳国际眼镜（智能穿戴）设计大赛不服来战！

“镜启未来·艺数共生”，2024深圳国际眼镜(智能穿戴)设计大赛现正面向全球征集作品。本次大赛以眼镜产业为线索，穿插智能穿戴全产业链，从眼镜的匠心制造到智能穿戴的革新突破，从AR/VR技术的沉浸式体验到数字产业的前沿探索。

金台资讯 8小时前

万兴科技加码绘图创意布局推出在线协作白板产品“亿图画板”

近日，万兴科技(300624)加码绘图创意软件产品布局，推出新一代在线协作白板产品“亿图画板”，已上线Windows客户端和Web端。据悉，该产品专注于头脑风暴、项目规划、文件分享等工作场景，全面提升绘图创意效率和智能办公体验。

证券时报 8小时前

路边到底有多少树是基站伪装的

走在街头巷尾，你永远不知道自己身边藏着多少伪装大师。它们经常在最显眼的地方隐匿身形，企图跟周围景致融为一体，沉默中尽显稳重气质。第一次在现场看到它们，首先要放下平时积累的生活经验，才能找到正确观测角度。当你抚摸着金属质感的树皮，又在二十米高的绿色尖端发现几根天线，就会明白面前那棵东西根本不是植物那么简单，它已然超越了碳基生物范畴。

果壳网 8小时前

2区Top“新贵”，顶刊中的“水刊，”录用率75%，0版面费，i了i了

其在国内的认可度稳步提升，让不少科研人员直呼“赚了”。同时，录用率高达75%，这在顶级期刊中并不常见，拿稿子非常容易。

艾米的科研宝库 8小时前

海南省中小企业服务网上线试运行

11月8日，由海南省工业和信息化厅组织建设和运营的海南省中小企业服务网（以下简称“服务网”）上线试运行。

i黑马 8小时前