当前位置：首页|资讯|Stable Diffusion|LoRA

AI学习笔记|Stable Diffusion的图生图（control初阶）

作者：铁华团的黄金船发布时间：2023-05-29

Stable Diffusion LoRA

《尼尔：机械纪元》里有一个女机器人，叫YoRHa No. 2 Type B，又叫夜刃二号B型、寄叶二号B型。

她是B型尤尔哈智能机械人，B指的是Battle，也就是战斗型。

编辑切换为居中

我不玩游戏，也不太关心这部作品的动画化，但是，谁又能拒绝一个身穿蕾丝拿着长刀的美少女机器人呢？

在C站上，甚至有很多关于她的模型和lora。

让我怦然心动的是无意间在C站看到的一张图片。

编辑

经过真人模型重新渲染的YoRHa2b，已经不是杀人机器的模样，而是一个温柔的少女形象。背后是人类的末世和废墟，眼睛里是希望。

但按照原作者提供的数据，根本无法复现这张图片，甚至完全不相干。大概率是他写错了模型名字，我尝试了数十个模型都无法画出这张图，就没有办法了吗？

这个时候，我们就可以尝试一下Stable Diffusion的“图生图”和“控制网络”功能。

1、选择一个近似的模型。

经常使用Stable Diffusion的，看到一张图后，会大致知道使用哪个模型可能复现。

比如这张图，脸部非常干净，没有多少细节，那么它一定不是真人模型，是介于动漫模型和真人模型之间的一种过渡模型。

可以尝试dosmix或者realdosmix这种“伪”真人模型（经过多次尝试，realdosmix模型比较合适）。

用动漫类的模型会有其他惊艳的效果，如下图，本文不再探讨。

2、用“图生图”功能反推提示词。

在图生图功能处，上传这张照片。

然后选择“反推提示词”，所谓反推提示词，是让AI识别这张图片，给它打上标签（其实这个功能细思极恐，AI已对图像的识别能力已经非常强大）。

Stable Diffusion提供了两种反推提示词的工具，经过多次尝试，我个人感觉，DeepBooru反推提示词更好用一些。

反推提示词如下：

1girl, black_blindfold, black_dress, black_gloves, black_hairband, black_legwear, blindfold, breasts, building, cleavage, cleavage_cutout, clothing_cutout, dress, feather-trimmed_sleeves, feather_trim, gloves, hairband, juliet_sleeves, long_sleeves, medium_breasts, mole, mole_under_mouth, no_blindfold, pink_lips, pod_\(nier_automata\), puffy_sleeves, robot, ruins, short_hair, silver_hair, standing, sword, thighhighs, thighhighs_under_boots, vambraces, weapon, white_leotard, yorha_no._2_type_b

它甚至知道这张照片的主人公是yorha2b！

3、控制网络提取图片细节

直接用这组反推提示词，生成的图并不是十分满意，还需要做“精修”，最好的办法是结合“控制网络”。

所谓控制网络，是让AI提取原图的边缘，新生成的图片在这个边缘之内引导生成，可以极大的和原图接近。

把反推提示词输入文生图后，再选“控制网络”。

注意红框中的几个选项：

点了“启用”，控制网络才会有用。后面的guess mode建议开启，意思是让AI自由发挥一下，如果批量生成图片，最后几张会是它guess的，往往很惊艳。

预处理器选择canny，模型选择control_canny-fp16。

权重尽量接近1，也可以直接选1，canny low threshold和Canny high threshole越小，细节越多（越接近原图），建议在20-100之间选取并尝试，多试验几次选择自己满意的效果，此处我分别选30和150效果比较不错。

然后点击预览，可以看到系统提取的细节。

4、选择lora

为了面部更好看，选择japaneseDollLikeness，权重0.3即可。

4、生成图片

点击生成后，系统会在原图的细节框架之下，生成新的照片，结果和原图非常接近。

但是，我们发现有些细节不是想要的，比如尤哈尔2b穿的是长裙，而生成的有点太少。

于是我改了下提示词，增加上(((black_long_skirt))),(light_smile),((tight fitting skirt))三组提示词，意思是给尤哈尔2b穿上黑色长裙，还是紧身的，然后让她莞尔一笑。

最后系统生成的图片是这样，虽然不能说和原图一模一样，但是非常接近我想象中的场景了。

在此基础上，可以继续换装、更换背景，以及调整姿势等，就需要其他一些工具和技巧了。

本文用到的模型及下载：

realdosmix

https://www.123pan.com/s/ueDeVv-Nk0I.html提取码:lgyh

japaneseDollLikeness_v15.safetensors：

https://www.123pan.com/s/ueDeVv-Ok0I.html提取码:lgyh

推荐体验

相关资讯

Stable Diffusion 图生图技巧

处理图片大小Just resize : 将图像调整为目标分辨率。除非高度和宽度完全匹配，否则图片会被挤压Crop and resize：调整图像大小，使整个目标分辨率都被图像填充。裁剪多余部分。Resize and fill：调整图像大小，使整个图像在目标分辨率内。用图像的颜色填充空白区域。注意颜色无论是 3D (DAZ 这样的 3D 模型) 还是线稿，AI 只识别色彩，而不是线条，色彩直接决定图转图的效果。三渲二调整 3D 模型骨架比寻找样图更容易。可以结合 3D 建模摆 Pose，也可以使用 M

Stable Diffusion

远行_Expedition 2023-07-02

Stable Diffusion教程：图生图

“图生图”是 Stable Diffusion的核心功能之一，它的主要能力是根据现有的图片 + 提示词生成新的改造图片，这在日常的工作和生活中都特别有用。话不多说，让我们看看它都有什么神奇的魔法吧

Stable Diffusion 提示词

萤火架构 2023-10-20

Stable Diffusion 生图

Stable Diffusion 生图

Stable Diffusion

好一个灵魂舞者呀 2023-02-14

stable diffusion每日生图

Stable Diffusion

牛牛的尾巴 2023-04-19

AI绘画Stable Diffusion 入门二文生图图生图

一：关键词这个困扰很多初学者，我的方法主要是百度翻译，TAG反推，TAG在线网站，C站复制TAG四种方法。AI玩的就是抽盲盒，还是自己写出来的图才有特点。1：百度翻译先加我平时通用的正面提示：杰作，最好的质量，非常详细的CG，复杂的细节：1.2，插图），高细节，高分辨率，高清，8k壁纸，后面加角色姿势、服饰、表情、地点、物件、天空、水、花草树木...这类词汇，颜色描述自行替换（绿色：0.6），（青色：0.4），（蓝色：0.3），括号和数字代表强化tag的属性和权重，颜色具体参考我这期视频https://w

AI绘画 Stable Diffusion 百度

千亦听枫 2023-04-06

近期资讯

高中物理：156条选择题排雷指南!吃透它!解题时间能省就省。

物理选择题在解答的时候应该做到快、准稳，这不仅仅需要掌握直接判断和定量计算的常规方法,还需要一些解题技巧今天学姐为大家带来了高中【物理选择题排雷指南】希望能够帮助更多的宝子们更加轻松地应对考试！ [图片] [图片] [图片] [图片] [图片] [图片]

柒君学姐 2024-12-29

高中生物考了全班第一的秘密！

高中生物被誉为——理科中的文科，是文科中的理科，这所以被同学们这么称呼，是因为在高中生物的学习过程之中不但需要需要背书，也需要用理科思维做题。因此高中生物是很多同学的丢分项！但实话实说，高中生物真的超级简单！很多同学丢分是没有掌握正确的学习方法。今天学姐给大家整理了一份高中生物长句子规范表述，带你高效提分，快来一起看看吧 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]

小一学姐爱分享 2024-12-29

灾难降临地中海：谁干的？！

一场突如其来的灾难降临在地中海，据参考消息12月26日援引俄新社报道，当地时间12 月 23 日，俄罗斯最大的干货船之一“大熊星座”号遭遇恐怖袭击后沉没。这一事件引起了国际社会的广泛关注，而人们最为关心的问题便是：这起恐怖袭击究竟是谁干的？“大熊星座”号的船东俄罗斯国防物流公司明确表示，该船遭到了有针对性的恐怖袭击。船员的证词显示，莫斯科时间 12 月 23 日 13 时 50 分，右舷船尾区域连续发生三起爆炸。随后的检查中，发现水线上方有一个直径为 50x50 厘米的大洞，洞的边缘被撕裂并向内凹陷，船的

俞洁讲武堂 2024-12-29

陶瓷粉末伺服成型机-电子陶瓷、金属化陶瓷、精细陶瓷

在当今科技飞速发展的时代，材料科学的进步不断推动着工业和科技的边界。特别是电子陶瓷、金属化陶瓷以及精细陶瓷领域，它们以其独特的性能在多个行业中扮演着至关重要的角色。而在这些高性能材料的背后，是一系列创新技术的支撑，其中就包括了陶瓷粉末伺服成型机。氧化铝陶瓷电子陶瓷金属化陶瓷氧化锆陶瓷氮化硅、氮化铝、碳化硅、碳化硼、硼化锆等陶瓷粉末---氧化铝、碳化硅、氮化硅、氮化铝、氧化铝、氧化锆、碳化硅、氧化硅电子陶瓷、精密陶瓷、陶瓷结构件、陶瓷粉末：氧化铝、氧化锆、碳化硅、氮化铝、氮化硅、氧化硅等陶瓷粉

伺服粉末成型机 2024-12-29

可编程中央控制主机的技术创新与未来趋势

在当今这个快速变化的科技时代，可编程中央控制主机作为自动化与智能化控制系统的核心组件，正经历着前所未有的技术创新与变革。随着物联网、大数据、人工智能等技术的飞速发展，可编程中央控制主机不仅在功能上得到了极大的丰富和扩展，还在性能、可靠性、易用性等方面实现了显著提升。本文将深入探讨可编程中央控制主机的技术创新点、当前的应用现状以及未来的发展趋势。一、技术创新点模块化与可扩展性现代可编程中央控制主机普遍采用模块化设计，使得系统可以根据实际需求进行灵活配置和扩展。这种模

格芬科技 2024-12-29

成功秘诀：掌握关键要素

有时，我们可能会误入歧途，因为未能预见结果，沿途风景又相似，便误以为自己走在正确的道路上。如果我们不尽早调整方向，直到抵达终点才意识到错误，那时无论怎样懊悔都无济于事。因此，一旦我们通过多次实践确认了正确的路径，就应该坚定不移地走下去，并且要走得熟练自如。

天天向上_24 2024-12-29

门窗网站本地企业网站优化策略

门窗网站本地企业网站优化策略至关重要。通过精心设计和优化，可以提升企业在当地市场的曝光度和竞争力。首先，关键词的选择至关重要。在文章和网站内容中，应该使用与门窗行业相关的关键词，以提高搜索引擎排名。其次，网站的页面加载速度也是一个重要因素。确保网站加载迅速，以提供良好的用户体验。此外，响应式设计是必不可少的，使网站在各种设备上都能够良好展示。另外，定期更新网站内容也是关键。保持网站内容新鲜和有吸引力，可以吸引更多访问者并提高转化率。最后，利用社交媒体平台进行推广也是一个有效的策略。通过在社交媒体上分享有关

做网站建设设计小程序 2024-12-29

那个斯坦福大学毕业的博士，开始作为乡镇公务员上班了

今年6月，媒体曾报道过，一名斯坦福大学毕业的博士，报考了安徽宿州一个县的乡镇公务员。他是宿州萧县人，本科考上了中国科学技术大学，在校期间获得过学校的***奖学金，毕业前获得了美国十几所大学的*****，后来他选择去了斯坦福大学，直至2022年博士毕业。然而，他是在2024年6月，才开始获得当地乡镇公务员**公示，不知道他从斯坦福大学博士毕业之后这两年时间，在做什么，有没有工作，为什么选择了报考乡镇公务员，被录用后能否真正去上班呢……昨天，一条热搜新闻算是揭秘了这一切。在****发布的报道中，就提到了有记者

任炜老师 2024-12-29

引领新势耀目登场深圳龙华清湖腾势中心店盛大开业

2024年12 月 28 日，深圳龙华区迎来了汽车行业的又一大盛事——深圳龙华清湖腾势中心盛大开业，标志着腾势品牌在深圳区域布局的进一步拓展，为满足消费者对腾势汽车消费体验的全新期待，从而开拓创新服务模式，为当地消费者带来了更加便捷、高端的汽车消费体验。 [图片] [图片] 开业盛典现场，气氛热烈非凡。腾势方程豹直营事业部南部战区销售总监罗帅峰先生上台为我们发表致辞。他表示，龙华清湖腾势中心将秉承腾势品牌的高端品质与服务理念，为消费者提供一站式服务涵盖销售、售后、充电设施等全方位，致力于打造成为龙华地

深圳有车 2024-12-29

ogg音频转mp3格式，学会这6个教程，一键轻松转换！

您知道ogg是一种出色的音频格式吗？凭借其高质量的音质，ogg在游戏行业等多个领域得到了广泛的应用。然而，由于兼容性问题，许多设备和音乐播放器无法直接播放ogg文件。解决这个问题的最佳方法就是将ogg音频转换成mp3格式。mp3是最常见的音频格式，不仅与大多数设备和播放器兼容，而且文件体积较小，便于存储和传输。在本文中，我们将为您介绍6种关于ogg音频转mp3格式的简单方法，一起来看看吧。教程一：使用“闪电音频剪辑软件”把ogg转换成mp3格式闪电音频剪辑软件不仅提供强大的音频剪辑功能，还支持音频格式转换

金舟音频大师 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1