当前位置:首页|资讯|Stable Diffusion|Stable Diffusion WebUI|LoRA

stable diffusion 实战教学 第一课 Lora 人像训练1 准备工作

作者:AI研究员聂晓亮发布时间:2023-08-29

一、基本流程

    这个 Lora 系列的课程只是针对真实人像训练的方法。整个课程尽量将能标准化的参数标准化,但仍然需要一些人工调教,但基本可以做到九成相似了。

    先笼统的按照训练流程介绍需要准备的工具,让大家有个基础的认识:

    大部分的工具和模型在我网盘里都有,需要的私信我。

    1)WD14 Tagger 在 “插件” 目录中,文件名是 stable-diffusion-webui-wd14-tagger.zip

    2)BooruDatasetTagManager 在 “其他” 目录中,文件名是 BooruDatasetTagManager.rar

    3)SD 1.5 原始模型在 “大模型/SD15” 目录中,文件名是 v1-5-pruned.safetensors

    4)真人大模型 RealisticVison 在 “大模型/写实” 目录中,文件名是 realisticVisionV51_v51VAE.safetensors

二、找训练素材

    1)去哪里找

    做为初级练习者,最推荐的网站就是 Pinterest。比如要找刘亦菲的,质量都非常高。

    第二推荐的就是 Google Images,记得要调成搜索大尺寸图片,如下:

    Pinterest 和 Google Images 都是需要梯子的

    第三就是自己拍的了,初学的时候不太推荐这种方式,因为很难把握照片的质量。


    2)找什么样的照片

      ① 单人的

      ② 高清的(1024x1024以上)

      ③ 背景相对简单的

      ④ 各个角度的(正脸的、侧脸的、上半身的)

      ⑤ 年龄段一致的(别一会儿20岁一会儿40岁的)

      ⑥ 风格一致的(别又是淡妆又是浓妆的)

      ⑦ 清晰的(例如别有烟雾效果或镜头没擦干净的)

      ⑧ 不同服饰的

    3)找多少张 

    最成功的那次我用了 40 张照片,理论上是多多益善的,后面我用 20 张也得到了还算凑合的效果。

三、初步处理

    虽然 Kohya 支持不同尺寸的照片自动进行分组训练,但仍然建议使用相同尺寸的照片进行学习。推荐使用网站 Birme。

    照片直接拖入到红框内。长宽都设置为 1024。

    最终结果大致如下,人物都是 1:1 的图。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1