【AI绘画】lora干货！新手小进阶（上）！三种打标方式对比及正则化对人物训练作用讨论

作者：WSH032发布时间：2023-03-18

AI绘画

摘要

本专栏将用具体例子向你展示三种打标方式（全标、删去人物特征、只保留唤起标签）在lora人物训练中不同的效果，并给出各自的优缺点。同时你也会看到正则化对人衣分离的作用。最后我会给出推荐的训练方式。

注意，我是开启keep token和打乱标签的，lion优化器

关键词：LoRA模型、打标方式、正则化、训练方式、心得

参考：

全文2550字，如果你想看证明过程就慢慢看，会有具体图片例子

如果你只想得到结论，直接拉到最后的总结部分（但我相信如果你不看图片，可能理解的不是那么好）

看完这篇专栏大概5分钟，训练、测试、得出结论，最后写专栏却要好几天。

如果你能看到最后，觉得有用，不要忘了结尾的约定。

如果觉得没用，很抱歉我浪费了你的时间，你可以给我留言改进的意见或者指出我的错误。

测试模型、训练集、正则化集、tag文件、train.sh文件、xyz图我稍后会上传，请留意评论区

专栏里的XYZ图如果看不清楚，右键图片在新标签页打开，删除最后一个@及后面的所有字，就是原图了

序言

阿慈谷日步美是 Nexon 发行的游戏《蔚蓝档案》及其衍生作品中的登场角色。

其通常形象为背着佩洛洛风格背包的金发双马尾JK少女

在此次实验中，我使用8张图片做为训练集；测试了在合理参数设置下，三种打标方式及全标+正则化的训练成品。

正文

（一）训练集展示（仅8张）

图片来源于danbooru，如您的图片被侵权，请自行联系danbooru下架该图片；这个不是美图展示，不要来联系我，我不会处理任何类似问题，如觉得不妥就举报这篇专栏。

（二）参数

我一共训练了7组模型，先给出基础参数：

（三）prompt：naifu起手式+以下组合

其中一张图片的tag分类（还有一些simple background等背景没打上）

全标：全都有

删特征：人物被删去，其他保留

仅唤起：人物被删去；衣服（除了shoes，school uniform，bag被保留外）被删去；其余保留

其中在keep token = 3作用下，第一栏（hifumi，girl，solo）成为唤起词

（四）模型：

其中最后一列的all_plus已经有点过拟合了，接下来的分析我不会提到它，放哪里给大家做个对比

下面的XYZ图按这个顺序从左到右排序，重点分析前3列（三种打标）和第4/5列（正则化）

（五）模型测试（prompt测试）

5.1 唤醒词测试

可以看到在开启keep token时，三种打标在一定程度上都完成了唤起；

考察面部还原、胸前蝴蝶结：

易调用性：仅唤起 > 删特征 > 全标

其中正则化还未完全拟合，（如果仅使用唤起词，其还原程度，在拟合后，理论上应该是弱于全标的）

5.2 唤起+人物测试

可以看到还原程度：仅唤起（实际上是过拟合了） > 删特征 > 全标

考察对人物的还原，全标和删特征均满足了要求。

但是请注意，我并未输入衣服tag，但是仅唤起直接把JK还原了，这意味着仅唤起已经过拟合了。

同时，也可以大胆推断，在未过拟合的情况下，全标和删特征是可以完成换衣的，也就是在不使用正则化的情况下具有一定程度的泛化性。（在5.4中被证明）

泛化性（换装能力）：全标>删特征>仅唤起

5.3 人物+衣服测试

可以看到在人物+衣服的 prompt 下，无明显差别（除了正则化还未拟合）

5.4 泛化测试（仅人物+full body+swimsuit）

可以看到仅唤起已经不可避免的过拟合，换装失败；其余的均很好完成了换装。

这证明了5.2的结论：在未过拟合的情况下，全标和删特征是可以完成换衣的，也就是在不使用正则化的情况下具有一定程度的泛化性。

泛化性（换装能力）：全标>删特征>仅唤起

5.5 仅衣服测试

注意，这个测试是重点，直接反应了泛化性的差距。

可以看到仅唤起、删特征、全标，人物均不同程度受到了衣服tag的影响（仅唤起的人物几乎已是日富美；全标受影响最小），只有正则化最好的完成了人物与衣服的剥离。

泛化能力：正则化>>全标>删特征>>仅唤起

不要觉得正则化还原的衣服不像，那是因为8epoch的正则化模型还未拟合，下面是一张14epoch已经拟合的正则化图片（仅衣服tag）

也就是说，如果你有多concept互换衣服的需求，或者训练衣服的需求，是一定要用正则化的

5.6 全标测试（细节测试）

这个也是重要指标，这里只考察对非人物细节的学习，如枪和佩洛洛背包的还原

细节能力：正则化≈>全标>删特征>仅唤起

还是那句话，不要觉得图里正则化的背包不像，那是因为还没拟合。

总结

过拟合风险：仅唤起>>删特征>全标>正则化
拟合能力（对人物的学习速度/出成品速度）：全标≈=仅唤起≈=删特征>>正则化
（正则化处理不好脸部还原会有难度，这个在大训练集中特别明显）
细节能力（非人物细节，如光环，绣肩，佩洛洛背包，画风等）：正则化≈>全标>删特征>仅唤起
还原性（人物+衣服/全标;拟合后）：无明显差别
易调用性：仅唤起 > 删特征 > 全标>>正则化
换装能力（不过拟合情况）：正则化>全标≈>删特征>>仅唤起
泛化能力：正则化>>全标>删特征>>仅唤起
训练容易程度（包括训练集准备、tag处理，调参来避免欠/过拟合）：全标≈>删特征>仅特征≈=正则化（小训练集）>>>正则化（大训练集）

同时，如果有多concept互换衣服的需求，或者训练衣服的需求，总之如果想把人物和服装分离，是一定要用正则化的

为什么删特征会略比全标难呢？因为删特征最好给点脸部特写，而且特征tag最好删干净了，不然会丢特征。

为什么仅特征更难？因为必须一定要保证相关tag删干净了，同时它太容易过拟合了，而且细节的学习要给很多特写。

为什么正则化最难，因为如果参数没调好，训练集和正则化的比重没弄好，拟合是有难度难度（特别是大训练集）；这往往需要一定的经验。

小训练集耗时相对少（试错空间大），脸部拟合也不是太难（给特写），同时也面临过拟合的困扰，所以用正则化是不错的选择。这也是我最开始推荐使用正则化的原因，因为当时我的训练集较小，每个concept只有30张左右。

但是最近有人和我反应大训练集用正准化效果不佳，这是因为

大训练集使用正则化一定要谨慎！因为脸部拟合有难度，而且耗时会大幅增加！

如果你非要用，控制比重在5%~10%以下，同时要给脸部特写！

建议：

新手训练自用的单角色模型直接全标完事。（还原又好，细节又好，还能换装，泛化好，拟合风险又小，真是有够爽的）

稍微熟练后可尝试删特征。（删特征训练的特写和tag处理具体教程，下下周可能我会讲，看有没有空）

熟练掌握调参和训练集、tag处理后，有发布易调用模型的需求，仅唤起。

有极强的泛化需求,或者有分离服装需求，可以用正则化。（还是那句话，大训练集有难度，推荐小训练集用）

结尾

最后只放一张图（我的模型没炼好，这个8张训练集的我不满意XD）

你看完这篇专栏只要5分钟，我训练、测试、得出结论最后编写专栏要好几天。

所以觉得本专栏对你有用的，或者图片好看的，不妨点个三连、分享吧。

by Happy_WSH

近期资讯

美股异动 | 云米科技(VIOT.US)涨超4% 公司专注于全屋智能家电

周一，云米科技(VIOT.US)涨超4%，报1.43美元。据了解，云米科技是一家专注于全屋智能家电的企业‌，致力于用高科技缔造智能的家，为全球用户提供“一站式全屋智能”解决方案，涵盖智能家电、智能家居以及软件服务‌。

金融界 2024-12-30

超频三获得实用新型专利授权：“一种服务器散热模组”

证券之星消息，根据天眼查APP数据显示超频三（300647）新获得一项实用新型专利授权，专利名为“一种服务器散热模组”，专利申请号为CN202420934494.X，授权日为2024年12月31日。

证券之星 2024-12-31

组装电脑必看：主板安装全步骤详解与注意事项

在组装电脑的时候，主板的安装是一个非常重要的步骤，虽然看起来简单，但如果处理不当，可能会给后续的使用带来麻烦。今天我们就来聊聊主板怎么插，保证你在动手之前能有个清晰的思路。

新报观察 2024-12-31

智能锁的安装与使用指南：提升家庭安全与生活便利的必备选择

智能锁在现代家庭和办公环境中越来越普及，给我们的生活带来了许多便利。这种新型锁具设计独特，不再依赖传统的钥匙，而是通过密码、指纹、蓝牙等多种方式来开锁。今天，我们就来聊聊智能锁的使用方法，看看如何让它更好地为我们服务。

新报观察 2024-12-31

中源家居获得实用新型专利授权：“一种伸缩沙发”

证券之星消息，根据天眼查APP数据显示中源家居（603709）新获得一项实用新型专利授权，专利名为“一种伸缩沙发”，专利申请号为CN202420123542.7，授权日为2024年12月31日。

证券之星 2024-12-31

我国已备案民用无人机产品 1800 余种，产品数量超 170 万架

12月30日消息，据新华社报道，记者从低空产业联盟2024年工作会议获悉，我国低空产业管理不断完善，截至目前，我国在民用无人驾驶航空器产品信息系统备案企业达600余家，备案产品1800余种，产品数量超过170万架。低空产业联盟公布的数据显示，2024年1至8月，全国民用无人机累计飞行1946.1万小时，同比增长15.6%。

IT之家 2024-12-30

揭秘冰箱制冷原理：如何通过循环实现食物保鲜的科技奥秘

冰箱，这个我们生活中不可或缺的电器，几乎每家每户都有。想想每天打开冰箱，冷饮、蔬菜、水果，样样齐全，真是件幸福的事。但你有没有想过，冰箱是怎么做到制冷的呢？今天就聊聊冰箱的制冷原理，让我们一探究竟。冰箱的制冷原理其实并不复杂，主要是依靠一种叫做“制冷剂”的物质。制冷剂在冰箱里不停地循环，通过吸热和放热的过程来实现制冷效果。

新报观察 2024-12-31

海尔智家获得实用新型专利授权：“显示器支架、移动智慧屏”

证券之星消息，根据天眼查APP数据显示海尔智家（600690）新获得一项实用新型专利授权，专利名为“显示器支架、移动智慧屏”，专利申请号为CN202420441967.2，授权日为2024年12月31日。今年以来海尔智家新获得专利授权5561个，较去年同期减少了30.1%。

证券之星 2024-12-31

海象新材获得实用新型专利授权：“一种耐磨复合地板”

证券之星消息，根据天眼查APP数据显示海象新材（003011）新获得一项实用新型专利授权，专利名为“一种耐磨复合地板”，专利申请号为CN202420864232.0，授权日为2024年12月31日。

证券之星 2024-12-31

浏览器兼容模式设置指南：提升网站访问体验的技巧

如果你是一个网站的开发者，建议你在开发过程中，使用工具进行跨浏览器测试，确保你的网页在不同的环境中都能良好运行。

新报观察 2024-12-31

【AI绘画】lora干货！新手小进阶（上）！三种打标方式对比及正则化对人物训练作用讨论

摘要

序言

正文

总结

结尾

推荐体验

相关资讯

【AI绘画】彩奈（黑+白混合）Lora模型与正则化的讨论

【AI绘画】LoRA训练与正则化的真相：Dreambooth底层原理

体验AI绘画：快速上手Stable Diffusion的三种方式

如何AI绘画？教你三种绘画方法

Sora、梦境与比喻——模拟世界的三种方式

近期资讯

美股异动 | 云米科技(VIOT.US)涨超4% 公司专注于全屋智能家电

超频三获得实用新型专利授权：“一种服务器散热模组”

组装电脑必看：主板安装全步骤详解与注意事项

智能锁的安装与使用指南：提升家庭安全与生活便利的必备选择

中源家居获得实用新型专利授权：“一种伸缩沙发”

我国已备案民用无人机产品 1800 余种，产品数量超 170 万架

揭秘冰箱制冷原理：如何通过循环实现食物保鲜的科技奥秘

海尔智家获得实用新型专利授权：“显示器支架、移动智慧屏”

海象新材获得实用新型专利授权：“一种耐磨复合地板”

浏览器兼容模式设置指南：提升网站访问体验的技巧

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响