低显存（4g）训练LoRA模型的一些经验+自训练四季夏目LoRA模型分享

作者：井之上泷奈酱酱酱发布时间：2023-02-07

ChatGPT

多图预警；段首懒得空两格，见谅。

模型和图片（放进法术解析就能看咒语）会放在评论区置顶，在云平台上训练模型花了我一个疯狂星期四，求个小小的赞和评论应该不过分吧QAQ。

先说清楚，选择好合适的素材集在云平台上训练是一分钱不用花的，具体请看文中的引用教程，花了money是因为我人傻走弯路。

在玩了galgame之后，就有一种想要夏目更多地踩我的冲动，然后就想到了ChatGPT+VITS的整活，不过ChatGPT使用麻烦（虽然现在已经搞定了），VITS模型训练又比较麻烦（galgame剧本提取不出来），所以就想到了AI绘画。

幸运的是，b站上有很多打包好的懒人包，点开即用，笔者用的是up主秋葉aaaki的整合包。

首先，我尝试着自己组合各种tag，来把枣子姐画出来，然而结果是这样的：

可以看到，头花？有了。头饰？有了。middle breast也差不多，但是画风不像啊。

于是我用了网上找到的柚子社画风的模型，并且由于枣子姐的美人痣太戳我xp了，我就在mole under eyes上打了好几托括号，结果变雀斑了，再加上负面tag没打好的原因，肢体也开始降san了(由于审核的原因，这个图删掉了）

接着继续尝试改进，首先是又换了一个模型，跑了一堆图出来，能看的也有，但是都不太符合我对枣子姐的幻想（（嘿嘿嘿））

(这里夹掉了一张nsfw，效果也不是很好，就不补了)

后来又换了好几个但还是不满意

我逐渐理解，想要画出自己想要的效果（人物），可能只能自己训练模型，但是我的显卡是GTX1650（据说当时被称为智商检测卡，4年前的中端配置显卡吧），显存只有4G。而训练embedding至少需要6g以上的显存。再说，embedding的训练需要大量素材，枣子姐虽然人气高，p站上也有较多插画（精选的大部分都是nsfw。。。），但应该是喂不饱训练素材量的。

直到我打开新世界的大门：LoRA模型

附上LoRA模型的教程

在这里也附上秋葉aaaki （简直是kamisama）的最新答疑

第一次训练模型，数据集非常非常粗糙，粗糙到什么程度呢，直接把插画或者立绘（贴吧有收集这方面资源的大佬）丢进去图像预处理，然后再丢进云平台训练。

这样训练出来的效果当然不好。第一次训练用的是镜像文件自带的model，大概是6k步还是3k步（忘了），然后在使用LoRA生图的时候好像用的是pastelmix粉彩（蜡笔模型？），出来的效果是这样的：

这个应该是用了柚子社画风的大模型

效果是有的，但是一言难尽，当时我还没有尝试去调教LoRA模型的权重，一般来说权重为1的话效果不是很好（也有可能是我训练的模型比较烂）。

随后我又训练了一个跑了2w3step的模型，但是由于没有调教权重，出图效果也不好，我当时还以为是步数不够，tag不好，一直在调整。直到我用跑了7w步的模型（错误率大概在2%）也无济于事，我才将好几个LoRA一起用，然后调整权重，经过不断调教左右，发现LoRA模型的权重大概在0.5~0.7之间是最好的，能产出比较好的图片：

这个模型是以b站up主Toooajk做的矢车菊模型为底模训练的，不过产图时用的model也忘了，大概率是pastelmix吧

发带已经比较稳定了，这时候我发现了元素法典的文档，并采用了里面的风魔法，画出了比较好的效果

在经过一系列的调试魔法，现在枣子姐的形象大概稳定了下来，接下来就是慢慢靠近原画风，慢慢让她画出不同动作不同场景的作品，同样，在以下图片中都是借鉴元素法典里的魔法来调整效果的。

后来由于操作失误，不小心把存着的13个版本枣子姐的style给删了。。。只能从头开始慢慢调试，同时也尝试新风格新背景新动作。特别提醒一下，如果存的style太多，千万不要自己在文件表格里面删减，不然报错之后全部style都没了。（血泪史）

于是又开始产出掉san的图

但是从开头翻到这里，其实人物特征效果是越来越好的。

一开始我陷入了一个误区，就是把原图直接丢进去，让图像预处理进行分割，训练出来的模型效果不太好（也有可能是操作不当，权重给太高，渣机懒得尝试了）

在之后的训练里，我把立绘的图一张一张裁剪，把头部各表情剪出来，同时将其在训练集中复制粘贴好几次，这样原画风的图片占比就比较多，插画的占比比较少。然后把每一套衣服剪一下，再适当添加nsfw的素材进去。这样素材及总共应该有六百多张图。不过其实对于LoRA模型来说，不需要这么多素材，也不需要这么多步数。我也可能是多此一举了，今天早上刚跑完的模型，是我基于原本跑了7w步的模型继续训练了10w步产生出来的。。。错误率大概在1%左右，应该已经陷入局部最优出不来了。

我还做了一些其他尝试，例如图生图，在这里推荐pose studio，可以摆各种各样的姿势，然后截图拿去图生图。

当然，不要跑太复杂的姿势。。。。不然又要掉san了