作为一个初入AI绘图圈子的新人小白,学习了一些基础知识后,想搭建LORA训练环境炼丹玩,查阅了N多帖子和视频,折腾了几个晚上,终于把LORA训练环境搭建成功。一开始用了秋叶大神的安装包,装到一半儿,报错,ERROR: Could not open requirements file: 【Errno 2】 No such file or directory: 'requirements.txt',研究几天搞不懂为什么,后来放弃,去研究安装另一位大神的 kohya_ss GUI,一番小波折装上了,但是训练时总是提示 OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 8.00 GiB total capacity; 14.45 GiB already allocated; 0 bytes free; 14.72 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF, 查了N多资料,尝试各种方法,也未能解决。难道我8G的显卡练不成丹了? 索性回头再测试秋叶大神的安装包,还是出现No such file or directory: 'requirements.txt'的错误,自己分析了半天安装脚本,用手动执行命令方式,即使完成了出错节点之后的安装,训练时还是提示各种缺少组件,没能彻底解决,后来仔细分析各种错误信息,又把秋叶大神视频下大家关于各种问题的讨论看了一遍,终于明白是自己直接在github.com下载的 lora-scripts-main脚本不完整。必须使用Git对github.com上的lora-scripts做整体克隆,拿到完整版的资源,再配合科学上网法进行安装,终于顺利完成全部安装,训练进程也可以正常开启了, 下面简单总结下全过程要点,自己作为备忘录,也提供给遇到同样问题,还在迷茫的朋友参考。(本人平台为 E3-1246V3+ASUS Z87-PLUS,16G DDR3,ASUS P104-100 8G图形卡, Win10 22H2专业版)
1、安装 python-3.10.8-amd64.exe (必须安装此3.10.8版本);
2、安装 Git-2.43.0-64-bit.exe 用于克隆github.com上的lora-scripts到本地;
3、安装Notepad3_6.23.118.1_x64_Setup.exe (不是必装,主要是方便后面修改代码使用);
4、在Powershell管理员模式中执行 Set-ExecutionPolicy -ExecutionPolicy RemoteSigned, Y回车;
5、内存小的用户建议为win10系统设置60G以上的虚拟内存,重启计算机;
6、切换到kexue上网模式,在Powershell中运行 git clone --recurse-submodules https://github.com/Akegarasu/lora-scripts ,克隆代码到本地,切换回正常网络模式;
7、把c:\windows\system32下的lora-scripts文件夹复制到D盘;
8、进入D:\lora-scripts文件夹, 右键用powershell 执行 install-cn.ps1;
9、复制找好的底模文件(建议用SD1.5基础模型)到D:\lora-scripts\sd-models文件夹内;
9、根据自己具体情况修改train.ps1中训练资源的路径和其他相关参数,修改优化器类型为“AdamW”,保存;
10、切换到kexue上网模式、右键用powershell 执行train.ps1开始训练。