之前一直受困于A卡在windows下DML只有三分之一的残血速度,所以从纯小白开始苦逼学习了ubuntu和rocm,经历了无数的撞墙,踩坑,血泪,此处省略数万字.......终于,finally! 可以在ubuntu下满血运行A卡了,但是突然发现:ubuntu的生态实在是很让人无语,干个啥事都要权限不说,3A游戏,pr, 剪映这些编辑软件也无法很好地支持,越用越恼火! 但是又不想买N卡给黄狗吸血!心心念念地梦想着A卡可以在WINDOWS下满血运行的一天,天可怜见,今天,她来了! 得益于AMD的放弃导致ZLUDA的开源(这句话总觉得有哪里不对....),我们A粉终于有梦想成真的一天! 激动的心,颤抖的手,下面让我们开始。
一:使用前提条件和注意事项
1.小伙伴们需要已经正确安装好GIT和PYTHON,之前使用过SD.NEXT,另外对cmd命令和windows比较熟悉。 另2.需要6600及以上级别的显卡
3.ZLUDA不完全支持pytorch,并且可能会有不稳定的现象。
二:安装步骤
1.进入目前的 SD.NEXT文件夹然后依次运行如下命令 git checkout dev
git pull
2.从这里安装 hip sdk 5.7.1 https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html
3.从这里下载ZLUDA压缩包并解压至方便好找的文件夹 (有可能杀毒软件会警告,但是请放心,这不是病毒)https://github.com/lshqqytiger/ZLUDA/releases/tag/v3.2-win
4.把ZLUDA的文件夹路径和ROCM的文件夹里的 BIN文件夹路径都添加到环境变量里
5.打开SD.NEXT的文件夹,一次性运行以下命令
.\venv\Scripts\activate
pip uninstall torch torchvision torch-directml -y
pip install torch==2.2.0 torchvision --index-url
https://download.pytorch.org/whl/cu118
6.把ZLUDA文件夹里的cublas.dll
重命名为cublas64_11.dll
把cusparse.dll
重命名为cusparse64_11.dll
,然后把这两个文件复制到这个文件夹并覆盖,sdnext_install_folder\venv\Lib\site-packages\torch\lib
7.去以下这个网站找到你的GPU型号
https://rocm.docs.amd.com/projects/install-on-windows/en/develop/reference/system-requirements.html
如果你的GPU两列都打钩✅那么请忽略 Compilation and First Generation
如果你的GPU在HIP SDK这列有一个❌ (LLVM targets gfx1031 and gfx1032) ,那么请遵循以下的步骤
1.去 %HIP_PATH%bin\rocblas
这个文件夹里
2.重命名library文件夹为别的名字例如 origlibrary
3.从这个网址下载 koboldcpp_rocm_files.zip https://github.com/YellowRoseCx/koboldcpp-rocm/releases
4.解压缩这个文件并到 rocblas这个文件夹
5.把library文件夹拖到rocblass这个文件夹
6.重启电脑
三.调试步骤
启动SD.NEXT,命令为 (webui.bat --use-cuda --debug --autolaunch),让程序自动更新
这个步骤大概耗费10-15分钟去完成,但是只需要完成一次就可以了
注意:这个步骤没有精度条,因为这个步骤是在ZLUDA内部进行的,我们在WEBUI里是看不到的。
好了,可以开始A卡在WINDOWS里满血运行SD的愉快之旅了。
7900xtx测试运行在WINDOWS里可以达到ubuntu里的满血速度 16IT左右。