如何在AMD GPU上运行优化的Automatc1111 Stable Diffusion WebUI

作者：小熊在线网官方号发布时间：2023-09-19

【小熊在线讯】你知道吗？你可以在Automatic1111(Xformer)下使用Microsoft Olive启用Stable Diffusion，在Windows上通过Microsoft DirectML获得显著的加速。微软和AMD一直在合作优化AMD硬件上的Olive路径，通过微软DirectML平台API和用于DirectML的AMD用户模式驱动程序的ML（机器学习）层加速，允许用户访问AMD GPU的AI（人工智能）功能。

1.先决条件

•已安装Git（适用于Windows的Git）

•已安装Anaconda/Miniconda（适用于Windows的Miniconda）

o确保Anaconda/Miniconda目录已添加到PATH

•具有AMD图形处理单元（GPU）的平台

o驱动程序：AMD软件：Adrenalin版 23.7.2或更新版本(https://www.amd.com/en/support)

2. Microsoft Olive概述

Microsoft Olive是一个Python工具，可用于转换、优化、量化和自动调整模型，以通过DirectML等ONNX Runtime执行提供程序获得最佳推理性能。Olive通过提供单一的工具链来组合优化技术，极大地简化了模型处理，这对于像Stable Diffusion这样对优化技术排序敏感的更复杂的模型尤其重要。Stable Diffusion的DirectML示例应用以下技术：

•模型转换:将基本模型从PyTorch转换为ONNX。

•Transformer图优化:融合子图到多头注意力算子和消除转换效率低下。

•量化:将大多数层从FP32转换为FP16，以减少模型的GPU内存占用并提高性能。

综上所述，上述优化使DirectML能够利用AMD GPU，在使用Stable Diffusion等Transformer模型执行推理时，大大提高性能。

3.使用Microsoft Olive生成优化的Stable Diffusion模型

创建优化模型

（按照Olive的指示，我们可以使用Olive生成优化的Stable Diffusion模型）

1.打开Anaconda/Miniconda终端

2.通过在终端中依次输入以下命令，然后按enter键，创建一个新环境。需要注意的是，Python 3.9是必需的。

conda create --name olive python=3.9conda activate olive pip install olive-ai[directml]==0.2.1git clone https://github.com/microsoft/olive --branch v0.2.1cd olive\examples\directml\stable_diffusionpip install -r requirements.txtpip install pydantic==1.10.12

3.生成ONNX模型并在运行时对其进行优化。这可能需要很长时间。

python stable_diffusion.py --optimize

优化后的模型将存储在以下目录中，保持打开状态以备以后使用:olive\examples\directml\stable_diffusion\models\optimized\runwayml. 模型文件夹命名为“stable-diffusion-v1-5”。使用以下命令查看支持的其他模型:python stable_diffusion.py –help

测试优化后的模型

1. 测试优化后的模型，执行如下命令:

python stable_diffusion.py --interactive --num_images 2

4.安装并运行Automatc1111 Stable Diffusion WebUI

按照这里的说明，安装没有优化模型的Automatic1111 Stable Diffusion WebUI。它将使用默认的未优化PyTorch路径。在新的终端窗口中依次输入以下命令。

1.打开Anaconda/Miniconda终端。

2.在终端中输入以下命令，然后输入回车键，以安装Automatc1111 WebUI

conda create --name Automatic1111 python=3.10.6conda activate Automatic1111git clone https://github.com/lshqqytiger/stable-diffusion-webui-directmlcd stable-diffusion-webui-directmlgit submodule update --init --recursivewebui-user.bat

3.按住CTRL键并单击“Running on local URL:”之后的URL以运行WebUI

5. 在AMD Radeon上启用Olive优化路径

集成优化模型

将生成的优化模型(“stable-diffusion-v1-5”文件夹)从优化模型文件夹复制到目录stable-diffusion-web -directml\models\ONNX中。可能需要为某些用户创建ONNX文件夹。

使用优化模型运行Automatc1111 WebUI

1. 启动一个新的Anaconda/Miniconda终端窗口

2. 使用“webui.bat”进入目录，输入如下命令，以ONNX路径和DirectML方式运行WebUI。这将使用我们在第3节中创建的优化模型。

webui.bat --onnx --backend directml

3. 按住CTRL键并单击“Running on local URL:”之后的URL以运行WebUI

从下拉列表中选择“stable-diffusion-v1-5”

6.结论

AMD Radeon RX 7900 XTX在默认PyTorch路径上运行，每秒可提供1.87次迭代。

AMD Radeon RX 7900 XTX在Microsoft Olive的优化模型上运行，每秒可提供18.59次迭代。

最终结果是AMD Radeon RX 7900 XTX性能提升至高可达9.9倍。

如何在AMD GPU上运行优化的Automatc1111 Stable Diffusion WebUI

推荐体验

相关资讯

如何在AMD GPU上运行优化的Automatc1111 Stable Diffusion WebUI

在 AMD GPU 上安装和运行 Stable Diffusion 指南

使用免费GPU运行stable-diffusion-webui

Linux上如何使用Stable Diffusion WebUI

如何在Mac上安装 Stable Diffusion 来创作

近期资讯

女大学生宿舍充电宝炸了：平板电脑等被炸坏损失5000元

技术速递｜调用异步功能 - WinForms 在 .NET 9 中的未来发展

柯力传感：公司传感器广泛应用于汽车测试等多个行业

曾遨游太空的五星红旗完成接力传递，在京跑完“最后一棒”

宁王曾毓群喜提岚图梦想家！CEO卢放亲自交付

中信建投：CES 2025开幕在即，消费电子板块有望迎来新机遇

美团防疲劳即将全国上线：外卖小哥跑单12小时强制下线

被雷军挖走95后天才少女：好多女程序员都比自己男朋友强

惨！三星集团市值蒸发161.25兆韩元：三星电子是主因

钟睒睒再谈企业家直播带货：可能给农民制造畅销错觉

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响