当前位置:首页|资讯|AI绘画|AIGC|数字人|微软

谁说RX 7700 XT只是游戏卡?Microsoft Olive注入Stable Diffusion AI绘画性能测试

作者:中号硬核玩家发布时间:2023-12-01

前言和配件介绍

AIGC(AI生成内容)在今年开始呈现爆发性增长,包括(ChatGPT)语言模型、(Stable Diffusion)绘画、(synthesia)数字人等众多领域都有涉及,其中最为知名的莫过于Stable Diffusion绘画,最为广泛使用的Stable diffusion WebUI则是来自开源大神的Automatic1111,不过此版本对于AMD驱动支持并不友好,其AI加速器并未能很好发挥。

就在前几个月,AMD和微软合作优化了Microsoft Olive路径,可把基本模型从PyTorch转换成ONNX,以便发挥最佳AMD GPU的AI性能,官方数据显示用了此工具可把RX 7900 XTX的每秒迭代速度从1.87it/s提高到18.59it/s,提升非常巨大,并且经过多个版本的AMD驱动迭代优化,相信A卡在Stable Diffusion中体验会更好,这篇文章就来一起体验一下吧。

测试显卡来自中高端定位的蓝宝石RX 7700 XT白金版,外观还是采用白金版代表性的红色元素进行点缀,大尺寸双飞翼轴流扇的设计,也使之尺寸达到了280mm长,属于精通2K分辨率的游戏显卡,它还具有108个AI加速器和12GB GDDR6大容量显存,用来跑Stable diffusion也是个不错的选择。

配合AI绘图测试的处理器是锐龙 7 7700X,搭配主板来自微星MAG B650M MORTAR WIFI迫击炮,外观方面采用纯黑+斜纹主题设计,看起来就非常硬核,实际上它确实也采用了12(80A)+2的强悍供电,应付锐龙9 7950X都是没有问题,它还加持两组M.2冰霜铠甲,拥有全覆盖VRM散热片,是一款全能型千元级主板。

配备电源来自微星MPG A1000G PCIE5金牌全模组,它采用单路12V供电、全日系105℃电容,并通过了80PLUS金牌认证,最大的卖点就是标配原生12VHPWR 16pin供电接口,可适配现阶段及未来所有的高性能显卡,并且电源提供了10年之长的质保,妥妥能用上2~3套配置。


平台介绍和性能测试

本次测试平台设置处理器锐龙7 7700X开启PBO技术,使用EXPO配置达成DDR5 6000C34 16GB*2双通道状态,并在BIOS中开启Resizable BAR技术提升一些显卡性能。本次测试安装的是AMD Adrenalin 23.11.1最新版本显卡驱动(强烈推荐),操作系统是Windows 11 22H2最新版本。

AMD GPU运行转换Microsoft Olive路径的Automatic1111 Stable Diffusion WebUI

关于Stable diffusion本地部署安装教程很多,甚至国内不少大神已经提供整合包使用,而对于AMD显卡来说,可以参考上述AMD官方这篇BLOG——针对Automatic1111原版WebUI通过Microsoft Olive优化的安装教程,基本软件是需要Git、Miniconda以及Python这些(显卡驱动需要Adrenalin版 23.7.2或更高版本),这里就不再详细介绍了,有兴趣可以去看看。

在部署过程中,一些模型基本都需要魔法才可下载,不然会出现网络错误的提示,也可以通过国内资源下载更方便一些。

正确部署完毕之后,打开http://127.0.0.1:7860页面就能看到WebUI的图形界面,安装好Microsoft Olive后在页面上看到ONNX和Olive的选项,在Olive里进入Optimiza ONNX model子选项点击下方优化按钮,就可以成功转换模型开始绘画了。


正向提示词:1girl,long hair,pink hair,game game cg,full body,best quality,masterpiece,realistic,8K wallpaper,beautiful and aesthetic,detailed background

反向提示词:nsfw,ugly,low quality,low res,bad bad proportions,EasyNegative,missing arms,extra legs,too many fingers,extra arms and legs,text,username

分辨率设置:512X512

迭代步进:20

提示词引导系数:7

生成批次、单批数量:1-1和1-3

生成过程中RX 7700 XT可以完全吃满GPU,12GB显存也基本用到尽了,游戏可达不到这种强度

RX 7700 XT的12GB显存一批次最多可以生成三张图,四张图就会出现报错,理论上相同情况下,24GB显存的RX 7900 XTX就应该可以一次生成六张图了,显存大才是王道。

来看看RX 7700 XT的生成速度吧,分为两种强度的测试,第一种就是一批次生成一张图,属于最常见的操作,而第二种就是一批次同时生成三张图。第一种情况下,使用Microsoft Olive优化后,可以比原版快足足7.5倍,4秒多就能出图。而一次生成三张图的情况,使用Microsoft Olive优化提升也不小,是原来的2.32倍,这效率其实还不错了,作为进阶AI绘图学习都可以。

最后汇总一下这两个月用RX 7700 XT跑多款游戏的帧数吧,在2K分辨率最高画质的3A游戏中它也能跑出流畅的帧率,并且可使用FSR 2和FSR 3技术获得更好的性能提升。


结语

从本次测试结果来看,由于有了Microsoft Olive转换工具的优化,像RX 7700 XT这样的中高端显卡,也可在Stable Diffusion中明显加快出图速度,相较原版生成时间缩短了2~7倍,AMD显卡总算也能在Stable Diffusion中大展拳脚,AIGC应用目前还处于初级爆发阶段,相信不久的将来AMD GPU对于AI加速的优化会越来越好。总得来说,目前RX 7700 XT可不止是一款能胜任2K分辨率的游戏显卡,比对标的RTX 4060 Ti要强不少,而且它的AI绘图效率其实也不错,很适合追求性价比的用户。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1