AIGC(AI生成内容)在今年开始呈现爆发性增长,包括(ChatGPT)语言模型、(Stable Diffusion)绘画、(synthesia)数字人等众多领域都有涉及,其中最为知名的莫过于Stable Diffusion绘画,最为广泛使用的Stable diffusion WebUI则是来自开源大神的Automatic1111,不过此版本对于AMD驱动支持并不友好,其AI加速器并未能很好发挥。
就在前几个月,AMD和微软合作优化了Microsoft Olive路径,可把基本模型从PyTorch转换成ONNX,以便发挥最佳AMD GPU的AI性能,官方数据显示用了此工具可把RX 7900 XTX的每秒迭代速度从1.87it/s提高到18.59it/s,提升非常巨大,并且经过多个版本的AMD驱动迭代优化,相信A卡在Stable Diffusion中体验会更好,这篇文章就来一起体验一下吧。
测试显卡来自中高端定位的蓝宝石RX 7700 XT白金版,外观还是采用白金版代表性的红色元素进行点缀,大尺寸双飞翼轴流扇的设计,也使之尺寸达到了280mm长,属于精通2K分辨率的游戏显卡,它还具有108个AI加速器和12GB GDDR6大容量显存,用来跑Stable diffusion也是个不错的选择。
配合AI绘图测试的处理器是锐龙 7 7700X,搭配主板来自微星MAG B650M MORTAR WIFI迫击炮,外观方面采用纯黑+斜纹主题设计,看起来就非常硬核,实际上它确实也采用了12(80A)+2的强悍供电,应付锐龙9 7950X都是没有问题,它还加持两组M.2冰霜铠甲,拥有全覆盖VRM散热片,是一款全能型千元级主板。
配备电源来自微星MPG A1000G PCIE5金牌全模组,它采用单路12V供电、全日系105℃电容,并通过了80PLUS金牌认证,最大的卖点就是标配原生12VHPWR 16pin供电接口,可适配现阶段及未来所有的高性能显卡,并且电源提供了10年之长的质保,妥妥能用上2~3套配置。
本次测试平台设置处理器锐龙7 7700X开启PBO技术,使用EXPO配置达成DDR5 6000C34 16GB*2双通道状态,并在BIOS中开启Resizable BAR技术提升一些显卡性能。本次测试安装的是AMD Adrenalin 23.11.1最新版本显卡驱动(强烈推荐),操作系统是Windows 11 22H2最新版本。
AMD GPU运行转换Microsoft Olive路径的Automatic1111 Stable Diffusion WebUI
关于Stable diffusion本地部署安装教程很多,甚至国内不少大神已经提供整合包使用,而对于AMD显卡来说,可以参考上述AMD官方这篇BLOG——针对Automatic1111原版WebUI通过Microsoft Olive优化的安装教程,基本软件是需要Git、Miniconda以及Python这些(显卡驱动需要Adrenalin版 23.7.2或更高版本),这里就不再详细介绍了,有兴趣可以去看看。
在部署过程中,一些模型基本都需要魔法才可下载,不然会出现网络错误的提示,也可以通过国内资源下载更方便一些。
正确部署完毕之后,打开http://127.0.0.1:7860页面就能看到WebUI的图形界面,安装好Microsoft Olive后在页面上看到ONNX和Olive的选项,在Olive里进入Optimiza ONNX model子选项点击下方优化按钮,就可以成功转换模型开始绘画了。
正向提示词:1girl,long hair,pink hair,game game cg,full body,best quality,masterpiece,realistic,8K wallpaper,beautiful and aesthetic,detailed background
反向提示词:nsfw,ugly,low quality,low res,bad bad proportions,EasyNegative,missing arms,extra legs,too many fingers,extra arms and legs,text,username
分辨率设置:512X512
迭代步进:20
提示词引导系数:7
生成批次、单批数量:1-1和1-3
生成过程中RX 7700 XT可以完全吃满GPU,12GB显存也基本用到尽了,游戏可达不到这种强度
RX 7700 XT的12GB显存一批次最多可以生成三张图,四张图就会出现报错,理论上相同情况下,24GB显存的RX 7900 XTX就应该可以一次生成六张图了,显存大才是王道。
来看看RX 7700 XT的生成速度吧,分为两种强度的测试,第一种就是一批次生成一张图,属于最常见的操作,而第二种就是一批次同时生成三张图。第一种情况下,使用Microsoft Olive优化后,可以比原版快足足7.5倍,4秒多就能出图。而一次生成三张图的情况,使用Microsoft Olive优化提升也不小,是原来的2.32倍,这效率其实还不错了,作为进阶AI绘图学习都可以。
最后汇总一下这两个月用RX 7700 XT跑多款游戏的帧数吧,在2K分辨率最高画质的3A游戏中它也能跑出流畅的帧率,并且可使用FSR 2和FSR 3技术获得更好的性能提升。
从本次测试结果来看,由于有了Microsoft Olive转换工具的优化,像RX 7700 XT这样的中高端显卡,也可在Stable Diffusion中明显加快出图速度,相较原版生成时间缩短了2~7倍,AMD显卡总算也能在Stable Diffusion中大展拳脚,AIGC应用目前还处于初级爆发阶段,相信不久的将来AMD GPU对于AI加速的优化会越来越好。总得来说,目前RX 7700 XT可不止是一款能胜任2K分辨率的游戏显卡,比对标的RTX 4060 Ti要强不少,而且它的AI绘图效率其实也不错,很适合追求性价比的用户。