当前位置:首页|资讯|AI绘画

【AI绘画】P104简要测试

作者:LdlAmethyst发布时间:2023-07-30

最近p104价格还不错,小黄鱼上100以下能拿,保风扇保算力保x4就行了。

于是就买回来玩玩,由于p104性能也不咋,但100元要什么自行车。


我手上这款技嘉的参数如下

可惜带宽只能x4 1.1       秒速大概1g/s传输
使用了魔改版的536.40驱动
cuda支持最高12.2 (驱动程序版本31.0.15.3640)

测试平台:

处理器:英特尔Xeon(至强)E3-1231v3@3.40GHz四核

主板:华硕B85-PROGAMER(英特尔B85芯片组)

内存:16GB DDR3 1600MHz(8GB+8GB)

显卡:

AMD Radeon (TM) R9 390 Series(4GB/迪兰恒进)

CYX-patch P104-100(8GB/英达)(驱动程序版本31.0.15.3640)

系统:Windows10 22H2 Build 19045


weibui使用:baf6946e06249c5af9851c60171692c44ef633e0(2023-06-05 11:13:41)版本

其他插件使用:version: v1.3.2  •  python: 3.10.11  •  torch: 2.0.1+cu118  •  xformers: 0.0.20  •  gradio: 3.32.0  •  checkpoint: 19dbfda152



第一组:P104 WDDM模式 亮机卡计算卡皆为390


模型第一次载入时:

512x512分辨率时

best quality, masterpiece, realistic, photo-realistic,
1girl, (Kpop idol), cute, cityscape, night, rain, wet, professional lighting, photon mapping, radiosity, physically-based rendering
Negative prompt: EasyNegative, paintings, sketches, lowres, skin spots, acnes, skin blemishes, age spot, glans, strange fingers, bad hand
Steps: 30, Sampler: Euler a, CFG scale: 7, Seed: 1246149072, Size: 512x512, Model hash: a074b8864e, Model: CounterfeitV25_25, Clip skip: 2, ENSD: 31337, Version: v1.3.2

Used embeddings: EasyNegative [119b]

Time taken: 16.26s

Torch active/reserved: 2899/4028 MiB, Sys VRAM: 5623/8192 MiB (68.64%)

耗时 16.26s 

后续模型载入第二次之后:

Time taken: 13.66s

Torch active/reserved: 2899/4028 MiB, Sys VRAM: 5623/8192 MiB (68.64%)

可以看到耗时减少,这个结论已经被论证过了不再赘述。

但可以看到控制面板和总耗时时间有差异,在高分辨率时现象尤为突出.


单批4图:

Time taken: 47.42sTorch active/reserved: 2911/4308 MiB, Sys VRAM: 5903/8192 MiB (72.06%)

单批8图:

Time taken: 1m 23.97sTorch active/reserved: 3262/5600 MiB, Sys VRAM: 7195/8192 MiB (87.83%)

1024x1024分辨率时


Time taken: 2m 47.43s  Torch active/reserved: 5329/12596 MiB, Sys VRAM: 8192/8192 MiB (100.0%)

又多等了1分半才合成好,显存倒是满了。

DDIM采样器类似

Time taken: 2m 46.75sTorch active/reserved: 5314/12578 MiB, Sys VRAM: 8192/8192 MiB (100.0%)


第二组:p104 TCC模式 

512x512

Time taken: 13.56sTorch active/reserved: 2901/4026 MiB, Sys VRAM: 4756/8118 MiB (58.59%)

单批8图:

Time taken: 1m 23.54sTorch active/reserved: 3257/5594 MiB, Sys VRAM: 6324/8118 MiB (77.9%)


1024x1024分辨率时

Time taken: 1m 25.65sTorch active/reserved: 5331/7016 MiB, Sys VRAM: 7748/8118 MiB (95.44%)

显然,出图速度明显提升,但计算速度没变化。从2分46到1分25,显存占用也略有优化


1024x1536

Time taken: 2m 46.15sTorch active/reserved: 6920/7204 MiB, Sys VRAM: 7936/8118 MiB (97.76%)

爆显存了,但没完全爆,被优化了,不知道为什么总量变成8118,很迷

跑个2k那就是完全炸了

DDIM

Time taken: 1m 28.48sTorch active/reserved: 5315/7000 MiB, Sys VRAM: 7732/8118 MiB (95.25%)

结果也类似,


结论,TCC有用,100元超值,但打游戏不行,带宽太小了,建议插上去24x7跑着玩,多卡并行计算的话,不是很懂,不知道能不能加速,或者叠加显存效果如何。同时这个驱动我也不好说,比较新,可能旧版优化更好?


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1