最近p104价格还不错,小黄鱼上100以下能拿,保风扇保算力保x4就行了。
于是就买回来玩玩,由于p104性能也不咋,但100元要什么自行车。
我手上这款技嘉的参数如下
测试平台:
处理器:英特尔Xeon(至强)E3-1231v3@3.40GHz四核
主板:华硕B85-PROGAMER(英特尔B85芯片组)
内存:16GB DDR3 1600MHz(8GB+8GB)
显卡:
AMD Radeon (TM) R9 390 Series(4GB/迪兰恒进)
CYX-patch P104-100(8GB/英达)(驱动程序版本31.0.15.3640)
系统:Windows10 22H2 Build 19045
weibui使用:baf6946e06249c5af9851c60171692c44ef633e0(2023-06-05 11:13:41)版本
其他插件使用:version: v1.3.2 • python: 3.10.11 • torch: 2.0.1+cu118 • xformers: 0.0.20 • gradio: 3.32.0 • checkpoint: 19dbfda152
第一组:P104 WDDM模式 亮机卡计算卡皆为390
模型第一次载入时:
512x512分辨率时
best quality, masterpiece, realistic, photo-realistic,
1girl, (Kpop idol), cute, cityscape, night, rain, wet, professional lighting, photon mapping, radiosity, physically-based rendering
Negative prompt: EasyNegative, paintings, sketches, lowres, skin spots, acnes, skin blemishes, age spot, glans, strange fingers, bad hand
Steps: 30, Sampler: Euler a, CFG scale: 7, Seed: 1246149072, Size: 512x512, Model hash: a074b8864e, Model: CounterfeitV25_25, Clip skip: 2, ENSD: 31337, Version: v1.3.2
Used embeddings: EasyNegative [119b]
Time taken: 16.26s
Torch active/reserved: 2899/4028 MiB, Sys VRAM: 5623/8192 MiB (68.64%)
耗时 16.26s
后续模型载入第二次之后:
Time taken: 13.66s
Torch active/reserved: 2899/4028 MiB, Sys VRAM: 5623/8192 MiB (68.64%)
可以看到耗时减少,这个结论已经被论证过了不再赘述。
但可以看到控制面板和总耗时时间有差异,在高分辨率时现象尤为突出.
单批4图:
单批8图:
1024x1024分辨率时
又多等了1分半才合成好,显存倒是满了。
DDIM采样器类似
第二组:p104 TCC模式
512x512
单批8图:
1024x1024分辨率时
显然,出图速度明显提升,但计算速度没变化。从2分46到1分25,显存占用也略有优化
1024x1536
爆显存了,但没完全爆,被优化了,不知道为什么总量变成8118,很迷
跑个2k那就是完全炸了
DDIM
结果也类似,
结论,TCC有用,100元超值,但打游戏不行,带宽太小了,建议插上去24x7跑着玩,多卡并行计算的话,不是很懂,不知道能不能加速,或者叠加显存效果如何。同时这个驱动我也不好说,比较新,可能旧版优化更好?