【Stable Diffusion】“革命性突破”！GPU加速带来的文本生成图像的飞速突破

作者：信弘智能发布时间：2023-06-16

Stable Diffusion 是一种由文本到图像的生成式模型, 自2022年作为开源项目被发布在 Github 上以来, 受到了广泛的应用和飞速的发展. 在 Stable Diffusion 的生成过程中, GPU 带来了明显的加速效果.

本次测试针对 Stable Diffusion 软件在不同的GPU上的加速效果进行了测试. 我们利用Stable Diffusion 的文本生成图像的功能, 利用统一的提示词, 使用相同的工具, 保证了除 GPU 型号之外的硬件以及软件的一致性.

本次实验中采用的硬件规格如下 (Tab 1):

测试过程中, 生成10个批次的512*512规格的图像, 每个批次生成一张图片, 与10个批次每个批次6张图片生成的结果比较如下 (Bar 1):

Bar 1. 512*512 图像在不同批次数量下的速度比较 (单位: it/s)

从上图 (Bar 1), 可以看出性能最好的是NVIDIA RTX 6000 Ada, 比上一代的RTX 6000 在图片生成的速度上快了 2.2 倍, 比 RTX 2080 Ti 快了将近三倍. 第二性能比较好的shuyu RTX 4090, 但是在大批次的数据生成下, 4090 因带宽较高, 性能比RTX 6000 Ada 稍好一些. 第三是 RTX A6000 但是也达到了 18.72的速度.

比较直观一点的感受可以从下表中的图片生成时间来进行比较:

Tab 1. 512*512 在不同Batch Size下一个Batch的生成时间.

下图是对生成1024*1024图像, 在两个不同的生成规模下 (10 Batch 1 Size 和 2 Batch 5 Size) 图片的不同生成速度, 见 Bar 2:

Bar 2. 1024*1024 图像在不同批次数量下的速度比较 (单位: it/s)

当生成图片的规模上来之后, 发现企业级卡的性能表现更好, 在2 Batch 5 Size 的情况下, A30 可以达到 2.34 it/s. 其他个人级别的卡在性能上也出现了差异, RTX 8000 和 RTX 2080 Ti的速度优于 RTX 4090 和 RTX 6000 Ada.

我们还在服务器上用企业级卡做了对比测试, 结果如下:

A800 的性能最好, 是普通T4 的 8 倍, 是 A40, A30 将近两倍的速度.

结论

由上述实验结果可见, 如果只需要小批量生成数据, A6000 Ada 和 RTX 4090 可以提供较快的速度; 但是当生成需求或者数据量变大的时候, 内存更大且带宽更高的企业级卡更满足要求．

上海信弘智能科技有限公司（ZENTEK）是 NVIDIA 核心合作伙伴。我们提供 NVIDIA 最新的软硬件产品与解决方案，为人工智能，高性能计算，数字孪生等领域的客户需求提供专业的服务。

相关资讯

【Stable Diffusion】“革命性突破”！GPU加速带来的文本生成图像的飞速突破

推荐体验

相关资讯

Stable Diffusion 文本生成图像框架原理

BigDL 教程：使用 Stable Diffusion 从文本生成你自己的图像

AI元年来了？Stable Diffusion是否会成为AI绘画领域的一次革命性突破？

Amazon SageMaker + Stable Diffusion 搭建文本生成图像模型

ChatGPT自然语言生成技术的突破：AI带来的文本生成新进展

近期资讯

星湖科技获得发明专利授权：“一种L-组氨酸提纯及结晶的方法”

格力电器获得发明专利授权：“控制方法、装置、电子设备、磁悬浮压缩机及存储介质”

天汽模获得发明专利授权：“一种模具上、下模气路连通装置”

古井贡酒获得实用新型专利授权：“一种方形玻璃瓶罐抓瓶机构”

温度的科学与生活：如何理解、运用及珍惜变化带来的感动

轻松掌握Photoshop笔刷安装与使用技巧，提升设计效果！

电脑联网详解：有线与无线连接方式及常见问题处理指南

磁力在日常生活中的多种实用应用与便利性探索

盟固利获得发明专利授权：“一种固态锂离子电池用复合隔膜及其制备方法和固态锂离子电池”

充分利用微信：提升生活质量的多功能指南与社交技巧分享

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响