让Stable Diffusion一秒出图！清华硕士加速神器爆火，已有公司接入

作者：量子位发布时间：2023-11-22

Stable Diffusion 清华 LoRA

克雷西发自凹非寺

量子位 | 公众号 QbitAI

AI图像生成，已经进入了秒速级别，只要4步推理就能完成绘制，最快更是能在1秒之内完成。

现在，清华大学联合HuggingFace的研究人员，推出了全新的绘图模型加速模块。

作者给出的体验版当中，点击生成按钮后，模型只用了几秒钟就绘制出了4张清晰的图像。

这个加速模块叫做LCM-LoRA，发布后不久就斩获了2k+次GitHub星标。

它不仅加速能力强、泛化性能好，适配的模型也很广泛，SD系和LoRA模型都能用它来加速。

团队基于LCM-LoRA自行优化的文生图模型已在HuggingFace上开放体验，图生图模型也推出了CoLab等版本。

AI绘图工具迅速接入

LCM-LoRA开源后不久，就有AI绘图工具厂商Scenario宣布将基于它推出“实时绘图”功能。

Scenario的CEO还在𝕏上亲自展示了即将上线的实时绘图功能DEMO。

只见一边在绘制草图，另一边AI就把相应的画作绘制好了，时间上几乎同步。

调整提示词和有关参数，模型响应得也是干脆利落。

这些DEMO发布后，引发了众人的一致赞叹。

那么，LCM-LoRA这个加速模块到底有多强，又是怎样实现的呢？

“跳步”降低内存开销

LCM-LoRA将LoRA引入潜在一致性模型（LCM）的蒸馏过程，显著减少了训练内存开销，从而提高性能。

而LCM是从潜扩散模型（LDM）中蒸馏出来的，“蒸馏”的过程也可以看做是对扩散模型的微调。

它的核心思想是在图像的隐变量空间中学习一致性映射函数，该函数可以直接将扩散过程中的任意点映射到终点，即微分方程的解。

通过这种一致性映射，LCM可以跳过迭代采样过程，直接进行少步甚至一步采样，从而极大地加速了图像的生成。

而隐变量空间操作相比基于像素空间的方法，计算复杂度和内存需求也更低。

结合LoRA后，只需要训练低秩分解矩阵，可训练参数量和内存开销进一步减少，应用范围也从单纯的文生图扩展到了图生图和视频生成。

最直观体现的就是我们看到的秒速出图，而训练时间上，LCM-LoRA优化后的模型在A100上训练只需32个GPU时。

训练时间缩短的背后，也于训练参数量大幅减少密切相关：

SD-V1.5全量参数为9.8亿，使用LoRA后可训练参数减少到6750万，约减少了93.1%。
SSD-1B参数从13亿减少到1.05亿，约减少了91.9%。
SDXL参数从35亿减少到1.97亿，约减少了94.3%。

不仅是训练消耗的降低，推理过程中的步数也大幅减少，一般只需要4步推理就能绘制出质量不错的图像。

有时甚至只要一步就能完成，用时还不到1秒，FID分数（越低越好）在50以下。

不仅加速性能优异，LCM-LoRA的适配性也十分广泛。

LCM-LoRA训练得到的LoRA参数又称为加速向量，可以数据集上微调得到的LoRA参数直接线性组合，不需要额外训练。

这种组合方式使得LCM-LoRA成为一个可直接插接到各种微调模型中的通用图像生成加速模块。

作者简介

LCM和LCM-LoRA论文的两位主要作者是来自清华大学交叉信息研究院的研究生骆思勉（Simian Luo）和谭亦钦（Yiqin Tan）。

清华叉院的黄隆波副教授、李建副教授和赵行助理教授也参与了这两项研究。

在LCM-LoRA的工作中，来自HuggingFace的研究人员亦有贡献。

论文地址：

[1]https://arxiv.org/abs/2310.04378

[2]https://arxiv.org/abs/2311.05556

— 完—

「量子位2023人工智能年度评选」企业申报倒计时！

今年，量子位2023人工智能年度评选从企业、人物、产品/解决方案三大维度设立了5类奖项！扫码参与评选 ⬇️

MEET 2024大会已经开启报名！> 点此跳转报名 <

点这里👇关注我，记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关资讯

让Stable Diffusion一秒出图，清华硕士加速神器爆火，已有公司接入

推理阶段只需四步

Stable Diffusion 清华

量子位 2023-11-17

新智元 2023-04-27

【1387期】超强AI绘画Stable Diffusion，5秒出图效果拉爆！

AI绘画Stable Diffusion豪华版资料包支持系统：Windows、Mac系统获取方式：请查看文章底部 [图片] Midjourney和ChatGPT之前都更新过大家反馈都是非常好非常全的资料有些朋友想要更多SD学习资料今天阿香又为大家带来了 AI绘画Stable Diffusion豪华版资料包比之前更新的资料更全包含系统使用教程&插件&模型&AI关键词等等让你快速上手这应该是全网最全的豪华资料包了 #资料目录一览# [图片] 以下是基于Stable Diffusion

AI绘画 Stable Diffusion Midjourney ChatGPT

阿香素材 2023-11-01

近期资讯

成都先导：HG146胶囊Ⅱ期临床试验启动并完成首例受试者入组

近日，成都先导公告披露，公司自主研发的1.1类创新药物HG146胶囊已完成Ⅰ期临床试验，开启治疗复发或转移性腺样囊性癌的Ⅱ期临床研究，并已于日前完成首例受试者入组，这标志着HG146胶囊的临床研究在验证有效性和安全性的道路上迈出了重要的一步。HG146胶囊临床研究的推进，有望为患者群体带来新的治疗选择。

中国证券报 2024-12-30

长沙超算，湘当有为 | 山水洲城记

“目前在‘天河新一代’主机上完成9大类286款基于国产计算设备的应用软件开发、移植和适配，涵盖计算化学、分子动力学、流体力学、人工智能、生物信息、数学等应用领域，初步建立了‘天河新一代’国产软件生态。”

长沙晚报 2024-12-30

SIE CEO：PS5硬件质量过硬会有很长的生命周期

西野英明表示，PS5的生命周期延长不会影响新硬件的推出时机，新技术的引入与技术进步紧密相连。索尼希望在现有硬件继续提供娱乐的同时，引入新技术，逐步扩展整个生态系统。关于PS5Pro的筹备，西野英明则认为产品的推出需要平衡技术、价格和时机，索尼始终在考虑何时推出产品最符合市场需求。

游侠网 2024-12-30

央视《焦点访谈》：岚图汽车彰显中国先进智造实力

工厂屋顶上一排排整齐排列的太阳能光伏板，年发电量2000万千瓦时；车间内935台机器人协同作业、如臂使指；AGV智能搬运机器人满载零部件，沿既定轨道驶向装配生产线；总装车间内，每118秒，就有一辆汽车从智能流水线诞生……12月28日晚黄金时段，中央电视台《焦点访谈》栏目特别策划的《信心2024》制造业专题开播，岚图汽车高端智造工厂、岚图...

中新汽车 2024-12-30

微星发布全新显示器型号MPG-325CQRXF 支持AI Vision

这款产品配备了一块31.5英寸的RapidVA曲面屏，其曲率为1000R，分辨率达到2560x1440，并且支持刷新率在48至280Hz之间。响应时间达到0.5msGTG，最大亮度可达350cd/m2，峰值亮度可达到400cd/m2。

中关村在线 2024-12-30

英伟达押注下一个增长点：“人形机器人大脑”Jetson Thor预计明年上半年上市

面对芯片业务日益激烈的竞争，英伟达正在押注机器人技术作为其下一轮增长的主要驱动力。12月29日，《金融时报》报道，英伟达将在2025年进一步加大对机器人技术的投入，在明年上半年推出新一代用于人形机器人的紧凑型计算机JetsonThor。

华尔街见闻 2024-12-30

在轨实施181个项目！报告首次发布→

据中国载人航天工程办公室消息，12月30日，在即将迎来中国空间站全面建成两周年之际，该办公室首次公开发布《中国空间站科学研究与应用进展报告》（2024年）（以下简称《报告》）。

光明网 2024-12-30

用AI之眼探索万物，支付宝上线“探一下”

12月30日，支付宝推出新一代AI视觉搜索产品“探一下”，基于自研的多模态大模型技术，可“用AI之眼探索万物”，提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物，就能让AI通过摄像头，识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等，还能趣味解读萌宠照、宝宝照等，晒图不愁配文案。

扬子晚报 2024-12-30

科创解码｜对话张波：新材料助力绿水青山，“绿氢”来了

地球上70%是水，水里是氢和氧，这样看来氢的含量非常多。怎么把这个成本降下来？张波说，如果用了更低价格的绿电产出来的氢气，比如一度电降到两毛钱以内，一公斤氢气10块钱都不到，那交通成本的价格也会降下来，氢能燃料电池汽车也有望更加普及、走向社会。

东方网 2024-12-30

支付宝上线AI视觉搜索产品“探一下”，可拍图识别花草美食等

继今年7月推出“碰一下”功能后，12月30日，支付宝推出新一代AI视觉搜索产品“探一下”。“探知识”即，用户遇到不懂的事物或知识，包括花草、昆虫、美食、建筑、展览物品等，可通过“探知识”实现AI随手识图，收获新知。

财经天下WEEKLY 2024-12-30

让Stable Diffusion一秒出图！清华硕士加速神器爆火，已有公司接入

推荐体验

相关资讯

让Stable Diffusion一秒出图，清华硕士加速神器爆火，已有公司接入

一秒出图，爆火的Stable Diffusion到底有多牛？

1120 早早聊 AI 资讯｜OpenAI 董事会秒反悔！奥特曼被求重返 CEO 职位、马斯克的星舰发射后失联自毁、SD 一秒出图！清华硕士加速神器爆火...

手机跑Stable Diffusion，12秒出图，谷歌加速扩散模型破记录

【1387期】超强AI绘画Stable Diffusion，5秒出图效果拉爆！

近期资讯

成都先导：HG146胶囊Ⅱ期临床试验启动并完成首例受试者入组

长沙超算，湘当有为 | 山水洲城记

SIE CEO：PS5硬件质量过硬会有很长的生命周期

央视《焦点访谈》：岚图汽车彰显中国先进智造实力

微星发布全新显示器型号MPG-325CQRXF 支持AI Vision

英伟达押注下一个增长点：“人形机器人大脑”Jetson Thor预计明年上半年上市

在轨实施181个项目！报告首次发布→

用AI之眼探索万物，支付宝上线“探一下”

科创解码｜对话张波：新材料助力绿水青山，“绿氢”来了

支付宝上线AI视觉搜索产品“探一下”，可拍图识别花草美食等

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响