只需1%参数，效果超越ControlNet，新AI绘画控制大师来袭

作者：量子位发布时间：2023-09-25

AI绘画编程

“新·AI绘画细节控制大师”ControlNet-XS来啦！

敲重点的是参数只要原始ControlNet的1%。

就能做到蛋糕口味随意切换：

△左图为改前

改变一个人的行头也轻轻松松：

△左图为改前

上图同款，身形不变艺术氛围感拉满：

△左图为改前

自然风光也能hou住，一年四季任意切换：

△左图为改前

还有这猫头鹰，直接从活物变雕塑：

△左图为改前

参数很小的情况下，能做到这样的效果，网友也是直呼绝绝子，并迫不及待想看论文。

ControlNet-XS由海德堡大学计算机视觉实验室研发，目前相关论文、预训练模型还未公布。

但研究人员表示ControlNet-XSFID分数明显优于ControlNet。

且控制Stable Diffusion-XL和Stable Diffusion 2.1的代码将在不久后开源。

01 新生代控制大师

先来康康对StableDiffusion-XL的控制。

研究人员在评估了不同大小的控制模型后发现，控制模型甚至不必和2.6B参数的StableDiffusion-XL基础网络大小一样。

400M、104M和48M参数的ControlNet-XS控制也很明显。

深度图给出了更为直观的展示，根据图像内容的距离、深度，深度图呈现出准确的颜色深浅度：

要注意的是，这里研究人员设置的每行seed值不同，每列seed值相同。

此外，还有Canny边缘检测图，物体的边界、轮廓都能清晰地展现出来：

对StableDiffusion的控制，研究人员则是评估了491M、55M和14M参数的三个版本的ControlNet-XS。

结果表明1.6%的参数（865M）也能够可靠地控制生成过程。

那这是如何做到的呢？

02 从头开始训练

原始ControlNet是StableDiffusion基础模型（base model）中U-Net编码器的副本，所以接收与基础模型相同的输入，并带有额外的引导信号，比如说边缘图。

然后，经过训练的ControlNet的中间输出被添加到基础模型的解码器层的输入中。在ControlNet的整个训练过程中，基础模型的权重保持冻结状态。

ControlNet-XS的研究者们认为这种方法存在问题，ControlNet不必这么庞大。

首先是Stable Diffusion最终输出图像，是在一系列步骤中迭代生成的。每个步骤会在U-Net网络结构的编码器（Encoder）和解码器（Decoder）两部分中执行。

每次迭代基础模型和控制模型的输入是前一个步骤生成的图像。控制模型还接收一个控制图像。

问题在于，在编码器阶段这两个模型都独立运行，而控制模型的反馈只在基础模型的解码阶段输入。

总之，结果就是一个延迟的校正/控制机制。

也就是说ControlNet必须执行两项任务：一边校正/控制，一边还要提前预测基本模型的编码器将犯哪些“错误”。

通过暗示图像生成和控制需要相似的模型容量，自然而然地可以用基础模型的权重初始化ControlNet的权重，然后进行微调。

而对于ControlNet-XS，研究人员表示从设计上就与基础模型不同，是从零开始训练ControlNet-XS权重，解决了延迟反馈的问题。

如上图所示，方法是从基础模型的编码器添加连接到控制编码器（A），这样校正过程可以更快地适应基础模型的生成过程。但这并不能完全消除延迟，因为基础模型的编码器仍然没有受到引导。

因此，研究人员从ControlNet-XS添加额外的连接到基础模型编码器，直接影响整个生成过程（B）。

此外，他们还评估了在ControlNet设置中使用镜像解码架构是否有用（C）。

最终，研究人员在COCO2017验证集上，针对Canny边缘引导的三种不同变体（A、B、C）与原始的ControlNet进行了FID分数性能评估。

结果所有变体都有了显著提升，同时仅使用了原始ControlNet参数的一小部分。

研究人员又拿出了变体B，分别使用Canny边缘图和深度图引导，针对StableDiffusion2.1和StableDiffusion-XL分别训练了三种不同大小的模型。

所以下一步就等相关论文、代码以及预训练模型公布啦～

本文来自微信公众号“量子位”（ID:QbitAI），作者：关注前沿科技，36氪经授权发布。

近期资讯

想成为专业无人机飞手？新疆保华润天航空提供一站式CAAC民航执照培训服务！

你是否曾梦想过驾驶无人机在蓝天白云中自由翱翔？是否想过成为一名专业的无人机飞手？如果你的答案是肯定的，那么你一定不能错过乌鲁木齐的保华润天航空。保华润天航空是新疆首家获得CAAC认证的无人机培训机构，我们的培训课程涵盖了无人机的基本知识、飞行原理、操作技巧以及安全规范等内容，旨在帮助学员全面了解和掌握无人机的相关知识。我们的培训课程不仅有理论教学，更有实践操作环节。在我们的专业教练的指导下，你将有机会亲手操控无人机，体验飞行的乐趣，同时也能更好地理解和掌握所学的知识。此外，我们还提供一对一的教学服务，根据

会飞的大乌苏 2024-12-27

恩情 + 利益，“借电”蔚小理，雷军和他的小米汽车又下了一步好棋

车圈没有永远的对手，只要利益到位，竞争与合作随时都能转换。近日，小米汽车宣布，正式与蔚来、小鹏和理想（蔚小理）汽车展开充电补能网络合作。雷军随后在微博中写道：14000+ 蔚来充电桩、9000+ 小鹏充电桩、6000+ 理想充电桩，入驻小米充电地图。雷军的发言意味着什么，相信明眼人都看得出来，小米是在向蔚小理“借电”，以此来丰富自己的补能资源。我们都知道，小米初入车圈就拿到了非常不错的销量成绩，刚刚过去的11月，小米SU7交付已经超过了2万辆。作为车圈新人，能取得这样的业绩，无疑令人欣慰。而销量越高，用户

91che 2024-12-27

一笑聊知 2024-12-27

港大下学年新生必修AI基础课程，明年初试行名额500个

社会踏入人工智能和大数据时代，各大学亦相应变革迎接，香港大学今年成立计算与数据科学学院。港大计算与数据科学学院 2024年7月1日正式成立，学院由工程学院计算机科学系和理学院统计及精算学系组成。致力培育新一代科技人才，推动计算与数据科学、人工智能、统计决策科学、金融科技，以及精算学等领域的发展。新学院将于2025-26学年收生，开设多个本科生和研究生课程。计算与数据科学学院将开设两个新课程，分别为「计算与数据科学」（课程编号：6999）和「统计决策科学」（课程编号：6779）同时将应用人工智能、金融

维夕教育 2024-12-27

豪景物联：山东济南铁路变电站安防新招，激光对射报警系统揭秘

在现代城市化进程中，安全问题始终是一个无法忽视的重心。山东济南某铁路变电站最近引入了一项科技感十足的设备——周界激光对射报警系统。从专业角度出发，周界防护可以说是变电站的“第一道防线”，焊接各大变电站的电网安全。 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 激光对射报警系统凭借其高敏感度与准确度，能实现全天候无死角监测。具体来说，激光对射报警系统通过在周界设置多个对射点，形成一张隐形“激光网”。一旦有入侵者触碰到这些“激光网”，激光对射报警系统便会即

周界报警系统 2024-12-27

拼团小程序有哪些？

在电商领域，拼团小程序以其独特的社交购物模式迅速崛起，成为商家吸引流量和提高销售额的有效工具。拼团小程序有哪些？本文将深入探讨凡网云商城的拼团功能，帮助开发者和商家更好地理解和利用这一营销利器。拼团小程序是一种基于微信小程序平台的社交电商工具，通过用户之间的分享和组团购买，实现价格优惠。这种模式不仅增加了用户的参与感，还通过社交网络的传播效应，为商家带来了低成本的流量和高转化率的销售。凡网云商城工具的拼团功能以其易用性和强大的后台管理而受到商家的青睐。以下是其核心功能：创建拼团活动：商家可以在商城后台轻

帆可云官网 2024-12-27

保华润天航空新疆无人机培训，开启你的飞行生涯新篇章！

在广袤无垠的蓝天下，一架架无人机如同自由的鸟儿，在空中划出优美的弧线。这不再是遥不可及的梦想，因为保华润天航空新疆无人机培训正等待着每一位对飞行充满热情的朋友。想象一下，当你站在开阔的田野上，手中的遥控器轻轻一推，眼前的无人机便腾空而起，随着你的指尖舞动，它或盘旋、或俯冲、或翻滚，每一个动作都精准而优雅。这不仅是技术的展现，更是对自由与梦想的追求。保华润天航空作为新疆地区知名的无人机培训机构，拥有一流的教学设施和经验丰富的教练团队。他们不仅教授你如何操作无人机，更重要的是教你如何安全飞行，如何在复杂的气象

新疆无人机培训步煜天 2024-12-27

有机化合物晶体信息检索的高效方法

有机化合物的晶体结构在许多领域中具有广泛的应用，对于从事科研工作、药物晶型研究、光电子学及相关领域的人士来说，了解化合物的晶体信息是非常必要的。通过深入理解晶体结构与药物性质之间的关系，可以优化药物设计、提高药物质量、确保疗效和安全性；也能帮助科学家理解催化反应的机理以及反应中可能发生的分子间相互作用。如何快速查看有机物晶体信息？如何查看有机物晶胞参数？如何知晓晶体信息来源哪里？如何一键保存下载晶体3D结构图？不知道大家是否遇到过这些问题。为此笔者科普一个有机物晶体信息查询的数据库，非常简单，仅需3步。

山屿与鱼 2024-12-27

只需1%参数，效果超越ControlNet，新AI绘画控制大师来袭

01 新生代控制大师

02 从头开始训练

推荐体验

相关资讯

ControlNet精准控制AI绘画教程

AI绘画新controlnet插件各项功能效果，用法，适用范围介绍

ai绘画ControlNet扩展姿势控制openpose-editor

老鹿学Ai绘画：ControlNet线条类控制

AI绘画03ControlNet(openpose+deth)姿态控制

近期资讯

想成为专业无人机飞手？新疆保华润天航空提供一站式CAAC民航执照培训服务！

恩情 + 利益，“借电”蔚小理，雷军和他的小米汽车又下了一步好棋

新疆保华润天航空带你解锁最新无人机飞行技能，实现你的飞行梦想

全球供应链资源安全管理体系初探

岛国国主也敢称“天皇”？详解中国上古“三皇”

港大下学年新生必修AI基础课程，明年初试行名额500个

豪景物联：山东济南铁路变电站安防新招，激光对射报警系统揭秘

拼团小程序有哪些？

保华润天航空新疆无人机培训，开启你的飞行生涯新篇章！

有机化合物晶体信息检索的高效方法

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响