Stable Diffusion是一个2022年发布的深度学习文本到图像生成模型,简单的说,我们可以通过Stable Diffusion 将一段文字变成图像,比如:一个女孩在森林中散步。将这句描述输入给Stable Diffusion,Stable Diffusion就会根据描述生成相应的图片,如下图所示,是不是感觉就像魔法一样。
二、什么是Stable Diffusion WebUI?
Stable Diffusion WebUI是对Stable Diffusion模型进行封装的工具软件,提供了带有用户界面的操作环境。可以简单地理解为,Stable Diffusion是“父亲”,拥有核心的生成算法;而Stable Diffusion WebUI则是其“儿子”,继承了父亲的功能,并在此基础上进行了优化和用户界面的改良。
优点:Stable Diffusion WebUI 是开源的,免费的,可以部署在本地计算机上,支持多平台部署,生成图片没有限制(🙅不可以涩涩),图片可控度高,插件众多。
缺点:本地计算机配置需求高(土豪略过),安装包较大(土豪略过),学习门槛略高于其他AI绘图工具。
Stable Diffusion WebUI、Midjourney、Fooocus和ComfyUI是目前市场上主流的AI绘画工具,它们各自都有一些独特的优缺点。
Midjourney是一款线上的平台,优点是适合新手快速上手,无需本地配置,缺点是需要翻墙(漂亮国的),会员付费,生成图片的不稳定性和不可控性。
Fooocus和Stable Diffusion WebUI一样,可以本地部署,优点是比Midjourney还要简单,配置比Stable Diffusion WebUI低一些,出图快,缺点是省去了参数调节,专注于出图,在图片可控方面没有Stable Diffusion WebUI好,暂不支持插件。
ComfyUI是一款基于节点流程式的Stable Diffusion AI绘图工具WebUI,优点是出色的生图速度,节点流程,一套流程反复用,节省操作,未来可期,缺点是不开源。
(一)Stable Diffusion WebUI运行是需要吃显卡显存的,想要深入学习Stable Diffusion WebUI的同学,建议显卡显存最好16G起步,如若只是玩玩,不涉及更高级的操作,4G是最低要求,这里推荐N卡,也就是NVIDIA的显卡,不是不建议A卡,使用A卡运行Stable Diffusion WebUI并不是完全不可行的,相比N卡,A卡在运行Stable Diffusion WebUI时可能存在一些问题,比如不兼容、性能损失等问题。
(二)在学习Stable Diffusion WebUI的时候会接触到各种风格的模型,这些模型大小每个都在2G以上,在Stable Diffusion WebUI中我们会经常进行切换模型的操作,经测试,机械硬盘切换模型需要30秒左右,固态硬盘切换模型只需要3秒,建议使用1T固态硬盘,毕竟系统和学习资料也需要地方🤭。
(三)内存条16G起步,更大的内存可以提供更稳定的运行环境和更高的效率,建议双8G,双16G内存条。
看我说了这么多的要求,是不是吓退了很多同学,莫慌,Stable Diffusion发布以来,经过多个版本的迭代以及众多开发者为其开发插件,Stable Diffusion拥有无限的可能,我们可以通过Stable Diffusion WebUI实现各种天马行空的想法,比如头像设计、海报设计、书本插图、儿童绘画故事、漫画、室内设计、游戏图标、模特换装、游戏人物设计、二维码梅花等等,甚至我们可以用Stable Diffusion WebUI的ControlNet插件让图片动起来,让我们一起抓住AI绘画的风口,一起飞起来吧,关注我,不迷路🙂。