2023年7月27日,AI绘图圈一个里程碑的日子。
今天,Stability AI正式发布了下一代文生图模型—SDXL 1.0。官方声称,SDXL 1.0拥有目前所有开放式图像模型中最大的参数数量,采用了创新的新架构,包括一个拥有35亿参数的基础模型和一个66亿参数的优化模型。
在月初的时候,Stability AI放出了SDXL 0.9的试玩版,我进行了介绍,并讲解了当时支持SDXL 0.9的工具ComfyUI。
短短两周,最常用的Stable Diffusion工具WebUI迅速紧跟升级,对SDXL 0.9进行了支持(事实上,0.9和1.0区别不大,所以1.0发布后,WebUI就支持1.0了)。
在SDXL1.0发布后几小时,WebUI也跟着做了个版本号更新,升级为1.5.1。
SDXL 1.0的试用非常简单,只需要把两个大模型文件拷贝到models\Stable-diffusion 即可(同时需要专用的VAE模型,文末附下载)。
经过简单的试用,发现有些插件需要等待升级。
简单总结下SDXL1.0的特点:
1、绝大多数lora都无法在SDXL1.0的模型下使用。
也就是说,如果使用SDXL1.0的模型,提示词里不要出现lora。
当然了,很多模型创作者正在连夜改模型,预计很快将涌现出一大批支持SDXL1.0的新模型。
2、、SDXL1.0的模型对自然语言的理解能力远远大于Stable Diffusion 1.5。
在Stable Diffusion1.5下,我们往往需要用各种复杂的提示词来强调画面的细节,甚至还要给出特定的权重。而SDXL1.0能够轻松的理解自然语言。
可以直接输入句子(英文),然后绘制出惊喜的效果。
3、SDXL1.0绘制的画面细腻程度非常高。
如果是照片模式(比如输入相机参数),则画面逼近真实拍摄。
4、修脸的After Detailer插件支持SDXL1.0。
5、Roop插件支持SDXL1.0。
6、ControlNet暂不支持SDXL1.0。
不过,官方放出了正在适配中的新版ControlNet的预览效果,非常惊艳。
7、SDXL1.0绘图赏析:
(1)弹吉他的男人
提示词:
Canon 6D, 35mm, standing in the sunset of the city, smiling and playing the guitar as a man , HDR,UHD,8K, best quality
负面提示词:
nsfw,logo,text,badhandv4,EasyNegative,ng_deepnegative_v1_75t,rev2-badprompt,verybadimagenegative_v1.3,negative_hand-neg,mutated hands and fingers,poorly drawn face,extra limb,missing limb,disconnected limbs,malformed hands,ugly,FastNegativeV2,aid291,NegfeetV2
作为一个摄影师,我比较喜欢用相机参数,发现SDXL1.0对相机参数理解蛮到位。
(手指依然画的很糟糕)
(2)一个夹鸡蛋的牛肉汉堡
提示词:
Canon 6D, 35mm, HDR,UHD,8K, best quality ,A hamburger with beef and eggs in it
这个真实度,貌似可以商业应用了。
(3)换个动漫画风:山谷里的巨大机器人
提示词:
Anime style, giant robots in the valley
让人惊讶的是,同一个模型,在没有使用任何lora(还没有创作者改好)的情况下,画出的真实风格和动漫风格完全不同!
这在Stable Diffusion 1.5的时代,几乎是不可能的,一般需要两个不同的模型才能实现。
(4)抱着猫的女孩
提示词:
Sony A7,50mm,A girl holding a cat on the streets of the city , best quality, HDR,UHD,8K
这次我换了索尼相机,我比较喜欢用定焦,选了50mm焦段。
(5)第一个适配SDXL的“民间”模型:DreamShaper
SDXL发布后,迅速涌现了一大批支持的模型,其中最知名的是DreamShaper。
DreamShaper是C站最受欢迎且下载量最高的模型之一,在SDXL0.9发布的时候,该模型就做了适配。SDXL1.0发布后,迅速推出了DreamShaper XL1.0 Alpha2。
从版本号可以看出,这个版本尚不完善。
作者的介绍:
尽管这仍然是一个alpha版本,但我认为与基于xl0.9的第一个alpha版本相比已经有了很大改进。
对于你需要的工作流程,你需要Math插件进行舒适配置(或者手动重新实现某些部分)。
基本上,我先用DreamShaperXL生成第一张图片,然后将其上采样到2倍大小,最后使用DreamShaperXL本身或者适合的1.5模型(如DreamShaper7或AbsoluteReality)进行img2img(图生图)。
相比SDXL1.0它做得更好的地方是什么?
- 不需要refiner。只需做高分辨率修复(上采样+i2i)
- 更美观的人物
- 边缘模糊减少
- 75%更好的龙
- 更好的NSFW
我的眼神比较好,更好的NSFW,嗯,果然是LSP们的最爱。当然了,本文是绝对不可能放NSFW图的。
提示词:
photo of beautiful age 18 girl, pastel hair, freckles sexy, beautiful, close up, young, dslr, 8k, 4k, ultrarealistic, realistic, natural skin, textured skin
果然很梦幻,要比SDXL1.0发布的模型更美腻。
8、各种下载:
(1)SDXL1.0两个大模型:
https://www.123pan.com/s/ueDeVv-A20I.html 提取码:lgyh
(2)SDXL1.0专用VAE:
https://www.123pan.com/s/ueDeVv-920I.html 提取码:lgyh
(3)DreamShaper XL1.0 Alpha2:
https://www.123pan.com/s/ueDeVv-E20I.html 提取码:lgyh