AI技术迭代非常快,在AI绘画领域,随着微软推出DALL-3,如今已初具三足鼎立的态势。
分别是付费版的Midjourney,免费开源版的Stable Diffsion和目前免费的DALL-3。
其中,只有Stable Diffsion可以部署在消费级显卡的个人电脑上。
从使用用户来说,Stable Diffsion是最多的,原因有三个:
一是免费(当然电脑硬件也是一个门槛),一台稍微说得过去的电脑就可以部署;二是开源,有很多好玩的插件可以折腾,自己也可以学习相应的代码甚至可以加入到开发者;三是个人电脑部署,无论画什么图,都不受任何监管... ...
不过,开源是一把双刃剑,会出现许多分支,每个分支都有不同的爱好者。
甚至Stable Diffsion都没有一个标准的界面,在2023年9月份之前,主要有两大界面。
第一个是大名鼎鼎的WebUI,国内秋叶一键包就是基于这个界面,也是我经常用来做教程的界面;
第二个是SDXL问世后,一炮走红的comfyUI,这个界面操作简洁、工作流模式为亮点,成为众多码农的最爱(但对于普通用户来说界面实在难以操控)。
直到有一天,一个插件的创作者心血来潮,写了一个极简界面,叫fooocus。
它简单到只需要输入提示词就可以操作,颇有Midjourney的风格。
在它发布1.0版本的时候,我曾经简单的做了介绍。
后来全身心投入WebUI界面进行创作,没有留意后续版本升级。
直到昨天,发现已经迭代到了2.1版本,打开代码一看,大吃一惊,已经完全今非昔比。
早期的版本内置了一个comfyUI,用comfyUI跑图,然后用自己写的界面展示,新版已经彻底摈弃了这种方式,重构了全部底层代码,连常见的配置文件都进行了变动。
因此,我觉得有必要重新写个安装教程。
一、强力推荐,有望成为最好的Stable Diffsion界面
fooocus的作者是著名插件ControlNet的创作者,可以说,这个插件给Stable Diffsion带来了革命性的全新体验。当画面可以精准的控制后,等于把Stable Diffsion从玩具变成了生产力。
然而该创作者(华人小哥)迅速移情别恋,拿出大把的精力去写fooocus,导致ControlNet的更新大大停滞。
随着fooocus更新越来越频繁,它的巨大优势也开始显现出来:
小显存用户的最爱。
WebUI的创作者用的是4090,24G显存用起来自然很豪放,所以早期WebUI的显存优化非常有限,爆显存时有发生,尤其是SDXL推出后,对显存的要求更是雪上加霜。
而fooocus对8G显存都比较友好,在显存利用方面做了极致优化,同样的模型、提示词、尺寸,出图速度几乎是WebUI的数倍。
在界面设计方面,fooocus只追求一件事:极简风。
如果专注创作,真的不需要更复杂的界面了。
二、安装步骤
1、下载
项目地址(需科学上网):
https://github.com/lllyasviel/Fooocus
当前最新版本是2.1.754
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-754.7z
每次启动会自动更新
2、解压缩即可使用
第一次启动会下载默认模型,不过程序启动后默认连接的几个地址都需要科学上网,为了避免速度过慢或者无法连接,可提前网盘下载(巧合的是,作者默认使用的几个模型都是我推荐过的):
(1)真实模型
juggernautXL_version6Rundiffusion.safetensors
https://www.123pan.com/s/ueDeVv-oBKI.html 提取码:lgyh
(2)动漫模型
https://www.123pan.com/s/ueDeVv-1BKI.html 提取码:lgyh
模型安装路径:\Fooocus\Fooocus\models\checkpoints
3、和WebUI共用模型
考虑到SDXL时代的模型体积非常巨大,动辄6G起步,建议和WebUI共用模型。
需修改user_path_config.txt 文件
把对应的路径改为WebUI的即可。
4、局域网共享
我的AI绘图是在一台专门的机器跑的,平时在笔记本电脑上操作。
为了方便局域网共享,需要将默认的127.0.0.1启动地址改为0.0.0.0。
修改 Fooocus\Fooocus\backend\headless\fcbh\cli_args.py
将第36行的default = "127.0.0.1"改为default = "0.0.0.0"
5、和WebUI共存
fooocus可以和WebUI同时启动(不要使用同一个端口),只要不同时画图,可以分别使用同一块显卡。
三、界面简介
fooocus默认只显示绘图区,点击“advanced”可显示左边的配置区。
1、设置,
设置区可以选择速度优先还是质量优先,同时可以选择图像尺寸。常见尺寸足够用了。
每次生成的图片数量、负面提示词(SDXL时代几乎不需要负面提示词)。
2、风格
常见风格,和WebUI的风格是一致的。
3、模型选择
可以选择模型和LoRA,操作非常简单,无需等待。不像WebUI切换模型等半天。
4、高级设置
保持默认即可。
5、图生图
基本上,一个AI绘画爱好者所有需要的功能,fooocus都有了。
考虑到作者本人同时是ControlNet的作者,fooocus植入ControlNet只是时间问题,如此看来,真的是给WebUI带来了巨大的压力。
照顾小显存+最常用功能+高效出图,fooocus很可能在未来的发展中脱颖而出,成为stable diffsion最受欢迎的界面。