当前位置:首页|资讯|Stable Diffusion|Midjourney|苹果

学习笔记|画下第一个AI小姐姐:搭建汉化版Stable Diffusion

作者:铁华团的黄金船发布时间:2023-05-28

顾城有一首诗非常美,诗里写到:

我希望/能在心爱的白纸上画画/画出笨拙的自由/画下一只永远不会/流泪的眼睛

一片天空/一片属于天空的羽毛和树叶/一个淡绿的夜晚和苹果

画下想象中/我的爱人/她没有见过阴云

她的眼睛是晴空的颜色/她永远看着我/永远,看着/绝不会忽然掉过头去

我也希望画下永远看着我的小姐姐,可惜,我不会画画怎么办?

如今,AI给了一个机会。


现在在最火的AI绘图工具莫过于midjourney,已经可以生成近乎可以直接用来商用的AI图片。

不过,midjourney有两个门槛,一个是有些操作需要科学上网,第二个是每月有一笔不大不小的费用(30美金)。

如果不是以绘图为职业,仅仅是兴趣爱好,或者相对AI绘图有一个相对较为底层的了解,或许有另外的不花钱的选择。

Stable diffusion。

Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的由文字生成图像的(text-to-image)模型。

重要的是,它是开源+本地化部署的。

需要声明的是,免费的,往往是最贵的,因为要有折腾的成本。

假如你是一个需要接商单的职业画师,建议还是去花钱。

二、给小姐姐完整的一生(身):硬件

首先你要有一块还算可以的Nvidia显卡,20系30系都可以,当然了,如果上最新的40系,除了价格贵以外,还可能会有开车太快的眩晕感。

如果实在没有显卡,集显用户也不是不能操作,比如我曾经用A家的集显跑一个多钟头算AI小姐姐,同样的参数,在Nvidia 3060上只需要5秒。

在预算较低的情况下,3060是一个非常不错的选择,为了后续使用ChatGLM,我特意选了12G显存的配置,内存16G,硬盘换成了长江存储颗粒的2T容量SSD。

最近长存颗粒杀红眼了,2T只需要500块。

本来我看好了一套深度学习的主机,要2万块,但想了想不如先从起步开始。

3060的全套配置(不含显示器)下来,只需要6000块。

三、选择一个汉化好的安装包

Stable diffusion是开源的,已经有了不少的汉化的不错的版本。

如果你是老手,请点击右上角的关闭符号;

如果你是新手,本文会给你一个简单到“一键式”使用的操作方式。

下载(秋叶一键包):

https://www.bilibili.com/video/BV1iM4y1y7oA/?spm_id_from=333.999.0.0&vd_source=3588264da3df65cac2f5e05741467e81 

这个安装包整合了Stable diffusion依赖的所有环境,可以一键启动.

不过体积也比较大,差不多十几个G,如果想要获得很好的效果,还要下载安装一些模型,一般模型都要几个G,所以2T的硬盘是有必要的。

启动界面说明:

生成引擎是选择你要计算用的显卡,显存优化根据你的显卡实际容量进行选择,监听端口默认7860,这个端口可以修改,如果开放远程连接,则需要在系统的防火墙里进行配置,允许TCP协议通过7860(或修改后)的端口。

开放远程连接的好处是可以在其他电脑(局域网内)甚至手机上连接该电脑,进行AI绘图。这样我只需要把台式机塞在桌子底下,用笔记本连接进行绘图即可。

如果拥有公网地址,则可以通过路由器配置端口映射在互联网随时访问。

以win11为例,在防火墙和网络防护--高级设置--入站规则,增加一个规则“7860”,规则的内容为TCP协议允许7860特定端口被访问。

三、开始你的第一张AI小姐姐吧:常见功能介绍

程序启动成功后,系统会自动打开浏览器并跳转到绘图页面。

如果在局域网里其他电脑访问,可以采用 http://ip地址:7860 的方式。

最常用的是“文生图”功能,也就是用文字触发AI绘图,现在大部分版本只支持英文,这对使用者输入关键词的能力非常高。


备注:这是一篇旧文,Stable Diffusion已经广泛流行,可参考价值不大,把之前发在其他平台的文章逐步搬运过来,形成一个系列。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1