近期,一个名为 Stable Diffusion 的小呆萌进入了大家的视野,一时间竟成为粉丝无数的网红明星。它来自前沿技术力量Anthropic的研发机构,拥有生成式AI图像的独门技艺。只见它挥动魔杖,口中念念有词,神奇的画面就从脑海中飞跃而出,栩栩如生。
我也加入了小呆萌的粉丝团,兴奋地研究它的各种用法。调皮的它总能带给我惊喜,这也激发我从新的视角审视世界。我发现,小呆萌的魅力不仅在于生成图片,更在于启发我们的创造力和想象力。
今天,就让我们来慢慢品味这款来自未来的魔法软件吧。
放下成见,用开放积极的心,一起探索Stable Diffusion这片奇思妙想的海洋。
相信用心体会,我们一定能在这个小呆萌身上,看到科技与艺术融合的无限可能。来吧,让我们开始一次奇妙的Stable Diffusion之旅!
在使用的过程中,我发现了一些大家都没有发现的潜力,所以,我不是教大家如何使用 Stable Diffusion 或者 Midjourney 来换个头像,或者制作一些图片,我想从另外一个角度,让大家更加理解 Stable diffusion 带来的一些可能得变革。
我也希望,我能用大家都能理解的表达方式,尽量将内容做的简单一些。
首先,我们来看一下目前最主流的两款AI设计软件的区别:
1、Midjourney ,一个在线的付费设计软件,在这个网站,你可以通过自己提供的样图和提示词,生成你希望制作的一些图片;
2、Stable Diffusion , 一个开源的 AI 设计平台,由各路大神提供了各种内核、前端(GUI)、模型、算法、提示词等的免费的软件平台,所有的需要用到的工具在:Github、Hugging Face、和 Civit AI(即C站) 上都能免费下载。提示:这三个网站非常重要哦,一定要保存收藏!
以上做一些基础的知识普及,接下来我们来详细了解下 Stable Diffusion
Stable Diffusion 和 Midjourney 最大的区别就是一个采用了开源生态的策略,一个采用了闭源的软件策略。就目前AI发展暂时不是很成熟的情况下,我个人比较支持 Stable Diffusion 的方式,虽然在使用和部署环节,会让一些人望而生畏,但是可以足够大的调动各类参与者的积极性,因为谁也不知道 AI 的发展接下来会成为什么样子。
做为微小的个人,我们不需要太关心算法,因为那些会有全世界各类潜水的大神会去一步步更新升级,我们只需要认真关心好软件的使用
那 Stable Diffusion 的使用最重要的是什么呢?
就是:模型;
这是所有使用者都离开不了的一个环节
Stable Diffusion 的使用过程中,除了软件平台本身,用户需要关心到的东西就三个:
1、插件,负责调用 Stable Diffusion 的算法 和 补充新手使用者不熟悉的操作方式;
2、模型,负责帮助用户生成各种类型的图片 或者 二次生成为 GIF 动画和视频;
3、提示词,负责用户根据自己的需求和选用的模型进行图形设计表达
以上三个重要环节中,跟用户和作品产生最直接关系的就是模型了。
那么什么是模型?各个模型之间又存在怎样的关系?这些模型又是如何使用的呢?
1、什么是模型?
模型,简单来说就是图片大数据集,通过将大量相似类型图片归类在一起,用算法将这一类图片做出来的一个归类集合。比如:真人画像型、二次元动漫型、3D仿真型等等等。
2、模型之间的关系
各种模型给予各自的算法特点为基础,建立基于自己底层算法优势的特长,让图片有更加出色的展现。模型的优先级是:基础模型 > 二次模型 > 细节组件
3、如何加载各项模型
加载模型的方式也非常简单,就是在提示词输入框中,插入相关模型的名称并设置需要占用的比重值就可以了,例如:需要加入一个人物形象,就输入:
为什么在视频的前期需要花这么长的篇幅介绍一下模型,主要原因就是在我的视角里,模型在未来的重要性,也是我建议大家都要了解 Stable Diffusion 的原因。
我们知道,在过去的几年里,互联网有几个很重要的东西:区块链、元宇宙、人工智能。只是这几样东西都一直给大家的感觉是一个热点,并没有爆发,很重要的原因就是算力的不足,尤其是在元宇宙产品领域,使得现有的元宇宙产品都显得还像上世纪的产品。
区块链的主要代表就是比特币、以太坊等虚拟链上产品,元宇宙目前的主要代表就是一些区块链游戏和类似 Facebook Meta 的 VR、AR产品,但小编认为这并不是元宇宙。区块链产品之所以目前还未被很多用户所接受的原因就是:所有的虚拟币、NFT数字产品等,都还处于纯虚拟的状态,至少除了支付交易功能外,并未接入到人们的现实生活;而 VR、AR产品也并没有真正的实现所谓的元宇宙。
我个人理解的元宇宙,并不一定需要 VR、AR 的虚拟3D,但是有一个很重要的环节,就是虚拟世界与现实世界的结合,甚至是同步,这个并不一定需要 VR 和 AR,但是一定需要有和日常生活、工作产生关联的虚拟世界,可以是2D,当然也可以是3D。在没有能和现实生活的需求产生关联之前,元宇宙只是概念。
但是, Stable Diffusion 的出现,让我感觉到了现实与虚拟的结合。
比如:假如有一天 C 站 全面完成区块链化, Stable Diffusion 也发布一条区块链,在所有的的模型和作品中,都自动生成一段或者多段加密的哈希值代码,这样,每个人训练的模型和制作的作品,都有了版权归属,当你需要用一个模型进行设计的时候,可能就需要付费给该模型的训练所有者;然后某个人制作的 AI设计文件,有人需要使用的时候,也需要付费给制作该设计稿的制作方,这仅仅是用 Stable Diffusion 的图片来举例。
那么,普通人怎样能从未来的 Stable DIffusion 中挣到钱呢?
假如某一天 Stable DIffusion 真的完成了区块链化,目前能猜测到的普通人能挣到钱的方式有以下几种:
1、模型炼丹,制作各种主题大模型,这个需要一定的技术水平,对于有一定编程能力的IT从业人员比较有机会;
2、Lora炼丹,可以制作自己的头像模型,发布到类似C站的平台网站,使用者将向提供者支付一定的费用,就像现在的头条专栏和西瓜自媒体有分成一样;当然,也可以扩展出以下,比如:一套汉服模型、一套服装模型、一款鞋的模型等等;
3、图片设计,根据自己的擅长领域,设计适合各个领域的独特的风格图片,在平台销售图片版权。
4、炼丹服务商,就是帮助别人炼丹,修炼模型
5、也可能衍生出别的,但是目前我还没有想到,想到了再出视频告诉大家……
不过,我们可以把思想再放大一些,假如:图片、视频、三维、动画、声音、文字等一系列领域都有一个开源的开放大模型,都各自有一条各自的区块链,那么每个人就可以在各自擅长的领域制作相关的模型或者作品,然后发布在类似C站的链上资源交易平台。这样就会形成各式各样的 Opensea 平台,这些平台和 Opensea 的区别就是,模型和作品都会成为和现实工作、生活需求相结合的区块链,而不仅仅是一些虚拟地皮、设计图的交易。如果再开放一些,比如:Nvidia Omniverse 工业 AI 平台,也发展成这样,所有的企业可以将自己的产品制作成工业品模型,然后自动化企业可以直接采用各类模型设计用户的生产流水线,用户生产使用过程中再结合每一个时刻的使用监控数据,这样是不是就实现了日常生活的元宇宙和工业生产的元宇宙。
目前 Stable Diffusion 仅仅只是在图文设计领域开启了新的篇章,以后会走向怎样,我们还不确定,如果按照我上面的一些看法的方向发展,以 Stable Diffusion 为代表的一系列 AI 大模型和开发工具,正在带领大家逐步开启真实的元宇宙的大门
基于以上的一些看法,我建议看过这篇视频的你们,记得都要去了解一下 Stable Diffusion ,通过对 Stable Diffusion 的了解,知道如何使用最近的科技帮助你改善现有的工作和学习的流程,并且通过熟练的掌握这些技能,亲身体会的感受未来科技与社会的发展方向。