学习Stable Diffusion人工智能绘画,你需要对如下名词、专业术语等有所理解才行。
下面带你快速理解Stable Diffusion中各种专业术语,用通俗易懂的话解释如下:
可以理解为AI绘图的基础数据库,是使用大量的数据训练出来的。一般文件比较大,2G以上。
全名Variational autoencoder,中文名变分自编码器,作用可以理解为滤镜+微调,有的大模型有对应的VAE,没有的也可以选择使用常用的
vae-ft-mse-840000-ema-pruned.safetensors,作用就是让图片看起来不那么灰蒙蒙的,会更加鲜艳。
全称Low-Rank Adaptation of LargeLanguage Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。LoRA的作用是可以让结果倾向于一种风格,比如使用水墨风LoRA可以使结果是水墨风格,使用人物LoRA可以使人物趋向于一种样貌。
可以理解为把大量的提示词(prompt、tag)打包在一起,就把他理解为提示词合集也行,所以文件很小。和LoRA有点类似,比如使用冬天风格的embedding可以使结果趋向于冬天。
Stable Diffusion中的一款很重要的插件,有了它可以让Stable Diffusion能更精确的控制生成的结果。
之后将重点讲解它的用法!持续更新。
已经整理好,如图所示。
接着最近又接触了几个与人工智能编程相关的专业名词,比如在Stable Diffusion界面最下面出现的一些专业术语。
不用说了,很火的编程语言,人工智能领域常用编程语言。比如我们的Ai绘图软件Stable Diffusion,90%的语言是用python编写的。
是一个版本管理工具或者版本控制系统,是可以离线使用的存储在本地的代码仓库,作用是可以记录各种版本的修改,可以随时回溯到以前的版本。
GitHub则是把代码保存在云端的仓库,是一个保存程序代码的网站,很多国际上的技术大牛都在github上有自己的开源代码。回到人工智能软件Stable Diffusion,我们会发现他的主要程序是保存在GitHub上的,我们可以去随意下载。我们也可以通过git clone等命令直接从GitHub上复制下载插件。
我们先来问下Cursor(GPT3.5),他的解释如下:
PyTorch是一个流行的开源机器学习框架,它提供了许多用于构建和训练神经网络的工具和接口。它的主要优点之一是它的动态计算图,这使得它更易于使用和调试。PyTorch还提供了许多预训练的模型和工具,使得构建和训练深度学习模型变得更加容易。它也支持GPU加速,这使得它在处理大型数据集时更加高效。
总之,PyTorch是一个功能强大的机器学习框架,它提供了许多工具和接口,使得构建和训练神经网络变得更加容易和高效。如果您需要更多关于PyTorch的信息,建议查看官方文档。
Pytorch可以说是torch的python版,然后增加了很多新的特性。回到Stable Diffusion,可以看到页面下面所用的torch版本。说白了,其实就可以理解为torch是用来训练大模型的。
是一个模块化和可编程的Transformer建模库,可以加快图像生成速度并减少显存占用。是一种基于自注意力机制的深度学习神经网络模型,于2017年由Google公司提出,目前已成为自然语言处理领域中应用最广泛的模型之一。
是MIT的开源项目,是一个快速构建机器学习Web展示页面的开源Python库。只需要几行代码,就可以让你的机器学习模型从抽象晦涩的代码变成性感可爱的交互界面(交互式web页面),让没有任何编程技能的用户也能够轻松使用和体验模型。
Stable Diffusion的Web UI界面就是用gradio构建的。
更多Stable Diffusion Ai绘画教程请看本人主页 或者头条@好奇漫步,持续更新更多Ai相关学习教程,保持关注哦~