当前位置:首页|资讯|AIGC|Midjourney|Stable Diffusion

AIGC基本概念 文生图基本概念

作者:新设技发布时间:2023-10-13

原标题:AIGC基本概念 文生图基本概念

AIGC基本概念

文生图基本概念

AIGC,(AI-Generated Content),是指基于生成对抗网络(GAN)、扩散网络(Diffusion)、语言大模型(Transformer)等大型预训练模型等人工智能技术的方法,通过对已有大量数据进行学习和模式识别,最终生成不同种类的内容的技术。例如,通过输入“提示词“(关键词、描述)或样本参考图片,AIGC可以生成与之相匹配的文章、图像、音频、视频等。

用AIGC生成文章,就是目前大家都耳熟能详的ChatGPT了。而用AIGC生图像,就是很多朋友都知道的Midjourney、DALL-E 2、Adobe Firefly或Stable Diffusion等等。

Midjourney

Midjourney 是由 Leap Motion 公司创始人 David Holz 所创建的一个小型自筹资金的团队所开发的。

Midjourney 创始人 David Holz

在把玩 Leap Motion,

他也是 Leap Motion 的创始人

2022年3月面世后,迅速成为全球讨论AI的焦点之一。V5版本让 Midjourney 及其作品成功“出圈”,成为目前全球认知度最高的文生图工具。

福布斯2023年AI 50榜单

2023年4月,Midjourney 入选《福布斯2023年AI 50榜单:最有前途的人工智能公司》。

Midjourney 目前只能在社交平台Discord上面运行,尚未有自己的APP,但Midjourney的航程才刚刚开始,正如它的logo一样,扬起风帆的巨轮,必定驶入属于它的那片人类想象力汪洋之中。

一幅使用 Midjourney 生成的数字油画,生成它的用户以这幅画《 Théâtre D‘opéra Spatial 》(太空歌剧院)在2022年9月参加美国Colorado科罗拉多州博览会的艺术比赛,夺得了第一名。这件事被曝光之后引发了网络上巨大的争论至今。自此,300刀的奖金撬起了3千亿的AIGC市场!

Midjourney 生成的数字油画

《 Théâtre D‘opéra Spatial 》(太空歌剧院)

2022年9月《 Théâtre D‘opéra Spatial 》

夺得了Colorado科罗拉多州博览会

艺术比赛的第一名

Stable Diffusion 及

Stable Diffusion WebUI

Stable Diffusion 由初创公司 StabilityAI、CompVis与Runway合作开发图像生成工具。Stable Diffusion诞生于2022年8月,号称是目前最强大的文本生成图片的模型。它可以在大多数配备有中档以上GPU的电脑上运行。而以前的文生图模型(如DALL-E和Midjourney)只能通过云计算服务访问。

Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,任何人都可以拷贝使用。目前,Stable Diffusion 已经有超过20万开发者下载和获得授权,各渠道累计日活用户超过1000万。

用 Stable Diffusion 生成的图片

画面质感细致入微

目前,大多数专业AI设计师正在使用的是 Stable Diffusion WebUI 版本,该版本可以部署在本地的个人电脑上使用,并且以参数调整的界面形式展现,方便大家像操作PS一样去操作。我们将在这个专栏中详细地介绍 Stable Diffusion WebUI 的使用方法、技巧和实战操作。

Stable Diffusion WebUI 主界面

Dall·E 3

Dall·E 3 是 OpenAI (研发著名的 ChatGPT 的公司)推出的一款AI图像生成工具。DALL·E 3 是 DALL·E 系列的第三个升级版本,这个名字取自艺术家“Dalí”和机器人“WALL-E”的结合词 。

用 DALL·E 3 生成的图片

虽然在 DALL·E 3 的论文中, OpenAI 的科学家们并没有给出这个模型的具体规模与训练所需要的算力,不过考虑到第一代 DALL-E 就已经是基于 GPT-3 这种超大规模模型的项目了, 那么我们有理由相信 DALL·E 3 的参数模型应该是万亿级别。并且一定会和 GPT 合兵一处,最终走向 AGI 通用 AI 的大方向。

国内用户可以通过微软必应浏览器

的图像创建器使用Dall·E的部分功能

目前,在国内,大家可以通过微软必应浏览器的图像创建器来使用Dall·E 3的部分功能(http://bing.com/create)。

Adobe Firefly

Adobe Firefly

Adobe Firefly 中文名“萤火虫”,是 Adobe 公司推出的 AI 图像创意助手,目前处于 Beta 测试阶段。Firefly 目前已经集成在了 Adobe 的企业级创意工具 Adobe Express 中进行内测(https://new.express.adobe.com/)。并开始全面扩展到 Adobe 旗下的 Photoshop 、 Illustrator 以及 Premiere 等工具中。

值得一提的是,在 AIGC 领域,大家一直认为 Adobe 公司船大难掉头,它旗下著名的 Ps 软件并未在第一时间嵌入 AIGC 功能。但随着 Photoshop 2024 版的发布,让很多人再次看到了 Adobe 的实力延伸到了 AI 领域。并且由于 Photoshop 对图像的精准到像素级的控制能力,再加上 AI 的赋能,将使得 Adobe 能够在 AIGC 大时代中延续它一贯的设计界软件的王者地位。

AI生成图像的简要流程

2012年 ,Google的两位著名的AI大神, 吴恩达和Jef Dean进行了一场空前的试验。

Google 人工智能专家 吴恩达

Google 人工智能专家 Jef Dean

他们使用1.6万个CPU训练了一个当时世界上最大的深度学习网络,用来指导计算机自主画出猫脸图片。当时他们使用了来自youtube的1000万个猫脸图片, 1.6万个CPU整整训练了3天, 最终得到一个训练模型。这个模型可以通过提示词“cat” 生成一个非常模糊的猫脸。

人类历史上第一张

通过人工智能AIGC无中生有的图像

在今天看起来, 这个模型的训练效率和输出结果都不值一提. 但对于当时的AI研究领域, 这是一次具有突破意义的尝试, 正式开启了深度学习模型支持的AI绘画这个"全新"研究方向.

AI生图,是AIGC领域中的一个重要分支。用户输入“提示词”或参考图,AI 就会根据 “提示词”或参考图中的语义语境等信息来生成对应的新图像。

训练过程(用马尔科夫链加噪点)

以及反向过程(去噪点生成图片)

把原图用马尔科夫链将噪点不断地添加到其中,最终成为一个随机噪声图像,然后让训练神经网络把此过程逆转过来,从随机噪声图像逐渐还原成原图,这样神经网络就有了从无到有生成图片的能力。

而文本生成图,就是把描述文本处理成AI可以理解的数字表达方式,加入到图片去噪点生成图像的过程。

文生图简要流程

随着研究的深入,目前AI生图,不仅仅可以通过文本提示词进行生成,还可以用图片参考进行生成,甚至可以混合两张以上图片生成。

图生图

多图混合生图

这里有一个难点:如何与AI交流,提供合理的“提示词”和参数设置呢?这里就突显了“提示词”Prompt的重要性。

比如:对AI说“生成一只猫”

结果:…

提示词输入不精准,

导致猫的形象和风格不可控

结果生成的猫的图像根本不可控,我们心目中所想的猫的具体形象又该如何实现出来呢?我们将在后续的栏目更新中细致地讲解,该如何与AI进行沟通,如何提供精准的提示词,好对AI进行精准的控制,以能生成出我们心目中想要的图像。

学习AIGC与AI生图

对于普通人与设计师的重大意义

人类世界在创意领域的时间简史:

  • 第一阶段,大自然生成了千变万化的世界,人类学习临摹:

  • 第二阶段,人类自己提供灵感,人类自己负责实现:

  • 第三阶段,人类提供灵感,AI负责实现。(当下的状态,并在不断完善中...):

  • 第四阶段,AI自主生成无数灵感,AI负责实现,人类负责筛选;

  • 第五阶段,AI自主生成无数灵感,AI负责实现,AI负责筛选与分配。人类呢?人类做什么?人类将成为被喂养的生物吗?

相信,当学习完了我们提供的所有AIGC内容后,你的心中会有一个清晰的未来图景!

AIGC基础知识

专业名词解析

Stable Diffusion从入门到精通到实战

专栏内容简介

从AIGC的基础概念介绍开始,以“喂饭级”的语言,逐一详细介绍 Stable Diffusion WebUI 的各个参数与设置,配合详细的图文素材,并用大量实战案例来解读 Stable Diffusion 在目前各设计领域中的应用。

通过这个专栏,你会得到

  1. AIGC的基础概念、扎实的基础知识;

  2. AIGC图像设计创作领域目前最重要的阵地——Stable Diffusion 的相关基础知识、专业术语;

  3. Stable Diffusion WebUI 软件中每一个参数详细功能介绍,原理,对应AI生图的结果;

  4. Stable Diffusion WebUI 的具体使用方法和技巧,各种模型介绍、周边配套插件与软件的使用方法和技巧;

  5. Stable Diffusion WebUI 在实际设计产业中的应用、实战解析;

  6. Stable Diffusion 的提示词库、参数库等;

  7. 购买全套课程的学员,享受半年免费 SD-WebUI(高性能GPU)线上使用权限,使用期限内无限出图、高速出图。

订阅须知

  1. 《Stable Diffusion从入门到精通到实战》为图文/视频专栏,不少于 20 期,每周五 21:00 点更新;

  2. 20 期更新结束后,专栏内容会根据 AIGC 领域的最新动态、Stable Diffusion 的不断迭代而产生新内容,这些与时俱进的新内容无需额外付费;

  3. 添加一对一辅导员,及时收到通知更新内容,一对一解答疑难问题;

  4. 本专栏为虚拟内容服务,购买成功后不支持退款,请理解。

加辅导员微信咨询

了解更详细课程信息

一对一解答疑难问题

Stable Diffusion WebUI

从入门到精通再到实战

完全喂饭级,细致到每一个参数

“设计小白”都能看懂

有设计基础的朋友更会得到启发

抓住人工智能工业革命带来的新机遇

辅导员微信:cyxq2019

↑ 长按上方二维码图 ↑

在弹出菜单中选择“打开对方的名片”

加辅导员微信,咨询课程


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1