当前位置:首页|资讯|AIGC|Midjourney

AIGC名词解释:GAN 生成对抗网络

作者:新设技发布时间:2023-10-20

原标题:AIGC名词解释:GAN 生成对抗网络

用设计师能理解的语言

来解释AIGC中的技术名词

AIGC 属于跨学科的产物,涉及领域众多,包括高等数学、统计学、计算机图形图像学、机器学习等各个领域。AIGC 设计软件的界面上往往会涉及到许多这些领域的技术术语。要想搞清楚它们背后的知识体系需要展开的知识树体量十分庞大繁杂。术业有专攻,我们无法全面俱到地在每一个领域都做到精通,但又需要了解到一定的程度,以便更好地使用 AIGC 的相关软件。所以,我们将尽量以设计行业从业者能理解的语言来解释那些经常遇到无法绕开的技术术语。

GAN 生成对抗网络

GAN 是 Generative Adversarial Network 生成对抗网络英文的缩写,(论文:https://arxiv.org/abs/1406.2661 )。GAN 也是一种神经网络,是由被誉为“生成对抗网络之父” 的蒙特利尔大学博士生伊恩·古德弗洛(Ian Goodfellow)在2014年提出的。百度的前首席科学家吴恩达(Andrew Ng)说,GAN 代表了“重要而根本性的进步”。GAN 的发明激发了全球研究者群体的不断壮大。

“生成对抗网络之父”

伊恩·古德弗洛 Ian Goodfellow

GAN 在各类生成算法中,属于深度生成模型,也是最流行的模型,另一个很流行的模型就是VAE( 到目前为止,有3种类型的生成模型,即 GAN、VAE 和基于 Flow 的模型)。

生成对抗网络的主要思想是:通过生成器(Generato)与判别器(Discriminator)不断对抗进行训练。后来无论GAN发展到今天演化出了多么复杂的变体,其基本思想仍是以上这两种网络的对抗,基本结构一定要有生成器与判别器。

GAN 的主要架构

  • 生成器 Generator(G):是生成图像的网络,它接受一个随机的噪声,并根据噪声生成图像,生成的图像记作 ,
  • 判别器 Discriminator(D):是一个判别网络,它判别一张图像是不是“真实的”。它的输入参数是 ,代表一张图像,输出 代表 为真实图片的概率,如果为 1,就代表 100% 是真实的图片,而输出为 0,就代表不可能是真实的图像。

这样看来,我们发现 GAN 网络就像一个自己对自己进行图灵测试的机器。在测试过程中,生成器 G 和判别器 D 就像是两个不断地相互博弈而又永不放弃的人。生成网络 G 的目标就是不断改进自己的生成过程,使得输出的结果尽量看起来像真实的图像,以此骗过判别器 D ,好让 D 打分为 1,即100%真实。而判别器 D 的目标就是尽量把 G 生成的图片和真实的图片区分开来,不断练就自己的“慧眼”。通过相互对抗,生成器的生成能力和判别器的判别能力都越来越强大,最终当模型收敛时,我们将得到一个生成效果较好的生成器,毕竟这才是我们的核心目的。道高一尺魔高一丈的精髓至此被人工智能学去了。

举个比较形象的例子:我们假设生成器 G 是一个专门做赝品的画师,判别器 D 是名画鉴别师。这个希望靠赝品画作浑水摸鱼的画家,拿着作品到市场上去很容易就被别人揭穿了。于是他请来一位名画鉴别师 D 来帮助自己提高临摹能力。但是名画鉴别师 D 唯一能帮助 G 的就是不厌其烦地每天鉴别 G 的新作,并给出画作是否像真画的肯定或否定答案。起初 G 的画作在不断变化中尝试改进,每一次都被 D 判定为假货,但是成千上万次不断反复训练的结果,D 的画技逐渐炉火纯青,达到了以假乱真的地步,以至于鉴别师 D 也无法分辨真假了。

GAN 网络中生成器(G)与判别器(D)的关系

而实际上,鉴别师 D 也是需要训练的。训练鉴别师的目的是为了更好地和赝品画师 G 进行对抗,以提高 G 的乱真能力。我们把一些真品的画作和假画给鉴别师 D,并告之哪个是真,哪个是假,以此训练 D。曾经一度 G 的赝品技艺已经让 D 分别不出真假了,但是经过进一步训练的 D 鉴别能力大大提升,又能洞察玄机鉴别出来 D 的画作是赝品了。

然后,以上两个人在不断交替地对抗中,各自的本领都得到了极大的提高,魔高一尺道高一丈。当然,最终的检验标准还是市场。G 把作品拿到市场上,所有人都赞不绝口认为是一幅伟大的名画,G 的辛苦训练终于如愿以偿,他在临摹过程中也提升了自己的画技,发现自己也具备了一位真正的绘画大师的能力了,他甚至准备出品属于自己风格的画作。此时,一直站在角落里看着这一切的鉴别师 D 也发出了满意的微笑!

最后,让我们看看 GAN 的输出效果吧。

你可能看到这些人的照片总觉得眼熟,但又实在说不出他们的名字,这些有着明星相貌的脸庞其实都是英伟达(Nvidia)公司在 GAN 的生成技术基础之上研发出来的虚拟明星脸大模型。这些模型学习了各种大片和新闻里的明星面孔,总结规律,最后通过 GAN 的生成技术来生成这些以假乱真的明星面孔。看来,还真是存在明星脸这样的规律!可是,别看这些面孔栩栩如生,各个都像是真人,然而,这些“人”压根就不存在于这个地球上!

英伟达(Nvidia)公司

基于GAN 的技术研发出的虚拟明星脸生成器

所生成的以假乱真的明星脸

AIGC生成的油画《 Théâtre D‘opéra Spatial 》

(太空歌剧院)

再看看这个 GAN 的生成案例。这幅油画《 Théâtre D‘opéra Spatial 》(太空歌剧院)在2022年9月参加美国Colorado科罗拉多州博览会的艺术比赛,夺得了第一名,获得300美金的奖励。而之后这幅画很快被作者Jason Allen自己透露是一幅由 Midjourney (Midjourney 是基于 GAN 的AIGC生图软件)生成的作品,于是引发了巨大的争论直至今天。自此,300刀的奖金撬起了万亿美元的AIGC市场!

AIGC基础知识

专业名词解析

Stable Diffusion从入门到精通到实战

专栏内容简介

从AIGC的基础概念介绍开始,以“喂饭级”的语言,逐一详细介绍 Stable Diffusion WebUI 的各个参数与设置,配合详细的图文素材,并用大量实战案例来解读 Stable Diffusion 在目前各设计领域中的应用。

通过这个专栏,你会得到

  1. AIGC的基础概念、扎实的基础知识;

  2. AIGC图像设计创作领域目前最重要的阵地——Stable Diffusion 的相关基础知识、专业术语;

  3. Stable Diffusion WebUI 软件中每一个参数详细功能介绍,原理,对应AI生图的结果;

  4. Stable Diffusion WebUI 的具体使用方法和技巧,各种模型介绍、周边配套插件与软件的使用方法和技巧;

  5. Stable Diffusion WebUI 在实际设计产业中的应用、实战解析;

  6. Stable Diffusion 的提示词库、参数库等;

  7. 购买全套课程的学员,享受半年免费 SD-WebUI(高性能GPU)线上使用权限,使用期限内无限出图、高速出图。

订阅须知

  1. 《Stable Diffusion从入门到精通到实战》为图文/视频专栏,不少于 20 期,每周五 21:00 点更新;

  2. 20 期更新结束后,专栏内容会根据 AIGC 领域的最新动态、Stable Diffusion 的不断迭代而产生新内容,这些与时俱进的新内容无需额外付费;

  3. 添加一对一辅导员,及时收到通知更新内容,一对一解答疑难问题;

  4. 本专栏为虚拟内容服务,购买成功后不支持退款,请理解。

加辅导员微信咨询

了解更详细课程信息

一对一解答疑难问题

Stable Diffusion WebUI

从入门到精通再到实战

完全喂饭级,细致到每一个参数

“设计小白”都能看懂

有设计基础的朋友更会得到启发

抓住人工智能工业革命带来的新机遇

辅导员微信:cyxq2019

↑ 长按上方二维码图 ↑

在弹出菜单中选择“打开对方的名片”

加辅导员微信,咨询课程


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1