生成式AI席卷全世界,除了OpenAI的ChatGPT,以文生图的Midjourney也是一绝。虽然必须花上真金白银、不再能免费使用,它还是让人趋之若鹜。Midjourney究竟有什么魔力,让市井小民也能享受画图乐趣?本文带你进入Midjourney的世界,一探究竟,并且特别搭配以Midjourney生成图像相互呼应。
目录
●什么是Midjourney?
●如何开始使用Midjourney?
●怎么订阅Midjourney?
●使用Midjourney的步骤?
●GPT-4看图说故事新功能开箱
1.什么是Midjourney?
你可能没亲身用过Midjourney,但你一定听过它。它是一个线上「以文生图」的服务,使用者只要输入提示词(prompt,或者称为咏唱、咒语),Midjourney便会依照提示词产出对应的图像。
提供「油画、成年女子与男子、动感」等关键字后,Midjourney产出的图像。
提供「油画、成年女子与男子、动感」等关键字后,Midjourney产出的图像。
随着Midjourney版本迭代,图像品质也迅速提升,因此成为创作者的帮手。比如设计师可以利用Midjourney激发点子、写作者可以透过Midjourney产生配图,甚至有人把Midjourney产生的图案印在衣服上贩售。
Midjourney是由Midjourney, Inc.所开发的产品,创办人霍兹(David Holz)曾获富比士(Forbes)列入30岁以下的年轻领袖榜单。他在学生时期就展现出对于前瞻科技的热爱,并且有机会参与多个不同单位的研究计画,包括德国一流的研究机构普朗克研究院、美国NASA,以及专攻人类与机械互动的企业Leap Motion等,接着创办了Midjourney。
2.如何开始使用Midjourney?
Midjourney的出现大幅降低创作门槛,但是怎么使用呢?首先,造访Midjourney官网首页,点击右下角的” Join the beta”,就可以进入Midjourney的Discord页面。Discord是一个数位通讯平台,可以传文字讯息、语音通话,使用者开始时以游戏玩家居多,而后逐渐扩大至不同类型的人,现在想使用Midjourney产图,需要和Midjourney架设在Discord上的对话机器人进行。
若你没有登入Discord、或者没有Discord 账号,会导引到登入页面,没有帐号者可以在此时注册;若已经有登入的Discord帐号,则可以点击同意授权Midjourney权限,方便后续进行。
我们可以在Midjourney的官方Discord频道中产图,也可以进入频道后,点击右方的机器人按钮,依照自己的需求,传私人讯息(下方)给它,或者点击「新增至伺服器」,将机器人加到自己和朋友的服务器中。
https://discord.com/channels/662267976984297473/ (复制到浏览器中打开)
Midjourney的Discord频道中,可以选择和机器人对话,或是邀请机器人到自己的伺服器中。截自Midjourney的Discord频道。
Midjourney的Discord频道中,可以选择和机器人对话,或是邀请机器人到自己的服务器中。截自Midjourney的Discord频道。
在官方频道生成图像的好处,在于可以观摩其他人的指令,但自己生成的图很容易被淹没于茫然图海中;在私人讯息或伺服器中生成图像的好处,则是可以专注于成品,各有优缺。
3.怎么订阅Midjourney?
因为滥用问题,Midjourney终止了原先提供给大众的免费25张算图额度,一律要付费才能使用,我们可以在任何一个有权限发言的频道(例如newbies开头)或者直接跟Midjourney机器人对话,输入”/”后选择” subscribe”,机器人会自动产出订阅链接。
输入订阅指令后,机器人会产出私人订阅链接给使用者。截自Midjourney的Discord频道
输入订阅指令后,机器人会产出私人订阅连结给使用者。截自Midjourney的Discord频道
点击连结后,可以看到不同的订阅方案。截自Midjourney的Discord频道
点击连结后,可以看到不同的订阅方案。截自Midjourney的Discord频道
若一次订阅一整年,可以挑选每月8美元、24美元、48美元三种不同方案,若单月订阅,则分别是10美元、30美元、60美元的费用,刚开始可以先尝试订一个月的基本款方案,确认自己真的有需求后,再调整到其他方案。
三种方案的差别主要体现于几个地方:
■ 同时产图的多工能力(concurrent jobs):基本和标准方案都只能最多同时算三张图,但专业方案可以同时算12张图。
■ 时间限制(GPU Time):在快速模式(fast mode)下,基本方案可以算3.3小时的图,这里的小时指的是利用GPU产图的时间,官方给的数字是约200张图,标准方案可以算15小时、专业方案可以算30小时,若用完快速模式,基本方案就不能再产图了,标准和专业方案则可以在放松模式(relax mode)无限制的产图。
■ 隐身模式(stealth mode):Midjourney官网的个人档案中,可以看到自己产出的图,专业版用户可以选择以隐身模式产图,借此避免让人在个人页面上看见算图作品。
4.使用Midjourney的步骤?
底下利用一个例子,说明使用Midjourney的步骤。首先,我们在对话中输入”/”,接着选择”imagine”,接着输入自己想使用的提示词。我使用了夜间的哲学家漫步于路上,有路灯与花草等关键字。
输入提示词。截自与Midjourney的对话
输入提示词。截自与Midjourney的对话
输入提示词后,按下Enter送出,需要一些等待时间,过程中图像会逐渐成形,100%完成后会像下图一样,出现四张图拼凑在一起的大图。
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
图中的U代表Upscale,点下后能够增加图片的解析度;V则代表Variation,可以产生图像的变异版本。至于类似回收的蓝底白字符号,则可以再次执行命令,产出新的图像,通常是对现有图像不满意时使用。至于数字,则代表图像的顺序,左上、右上、左下、右下。
举例来说,我想产生右上褐发男子图像的变异版本,可以点击V2。点击后机器人会自动产出一段指令,并依照该指令产出新的图像。
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
若对成品感到满意,例如我喜欢右下,可以点击U4,提升解析度后便能下载。
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
5.GPT-4看图说故事新功能开箱
除了”/imagine”以外,Midjourney还有很多值得利用的指令。
■ /describe:上传图片后,Midjourney机器人会针对图片进行「思考」,接着产出对应的提示词。若是在网路上看到好看的图片,但不知道该怎么产出相似风格或是相似图案的时候,可以活用这个指令。
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
■ /blend:可以一次上传多张图片,让Midjourney将图片混合在一起,有时候可以打造出意想不到的效果。以下图为例,我把上面漫步的哲学家和樱花树旁的机器人混合后,得到樱花树畔生化人风格的哲学家。
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
输入提示词后产出的图像。截自与Midjourney的对话
■ /info:确认自己的账号细节,机器人会提供你的订阅方案、工作模式(快速或是放松产图)、剩余的快速产图时间等细节。
■在指令中加入参数(parameters):可以到Midjourney的官方网站中确认有哪些参数,有些一定要知道的参数
■ --aspect:用来调整比例尺,例如” --aspect 16:9”
■ --chaos:若希望产出的图变异较大,就可以提升chaos的值,例如下面两张图就可以清楚看出chaos大小的差异。
在指令末尾加上”—chaos 50”。利用Midjourney产生
在指令末尾加上”—chaos 50”。利用Midjourney产生
在指令末尾加上”—chaos 0”,0为预设值。利用Midjourney产生
在指令末尾加上”—chaos 0”,0为预设值。利用Midjourney产生
■ --no:加上负面的提示时,可以尽量减少相关内容物的出现,不过,并不是百分之百会实现,以文字为例,因为Midjourney无法产出真的文字,看起来比较像是乱码,所以时常会加上” --no text”的后缀,但算出来的图无法百分之百避免。
■ --quality:决定算图的时间和产图的品质,两者呈现反比,数值有0.25, 0.5, 1, 2可以挑选。
本文来自远见杂志 | 作者曾子轩。via:https://today.line.me/tw/v2/article/wJ7MyKE
— 完 —
点这里👇关注我,记得标星哦~