当前位置:首页|资讯|Midjourney

Midjourney能生成文字了!V6版5大升级惊艳网友

作者:量子位发布时间:2023-12-22

Midjourney能生成文字了!V6版5大升级惊艳网友

西风 发自 凹非寺

量子位 | 公众号 QbitAI

Midjourney重磅更新,V6版本问世!

更新后最大看点是图像更真实、细节处理更细腻:

和上一代对比来看更直观。

就说一道土豆炖牛腩,右边的图不仅菜看起来更自然、更有食欲,就连木勺的细节也没放过(左V5.2,右V6):

再来看对人物的刻画,V6光影等细节拉满。相比之下,V5.2根本不是一个level(上V6,下V5.2):

风景图的处理也是一眼就能区分哪个更真实自然(左V5.2,右V6):

另外,新版本还有一大看头是可以对简单的文字进行处理了,只需给要绘制的文字加上"引号",比如"Hello World!":

终于不是乱码了!

创始人David Holz在Discord发帖公布了V6的问世,并且表示V6是团队从头开始训练的第三个模型,开发过程已持续了9个月。

总结来说,V6共有5大升级

更精确且更长的提示响应

改进了连贯性和模型知识

图像生成和混合(remix)得到了优化

新增了基础文字绘制功能

upscale(放大器)功能得到增强,具有’subtle’和’creative’两种模式,分辨率提升两倍

此外,David Holz表示目前V6处于“alpha test”阶段,会随时变化,之后会升级到完整版。

这也就意味着,接下来几周内,V6的速度、图像质量、连贯性、提示响应和文本准确性会再次提高。

而目前V6相比于V5来说速度更慢、成本更高(大约每次imagine消耗1gpu/min,每次upscale消耗2gpu/min),但昨天已对V6做了一次更新,速度已提高2.7倍:

V6的问世,让网友们又有新东西玩了,各种测试对比都非常火爆:

不过,要想玩好V6,再用之前的提示策略恐怕是不行了。

David Holz明确表示“V6的提示与V5有很大不同,你需要重新学习如何提示”。

效果:写真真真

先来看一波网友们的测试效果。

让Midjourney V5.2(左)、V6(右)画一个酒吧,需要用灯牌标注”open late”(营业到很晚),V6画起来毫无难度:

再来体验一下更新后的Upscale,正常图片是这样婶儿的:

Subtle(上)、Creative(下)两种不同模式,家人们更中意哪张?

Creative连镜子里的细节都给处理了。

这里还有和其它AI绘图工具的比较,比如说DALL·E 3、Adobe Firefly。

Midjourney V6在不同风格的图片生成上,都表现出众:

是能够以假乱真的那种了:

甚至,V6还通过的香烟测试。不仅烟真实,手的岁月感也刻画得淋漓尽致:

但正如上面提到的,Midjourney V6更新的不只是效果,还有提示词。

好在David Holz给到了一些提示小妙招,其中就包括:

避免使用无关紧要的词,如award winning、photorealistic、4k、8k;

明确表达你想要的内容,表达明确,模型理解得更好;

如果你想要更具摄影感、更中立、更直接的效果,可以默认使用—style raw;

较低的—stylize值(默认100)可能会有更好的提示理解,而较高的值(最高1000)可能会有更好的美学效果。

我们也来简单上手体验一把。

开盒Midjourney V6

召唤V6的方法有三种,可以选择在Midjourney Discord服务器中键入斜杠命令“/settings”,或者在给Midjourney bot的直接消息(DM)中键入,然后使用顶部的下拉菜单选择V6,又或是在提示词后手动输入“—v 6.0”。

我们让Midjourney描绘一幅跨年夜的场景,要求要有漫天飞舞的大雪,还要有一个牌子上面写着“新年快乐”:

Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words "Happy New Year" on it.

该说不说,虽然很有feel,但“字”的发挥还是不稳定。

完全相同的提示词下,V5.2版本整体偏暖色调,但这么一看V6画字还是很有水平的:

紧接着,点击任意一张图Upscale:

就可以看到两个新的模式Subtle、Creative:

下面是Creative的效果,家人们如何评价?


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1