上周四,鸽了两个月的Midjourney V6终于内测更新了,自V5.2更新以来,Midjourney销声匿迹了几个月,除了更新了一下他们的网站外几乎没有其他动作,业内都传这十几个人的小团队是不是赚够了,集体度假去了。
Midjourney V6生成丨图片源自互联网
但还好,在12月初的动态发布会中,Midjourney负责人公布了V6的更新计划,也确定了将会在圣诞节之前给大家一个惊喜,于是,我们在12月21日如期收到了这份“AI 圣诞好礼”,废话不多说,直接分享我这几天的使用体验,对V6版本的更新内容以及其使用方法进行一番细致的解读。
图片源自互联网
1.细腻,还是细腻,真实,还是真实
V6版将数据源和算法进行了显著改进,能够生成更为逼真、精细且细节丰富的图像。它在材质、人物肖像以及光影效果的刻画上实现了深度的优化,提升了图像的整体质感和真实度。
Midjourney V6生成丨图片源自互联网
以下是我自己画出来的,或者搬运社区中的优质图片,大家可以看看V6的效果。
Midjourney V6生成丨图片源自互联网
Midjourney V6生成丨图片源自互联网
Midjourney V6生成
Midjourney V6生成
Midjourney V6生成
2.更加契合提示词,更加准确
V6版本在理解用户输入的提示(prompts)方面取得了显著进步,它能够处理并理解那些精确度较低的词汇,同时,它支持的有效字符长度超过了350个。
在这样的对比实例中,当请求绘制一座雕像时,V5.2版本的模型可能未能准确捕捉到用户的意图,导致输出了一个机器人图像。而V6版本,在同样的提示下,可以更准确地理解并生成所指定的雕像内容。
Midjourney V5.2生成
Midjourney V6生成
我还特地摘抄了几段名著中的场景描述译文来测试V6对于长文本的理解输出能力,效果也比较出彩,虽然画面有一种CG渲染的感觉,却依旧忠实于文本描述,巧妙地捕捉并呈现了关键元素,展示了其对复杂指令的出色把握与表现力。
Midjourney V6生成
3.prompt再优化,想画直接写
有不少小伙伴都吐槽过Midjourney的语义理解能力,包括其难用的关键词系统,需要写什么“photorealistic”,“4k”,“8k”这类词汇才能够让模型实现最佳效果,但这次的V6更新后,Midjourney V6 Beta在语义理解方面的显著提升,使其终于达到了一个相对可靠的水平,但与背靠OpenAI的Dalle-3来说,还是略逊一筹。
Dalle-3支持中文输入,且可以指定车型,但画面效果不如MJ
如今,在Midjourney V6中,小伙伴可以不用再添加一些无意义的TAG,比如“获奖、超现实、4k、8k”等,可以直接写出自己想要画的内容,直接按照中文翻译成英文即可,但如果想要获得更加专业、更加高大上的图片,还是需要一套全新的prompt方法论:
风格: 指定所需的审美或艺术风格,包括时代和风格偏好。
Midjourney V6生成
主题: 明确定义图像的中心主题,细节涵盖人物、物品、动物的外观、颜色和独特属性。
Midjourney V6生成丨图片源自互联网
背景: 设定主题的环境,包括地点、环境元素、一天中的时间和天气。
Midjourney V6生成
构图: 决定画面的布局,包括视角、角度和构图偏好。
Midjourney V6生成丨图片源自互联网
灯光: 设定图像的情绪和视觉基调,选择照明类型和大气效果。
Midjourney V6生成丨图片源自互联网
额外信息: 添加图像的次要元素,描述它们与主题的关系和位置。
Midjourney V6生成
4.可以写字了!虽然仅限英文
Midjourney V6 新增了对英文文本插入的支持,但这一功能仅限于添加少量字符,并不足以创作完整的英文小说。Dalle-3较早前已实现了这一功能。尽管如此,对于Midjourney来说,这依然是一个重要的进步。
Midjourney V6生成
用户可以在文本框中使用引号标出所需添加的文字,这样就能产生一个包含准确文本的、效果相当不错的图片。
Midjourney V6生成
5.真实到感觉分分钟侵权
根据部分AI绘画爱好者的反馈,越来越多的人发现,Midjourney V6之所以能够拿出极其逼真的图画,可能是因为它的训练来源已经深入到了影视作品的每一帧画面上,而且并不掩饰生图时的一致性。
Midjourney V6生成丨图片源自互联网
例如,Midjourney V6所创造的动画和漫画风格图像,在细节上与原始作品极为吻合,这暴露了当前人工智能绘画技术在版权合规方面的模糊边界。目前尚无专门机构负责审核人工智能训练用数据集的版权合法性,这为企业在版权法的监管空白区域中提供了操作的余地。
Midjourney V6生成丨图片源自互联网
这进一步引发了一个尚未解决的问题:人工智能学习并再现现有艺术作品,是否应当被认为是一项合法权利。鉴于利益相关方的多元性和问题的复杂性,围绕这一议题的讨论可能难以达成共识,未来需要更多的研究机构与立法部门来对此进行针对性的规范。
Midjourney V6生成丨图片源自互联网
目前,Midjourney V6正处于内测阶段,模型的统一性与完整程度仍在优化中,相信在正式版放出之时,会有更多的惊喜内容等待着我们,包括更加细致的局部重绘功能以及更好的字体可控性。