Midjourney V6上手评测 -终于到来的语义革命

作者：数字生命卡兹克发布时间：2023-12-21

Midjourney

Midjourney V6上手评测 -终于到来的语义革命

有点意外，Midjourney猝不及防，北京时间下午13:56，老美那边大概夜里10点，发布了新版的V6 Beta模型。。

他们是想趁着还没回家过圣诞，赶紧先发了。然后让大家一边过圣诞，一边给他们打黑工帮他们测模型。

这一下子给我发的，是着实的有点猝不及防。

现在，你使用/setting命令，在模型选择框中，就可以看到V6 Beta版。

按照Midjourney的话说：“This is an alpha test. Things will change frequently and without notice”

“这是一个阿尔法测试。事情会经常发生变化，恕不另行通知。”

包括提到了“速度、图像质量、连贯性、提示跟随性和文本准确性将在接下来的几周内得到改善”

我猜测模型完成度在85%左右，剩很多对齐工作没搞完。

官方说的目前V6 Beta的更新内容：

1. 更准确的提示跟随以及更长的提示。

2. 提高连贯性和模型知识。

3. 改进的图像提示和重新混合。

4. 较小的文本绘制能力（您必须将文本写在“引号”中，并且 --style raw 或较低的 --stylize 值可能会有所帮助）

5. 改进的升级器，具有 'subtle ' 和 'creative ' 模式（分辨率提高 2 倍）

有点太废话，我翻译成人话就是：能容纳更多的词语token了、语义理解更强了、图像质量更好了、能嵌入一点英文单词进去了、图像能放大更多了。

我跟上百个群友一起跑了三个多小时，整体感受最大的变化其实还是两部分：

图像质量的提升与语义理解的加强。

我拆开聊。

一.图像质量的提升

图像质量我关注的是以下几个纬度：细节密度、材质质感、色彩表现、光影表现、构图表现、结构真实性。

Midjourney V6 Beta在细节密度、材质质感、光影表现、结构真实性上，都有巨幅提升。构图表现和色彩表现有小幅提升。

直接放对比图，没啥可说的了，部分图片来源于好基友@鲜虾包、@猫宅V酱、@大峰AI绘画。

就不放太多了，反正核心思想就一个：图像质量up up 还是up。

知道在细节密度、材质质感、光影表现、结构真实性上，都有巨幅提升就行了。

下面一趴的语义理解才是最核心的重点。

二. 语义理解的加强

我重点来聊聊语义理解这块的变化。

我曾经毫不避讳的骂过Midjourney，他的语义理解就是一坨屎。让我在做过往的AI作品时，无数次的带上痛苦面具想砸电脑。

但是这一次，Midjourney V6 Beta对于语义理解的加强，终于到了中上游可用的地步，注意我用的词是“可用”。跟Dalle3这种逆天的还没发比。

首先请忘掉所有的SD式的写法，不要写tag，不要写“photorealistic, 4k, 8k”之类的垃圾词，他们对于新版V6 Beta没有任何蛋用。

不要写tag，不要写tag，不要写tag，重要的话我说3遍。

更别直接用v5.2的prompt直接拿来复制粘贴，请重新学习新版V6的写法。

整体上，我觉得更强调把细节说清楚的能力。我推荐的结构是：

场景+主体+细节+美学风格。

比如我的这段Prompt：

三个不同的美女朋友坐在沙滩上面向镜头微笑。中间的是一个开朗的金发白人女性，穿着短裤和红色色背心。左边的朋友是一个黑发美国女孩，穿着比基尼和透明的裙子。右边的朋友是一个红发英国女孩，穿着比基尼。背景可以看到海，海上有船和飞翔的海鸥。Agfa Vista 200拍摄的中景镜头。

非常复杂，但是我几乎都是以长句子去写的，清晰的描述场景和主体以及部分衣服细节。

再看看v5.2，可以就语义理解上，做一个清晰的对比。

在新版prompt的写法上，我说一些我认为有趣的技巧：

1. 你可以指定任何细节。

不要吝啬你的想象力，更不要吝啬你的笔墨，用一切有逻辑、有结构的语言，把你想要的细节指定出来。她穿了什么衣服、衣服是什么材质、什么颜色。写明白，写明白比一切都重要。

比如：

漫威黑寡妇的半身特写镜头。黑寡妇穿着蜘蛛侠的黑色紧身衣，她的左手拿着美国队长的盾牌，右手拿着雷神之锤，她很悲伤。--ar 16:9

2. 你可以使用语言控制构图。

在V6中，现在很容易用语义去定位事物之间以及与相机的关系。这个在V5中几乎是难以想象的。

现在我们可以用短语描述一个通用的图像，以这个通用图像为焦点。围绕它填充细节。

比如：

客厅的桌子上有三个装满水果的篮子。中间的篮子里装有草莓。左边的篮子装满了橘子。右边的篮子装满了芒果。背景是一个带有圆形窗户的空白蓝绿色墙壁。

3. 你可以向你的图像中添加文本。

Dalle3的老传统了。可以给你图像添加文本，将需要嵌入图片的文字放在 “引号”内，并且保证你描述的画面上适合嵌入文本。比如你非说要在她鼻子上写个“shabi”，那写不上去你也不能怪MJ对吧。

比如：

特朗普在苹果发布会上的特写镜头。他在人群中举着一块写着“SHABI”的牌子。

写在最后

Midjourney V6 Beta带来的有趣是一定的，对真实感和图像质量的加强，基本到了现在所有AI绘图的颠峰，再配上独一档的审美，以及史诗级的语义增强。

可以看到，Midjourney未来正式版V6的推出，一定又会开始“遥遥领先。”

诚然，问题还很多，比如对于其他的风格加强好像并不明显。

比如很多功能都还不支持。

但是瑕不掩瑜。

Midjourney V6 不是AI绘图的最后一步。

而是又一次AI历史长河中的丰碑。

相关资讯

Midjourney V6 初体验

Midjourney V6 初体验传说中的Midjourney V6 终于上线，目前我使用的是它的Beta版本。今天的这条图片消息里，所有的图片都是使用V6 Beta生成。在这个版本里，如同我

Midjourney

槽边往事 2023-12-21

测评 Midjourney Niji v6

niji 更新到 v6 已经两天了，看看它的表现如何。前4张是更符合midjourney 审美的niji standard，后4张是更匹配提示信息的 niji raw 模式。感觉更有哥特气息。

Midjourney

零重力瓦力 2024-01-31

如何使用Midjourney API v6？

项目背景对于许多人来说，Midjourney这一产品已经相当熟悉，然而Midjourney并未提供官方的API服务。自今年2月份升级至v6版本以来，Midjourney生成的图片质量显著提高，自v5版本起，其图片已具备广泛的商业应用潜力。众多企业和个人长期以来都有API接入的需求，这一需求自2023年起便一直存在。虽然网络上有大量的开源代码可供使用，但这些方案往往不够理想，且在实际搭建和使用过程中存在一定的风险。TTAPI（ttapi.io）平台针对此需求，基于Midjourney现有的功能，开发了一套完

Midjourney 编程

luke_voyagel 2024-04-11

Midjourney v6 终于更新了！一文详解新版本 3 大要点

大家好，这里是和你们一起探索 AI 绘画的花生~Midjourney 的 v6 模型终于在 2023 年结束之前更新出来了，这是一个完全重新训练的模型，所以图像生成效果与之前的 v5.2 相比有很大的不同，那么此次更新主要有哪些特点？我们又应该如何正确地用 v6 模型出图呢？今天就带大家一起了解一下~首先是 V6 的图像生成质量相比之前的模型来说又提升了不少，在画面质感以及细节刻画上有了更精致的表现，图像的光影处理也比 v 5.2 更真实自然。下面是分别用 v5.2 和 v6 生成的特写图像，通过对比可以

Midjourney

张小枫聊设计 2023-12-30

Midjourney V6的这些更新足以变革AI圈

Midjourney V6近期悄然更新，，总体来说是这几个部分：更精确的提示跟随和增长的提示长度：现在，用户可以享受到更精确的提示跟随功能，这意味着你的每一个细节描述都将更准确地反映在生成的图像中

Midjourney

苏志强 2023-12-22

近期资讯

【算法】腐烂的橘子

难度：中等题目在给定的 m x n 网格 grid 中，每个单元格可以有以下三个值之一：值 0 代表空单元格；值 1 代表新鲜橘子；值 2 代表腐烂的橘子。每分钟，腐烂的橘子周围 4 个

时清云 2024-12-26

h5中如何播放rtsp视频流-插件版本

rtsp rtp 简介 RTSP（Real-Time Streaming Protocol） RTSP 是一种应用层协议，用于控制音视频流的传输。它类似于 HTTP，但专注于流媒体服务，可实现播放、暂

WilliamLuo 2024-12-26

Karpathy力荐博客：写代码的时候，请心疼一下读代码的同事

今天上午，著名 AI 科学家 Andrej Karpathy 在 X 上分享的一篇文章引起了广泛关注和讨论。这篇文章的核心论点是「认知负荷很重要」，即在写代码时，应该考虑之后阅读者和维护者能否更轻松地

机器之心 2024-12-26

ArkWeb页面拦截与自定义响应 - 控制加载过程

简介在Web应用开发中，有时我们需要对页面加载过程进行更精细的控制，比如拦截特定的请求并返回自定义的响应内容。ArkWeb框架提供了这样的能力，允许开发者拦截页面和资源加载请求，并自定义响应。本文将

xiajia123 2024-12-26

写个hoc来应付小程序的审核！

有没有遇到要为小程序添加一个“暂未显示”的功能的情况？一个hoc帮助你更容易应付产品和微信小程序的审核🤓👆

提不起劲的刀阁V 2024-12-26

Android OpenGLES2.0开发（八）：Camera预览

终于到该章节了，还记得Android OpenGLES2.0开发（一）：艰难的开始章节说的吗？本章讲解了如何使用外部纹理渲染Camera预览数据

小智003 2024-12-26

如何判断设备是折叠屏,全网最准的方法,没有之一！

折叠屏的设备越来越丰富，对于这块的设备类型非常重要，过去我们使用屏幕尺寸来判断是否是平板设备，有了折叠屏传统的方法就会误判折叠屏为平板，网上查了一圈资料，99%的解法都是错误！最真实的判断还需要看官网

小虎牙007 2024-12-25

JustHappy 2024-12-26

Midjourney V6上手评测 -终于到来的语义革命

Midjourney V6上手评测 -终于到来的语义革命

推荐体验

相关资讯

Midjourney V6 初体验

测评 Midjourney Niji v6

如何使用Midjourney API v6？

Midjourney v6 终于更新了！一文详解新版本 3 大要点

Midjourney V6的这些更新足以变革AI圈

近期资讯

【算法】腐烂的橘子

h5中如何播放rtsp视频流-插件版本

Karpathy力荐博客：写代码的时候，请心疼一下读代码的同事

ArkWeb页面拦截与自定义响应 - 控制加载过程

写个hoc来应付小程序的审核！

Android OpenGLES2.0开发（八）：Camera预览

如何判断设备是折叠屏,全网最准的方法,没有之一！

我不允许还有人不知道前端实现时刻洪水模拟的方法！🤩

分享一些不错的JS/TS代码片段

「工具链🛠️」Rollup是什么？卷起来！🌮🌮（简单用例带你上手现代 JavaScript 打包工具）

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响