文 | 阑夕
前几天,AI绘画工具Midjourney推出了V6版本,随后一如既往的赢得了进步巨大的盛赞。
V6模型的最大亮点,在于它对画面真实性的理解更加透彻了,无论是在细节的处理上,还是对于提示词的敏感,相比V5.2都有着前所未有的提升。
但在另一方面,随着被使用规模的增加,越来越多的人发现,Midjourney V6之所以能够拿出极其逼真的图画,可能是因为它的训练来源已经深入到了影视作品的每一帧上,而且并不掩饰生图时的一致性。
有很多用户已经发现了拟合度非常高的案例,比如下面这组对比,左边是「复仇者联盟」的电影截图,右边是Midjourney V6的出图:
来自X友Reid Southen
以及和2019年上映的电影「小丑」剧照的这个对比:
来自X友Min Choi
这再次触及到AI绘画的模糊风险:在被指控拿版权内容进行训练这件事情上,通常只能自证而非他证,AI公司「打马虎眼」的空间相当充裕,AI学习人类艺术是否是一项权利,也可以作为讨论议题拖延太久。
但是,重绘是一码事,叠图又是另一码事了,当你的产出里已经出现了高度拷贝原始图像的图画,由此引起的法律诉讼只会迎来爆炸式的增长。
事实上,我自己测试的结果,也能发现在那些具有高知名度、且影视素材流传极广的动画作品上,Midjourney V6的还原度,确实非常惊人:
火影忍者
瑞克和莫蒂
进击的巨人
驯龙高手
海贼王
小黄人
蜘蛛侠:平行宇宙
乐高蝙蝠侠
这些图片都出自Midjourney V6,Prompt是很简单的一句[scene form xxx —ar 16:9 —style raw],很显然,如果不事先说明的话,将这些画面伪装成对应动画的截图,大概不会有多少人能够分辨出来。
当然,也有一些失败尝试,我的分析是,有些动画作品可能在知名度上是有的,但它的网络资源或是素材并没有那么丰富,或是样本被污染比较严重,导致Midjourney V6在训练时的容易走偏,所以复现效果就会变差不少:
灌篮高手
穿靴子的猫
猫和老鼠
总之就还挺迷的,作为AI的使用者,当然希望获得更加强大的产品能力,可是如果AI公司不能建立一个公允且可持续的商业模式,最后也可能会为行业遭致灾祸。
也不能完全说AI的拟合行为是不可容忍的,毕竟从Prompt来看,如果你指明让AI还原一部影视作品,它要是没做到这样的程度,反而会是某种意义上的失职,只是在一个非开源的、商业化的产品生态里,风险是有集中性的。
虽说给猴子一台不会坏的打印机和无限的时间,它终有一日能够打出「哈姆雷特」的全集出来,但无论是艺术还是科学,都不会膜拜这只猴子。