金磊 发自 凹非寺
量子位 | 公众号 QbitAI
Midjourney搞“扩图”,简直把想象力拉满。
我们先来看下这两个画面:
你能想象它们是出自同一张图片吗?
是时候展示真正的技术了:
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
视频加载失败,请刷新页面再试
刷新
视频详情
这就是Midjourney在它最新5.2版本中带来的Zoom Out功能。
效果一出,不少网友在惊叹“太疯狂”之余,也在猜测着它“扩”了多少次,有网友大胆地给出了预估:
50次。
更多网友则是纷纷自己开始搞花活,不到一个小时,直接出一部大片:
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
视频加载失败,请刷新页面再试
刷新
视频详情
Midjourney“扩图”体验实录
这次新出的Zoom Out,Midjourney提供了2个功能选项,分别是“扩图1.5倍”和“扩图2倍”。
而且据官方介绍,是上下左右全方位都可以填充的那种。
那么我们先用ChatGPT来生成一段关于“女拳击手”的Prompt:
然后将这段文字“喂”给Midjourney,便可以得到4张非常逼真的女拳击手的照片了:
接下来,我们选择其中一张,就能看到Zoom Out的功能选项了:
在这里,我们只需要一个点击的动作,原图就会被立即“扩展”。
例如Zoom Out 1.5倍的效果是这样的:
具体对比如下:
以同样的方式再来试试Zoom Out 2倍的功能:
不难看出,Midjourney“扩图”的效果还是可以的。
除了“Zoom Out 1.5x”和“Zoom Out 2x”两个选项之外,Midjourney还提供了“Make Square”和“Custom Zoom”两个功能。
分别对应的是方形扩展和自定义扩展。
那么在反复这样Zoom Out之后,就可以得到刚才视频中的那种效果了。
AI“扩图”哪家强?
说到AI扩图这事,Midjourney并非是第一家推出这个功能的公司了。
在它之前,像Photoshop、DALL-E 2、Stable Diffusion等都已经出了类似功能。
那么问题来了,AI“扩图”,到底哪家强一些?
针对这个问题,公众号“AIGC研修社”便做过一次大比拼。
例如以同一张原图,四家的“扩图”效果如下:
不难看出,各家在“扩图”的效果上都各有各的风格。
对此,“AIGC研修社”给出了非常细致的对比:
“AIGC研修社”的总结结论如下:
MJ的这次outpainting功能如果是拓展MJ生成的图,并且没有其他特殊要求的时候,肯定是最好用的。
四个工具综合来说,目前我还是觉得PS AI最强,有充分的自定义和修改的功能。效果也没有比MJ差多少。
SD和Dalle2基本不会考虑用了。
那么在AI“扩图”这事上,你会pick哪家呢?
参考链接:
[1]https://nofilmschool.com/midjourney-ai-zoom-out
[2]https://nftnow.com/guides/midjourney-5-2-a-guide-to-the-latest-tools-and-features/
[3]https://www.youtube.com/watch?v=G3hUA_E-tNA
[4]https://www.reddit.com/r/midjourney/comments/14h70u7/zoom_out_unleashing_the_potential_of_a_broader/
[5]https://mp.weixin.qq.com/s/3y41ewEfxaYfXjZpeYDlig
— 完—
大咖云集,锚定新技术,稀土开发者大会主会场亮点抢先看!
2023 年,数字技术快速发展,带给人们新的掘金方向。以“不变”应“万变”,把握技术趋势,需要所有开发者始终站在一起同频共振,以期在新的范式转换和新技术浪潮中摘得先机。
本届大会主论坛演讲嘉宾分别是:火山引擎副总裁&字节跳动开源治理运营负责人张鑫、英特尔软件与先进技术事业部研发总监杨继国、Google Cloud 首席架构师于有志、LVS 创始人章文嵩、火山引擎边缘云资深架构师徐广治、北京大学王选计算机研究所教授、CCF 自然语言处理专委会秘书长万小军,他们将聚焦生成式 AI、云原生、边缘云、ChatGPT等热门话题,深入分析新技术给未来产业带来的挑战和机遇。主会场还将为「掘金引力榜」的获奖项目和个人进行颁奖。点击扫码进入官网,点击「立即报名」,还有少量名额可线下免费参与主论坛!
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~