由于B站只有三次修改文章的机会,本文在腾讯文档实时更新,https://docs.qq.com/doc/DUXV5clpHT1JaZGx4
现在AI绘画的三大体系,SD(Stable Diffusion)、MJ(Midjourney和niji·journey)、Dall·E2,我们前面的文章讲了前两个体系,这篇文章讲一讲第三个Dall·E2和New Bing上调用的Dall·E2。
Dall·E2是底层同样也是CLIP+diffusion,不开源,可以在OpenAI的官网使用(需要魔法和OpenAI的账号,和ChatGPT共用一个账号)https://labs.openai.com/ 每月15次积分生成免费,可以图生图。收费标准是$15USD购买115积分,太贵不推荐。可以图生图,可以局部重绘。但是不支持其他复杂要求,甚至画面比例也只能正方形。
New Bing的Bing Image Creator(必应图像生成)使用的也是Dall·E2的算法,但应该是跑在微软的azure云上的,链接是https://www.bing.com/images/create? (需要魔法)。但是不同于New Bing是需要先进入候补名单审核的,现在使用Bing的图像生成,是不需要审核的,任何账号只需要在特定IP打开网页就可以免费使用!
那么具体怎么使用呢,上面的图片已经很详细了,输入英文咒语(prompt),点击创建稍等就能看到图片啦!一般来说会生成四张1024*1024的图片,在右侧图片栏能看到本账号之前生成的历史图片,如下图。点击图片可以查看图片详细内容(和SD和MJ相比也不能称作详细吧啊喂)
然后是生成时间,一开始每个账号是有25次快速图像生成,用完快速图像生成之后就是慢速的图像生成。快速图像生成时间是10~20秒,有趣的是,虽然界面上宣称慢速图像生成需要45秒,但是实测生成四张图片也就20秒,快速和慢速的生成时间基本一样!(仅代表个人网络环境,下午测试,欧美人还在睡觉,用户少,服务器没压力,前面没有别的任务排队,所以慢速和快速一个速度,后面用户量多了可能就会慢下来了)
接下来最重要的就变成了要如何写咒语(prompt)。和SD和MJ不同,Bing的Dall·E2图像生成没有复杂的语法,也不能图生图,不能局部重绘。官方给的描述简答的有些过分,主打一个会说话(英语)就会吟唱咒语:
除此之外还有官方推荐的第三方咒语写作指南https://help.openai.com/en/articles/6582391-how-can-i-improve-my-prompts-with-dall-e
https://strikingloo.github.io/DALL-E-2-prompt-guide
由于Dall·E2没有复杂的语法,是尽可能用自然语言描述的,这里我们尝试Midjourney和niji·journey的一些咒语,在咒语不长的情况下,二者有比较好的兼容性,尽管二者的风格可能不太一样。详细的可以参考我们总结的快两百个优质咒语一定去看看哇!
【腾讯文档】AI福瑞绘画经书https://docs.qq.com/sheet/DSUxoeG1CRFdObXFY?tab=BB08J2
另外,Bing生成的图片左下角有B字样的logo,Dall·E2生成的图片右下角有经典的多色方块作为标识。
总结:Bing Image Creator最大的优点是免费,免费,免费!
自由度:Bing Image Creator<Dall·E2<Midjourney=niji·journey<stable diffusion(WebUI)
因为没有复杂的语言,很多复杂的操作都没法实现,但是描述简单,门槛极低,推荐!
对于想使用Dall·E2的,我的建议是,玩玩Bing免费给的就好,想要图生图可以用OpenAI官方的Dall·E2,每月15次免费生成。不建议氪金,想氪金还是MJ。
一些其他吐槽:
最后是回到目录
【腾讯文档】AI兽人魔法书全目录——从入门到精通
https://docs.qq.com/doc/DSUtTRXhybndRQk53
因为AI绘画领域发展太快,很多文章里写的东西过几个月可能就不一样了,具有时效性,那时候我们或许就有更优秀的算法和模型了。
写作匆忙,难免有错,如有发现请指正。
作者 雯森虔_JasonWen
本文使用CC BY-NC,可非商用转载,需署名。