DALL-E早期版本在图像生成方面存在着明显缺陷,无论是对提示词的理解还是输出图像的质量都不够理想。然而,微软最近发布的DALL-E 3版本焕然一新,在理解能力和绘画准确度上不得不说有了不小的进步。
我们尝试了一些绘制,感受颇深。DALL-E 3在构图和英文绘画方面表现出色,但精细度仍可进步。它在准确描绘提示词方面优于早期版本,这应该得益于ChatGPT技术的加持。但是就图像的艺术感和细节处理而言,仍不如Midjourney和Stable Diffusion,还是有不小的追赶空间。
下面我们会分享一些使用DALL-E 3绘画的案例。所有提示词均通过与必应中文聊天机器人的交互获取,是纯自然语言形式。让我们一起见证这个文本到图像生成工具的惊人进步。
最让我们惊叹的是,我们用一句有一定动作表现难度的Prompt给到DALL-E3,他一把就能画出四张都很形象的画面。同样的Prompt在SD上,如果没有合适的Controlnet的OpenPoss模型配合是做不好的。
“一个武打的画面,一个少林武僧凌空飞起,踢出一个连环腿的姿势”
我们还测试了下对文字的绘画能力
“钢铁侠坐在电脑前打字,电脑的屏幕上显示“game over”的画面”
“中国水墨画:静谧的夜晚,一轮明月照着一个开满荷花的池塘”
“皮克斯风格的画面:一个拟人化的小白兔女生,蹦蹦跳跳地开心滴走在山路上,路边有小树和野花”
“电影《阿丽塔:战斗天使》的海报”
“写实画面:一只拟人化的猫的全身像,它戴着安全护目镜和施工帽,表情严肃地检查工地。背景中,有一个写着“Paws Construction Co.”的标志。”
AI大师工作流 2024-05-15
AI画师大阳 2023-10-13