9月20日,OpenAI宣布了其AI图像合成模型的最新版本——DALL-E 3。这款模型以ChatGPT为基础,能够根据复杂的描述渲染出图像,并处理图像中的文本生成(如标签和标志),这是早期模型所面临的挑战。
DALL-E 3的特性
与前代产品一样,DALL-E 3是一个文本到图像的生成器,它根据被称为提示(prompts)的书面描述创建图像。尽管OpenAI并未公开关于DALL-E 3的技术细节,但可以推测,与前代版本的DALL-E一样,DALL-E 3也是在数百万由人类艺术家和摄影师创作的图像上进行训练的,其中一些图像来自于像Shutterstock这样的库存网站。
DALL·E 3是在ChatGPT的基础上构建的,ChatGPT是一种能够与人类进行自然语言对话的AI聊天机器人。ChatGPT可以作为DALL·E 3的优化提示器和头脑风暴助手来使用。只需向ChatGPT提出一个想法,它将自动生成个性化、详细的提示,以便DALL·E 3根据这些提示来创造与想法相符的图像。如果用户对某个图像感兴趣但认为还不够完美,他们也可以用简单的语言提出修改建议,DALL·E 3将根据这些建议进行相应调整。
以下是DALL·E 3创建的一些图像:
OpenAI表示,DALL·E 3在生成图像时会遵循一定的安全准则,比如拒绝生成暴力或仇恨内容,以及在世的艺术家风格的图像。此外,OpenAI也在研究如何帮助人们识别哪些图像是由AI生成的,以防止可能出现的滥用或误导问题。OpenAI还表示,用户生成的图像属于他们自己,他们不需要得到OpenAI的许可就可以使用或出售这些图像。
目前,DALL-E 3还处于研究预览阶段,预计将在10月初向ChatGPT Plus和企业客户开放。这意味着我们将能够看到更多根据复杂描述生成的精美图像。无论是为你的故事创作插图,还是为你的产品设计原型,DALL-E 3都将成为一个强大的工具。
让我们一起期待这个激动人心的新技术带来更多可能性!