人工智能研究初创公司OpenAI宣布(在新标签中打开)DALL·E 2,它的文本到图像生成器的更新,看起来像是向前迈出了重要的一步。
本质上,DALL·E 2 可以从自然语言输入中创造艺术,例如:“克劳德·莫奈风格的一幅日出时坐在田野里的狐狸画”。OpenAI 表示,其目标是创造“结合概念、属性和风格”的“原创、逼真的图像和艺术”。
对于一家一直致力于各种 AI 计划(包括GPT-3 )的公司来说,这是一项令人印象深刻的壮举(在新标签中打开),这可以产生非常出色的散文。
OpenAI 随附的研究论文更详细地介绍了 DALL·E 2 的工作原理。使用 CLIP 对比模型,DALL·E 2 分两个阶段运行:第一个阶段创建嵌入文本标题的 CLIP 图像,第二个阶段基于此生成图像。
结果令人印象深刻,并且可能对艺术和平面设计行业产生重大影响,尤其是对视频游戏工作室而言,这些工作室目前雇佣设计师苦心构建世界和概念设计。
DALL·E 2 建立在 OpenAI 与 DALL·E 1 所做的工作之上(在新标签中打开)2021年1月。这个名字是萨尔瓦多·达利和WALL·E的组合。
勇敢的新世界
OpenAI 是目前在人工智能领域工作的最令人兴奋的初创公司之一。
由 Elon Musk、Sam Altman、Ilya Sutskever 等人于 2015 年创立,其目标是生产一种造福全人类的“友好 AI”。这家非营利性初创公司与 Alphabet 的 DeepMind 竞争。
DALL·E 2 是这项工作在实践中的一个非常好的例子,它在使用 AI 生成图像时突破了可能的界限。该服务甚至可以根据用户的规格编辑现有图像。
当然,还有很长的路要走。研究人员指出,它的 CLIP 基础很容易通过将一个项目标记为另一个项目而被愚弄。但随着时间的推移,这些问题将得到解决和改进。
OpenAI 计划尽快发布 DALL·E 2 以供选择研究人员使用。
皕赫国际18001942024 2024-12-20
维小帮导航导览 2024-12-20