当前位置:首页|资讯|人工智能|艺术

DALL-E将如何改变我们看待世界的方式

作者:黄先生斜杠青年发布时间:2023-01-05


使用计算机生成的萨尔瓦多·达利的人工智能图像。来源:维基百科


最新的互联网疯狂形式是人工智能艺术家,他可以接受简单的说明并产生自己的视觉解释。这是计算机科学中最古老的思想之一——“智力增强”的实现。

我们都渴望实现我们的愿望。孩子们利用这种愿望来探索他们想象力的无限能力。作为成年人,我们面临着可能的极限,希望情况并非如此。

这些限制似乎正在迅速变化。我们利用人工智能的最新突破建造了一盏魔灯。现在,一个精灵伸出头来问我们如何满足我们内心的愿望。

我是斜杠青年,一个被前沿技术耽误挣钱的“杂食性”学者!

我的一个朋友对艺术和音乐的品味集中在20世纪70年代中期的“Prog-rock”时代——当时Yes和Pink Floyd等乐队的美学确立了时代的外观——他要求这位精灵为他的个人收藏创作一些新的艺术品。精灵也许可以重新设计平克·弗洛伊德的《月球黑暗面》的标志性封面,好像不是由Hypgnosis设计的,而是由Gashlycrumb Tinies插画家Edward Gorey设计的吗?

他的愿望是精灵的命令:

这位精灵抽象到Gorey技术的哥特式核心,然后将其应用于专辑标志

性的棱镜和彩虹。整个事情都有效——满足了智力的敏感性和审美感。


不知何故,精灵还吸收了各种风格的彩色玻璃——从中世纪到前拉斐尔派再到现代——并再次将其用作棱镜和彩虹的美学模板。这位精灵对艺术、美学和文化了解很多。

这个精灵会改变一切。

也许我们一代人都会越过技术进步的门槛。正如事情似乎停滞不前一样,我们发现自己正在大规模跳跃到一个全新的、陌生的能力领域。当万维网到来时,我们看到了它;所有这些孤独、孤独的PC终于有了文字处理和电子表格以外的一些目的。我们用智能手机看到了它,它把计算从固定的东西带到了一个无处不在的地方。(同时把我们都变成设备成瘾者,但那是另一个故事……)

DALL-E没有什么可害怕的——至少在短期内是这样。


这一次,一个精灵——正式名称为DALL-E——体现了这一刻的本质:对新计算风格的突破,预示着计算机科学中最古老的思想之一“智力增强”的实现。

DALL-E的基础已经开发了几年。OpenAI是由一系列硅谷名人(包括埃隆·马斯克)创立的研究人员联盟,致力于创造可供所有人使用的尖端人工智能工具,一直在努力构建日益复杂的“语言模型”。这些模型包含数十亿个机器学习“参数”——最好被认为是多位数据之间的关系——从这数十亿个参数中可以做一些事情,例如撰写基本的新闻报道或新闻稿,而无需任何人参与,除了“撰写关于OpenAI最新人工智能工作的新闻稿”等说明。

前年,OpenAI将其最新和最伟大的语言模型(称为GPT-3)应用于计算机编程实践。结果——“Github Copilot”——既有用又不可思议:它消化了数千万个计算机程序,只需在程序代码中添加一点文本注释即可为问题提供解决方案。

与Github Copilot可以就计算机程序中正确位置使用的正确代码提出建议一样——因为它“理解”了编写良好的程序的结构——DALL-E可以根据自己对内容的了解将视觉元素放置在场景中。它并不总是完美地工作,正如我们看到的那样。

尽管其中一些图像看起来非常错误——仔细检查,左下角的图像非常可怕——但它们看起来仍然“足够正确”。

(应该注意的是,这些图像都没有由DALL-E生成,只有数量非常有限的测试人员才能访问,但功能较弱但仍然非常好的DALL-E Mini才能访问。你可以通过访问官网玩DALL-E Mini(craiyon.com))

DALL-E是否拼写视觉艺术家的终结?摄影师、画家和雕塑家能够与一个可以生成无限系列引人入胜的图像和形式的文本框竞争吗?他们甚至应该尝试吗?

关于这个问题的答案,看看我在DALL-E Mini上放手时发生了什么:


这股新一波生成的人工智能系统无法与艺术家匹敌;相反,艺术家将采用这些工具作为新的画布、新画笔和新调色板。19世纪中叶,平版印刷机的出现使即使是最贫穷的人也能获得设计和艺术。这一新的突破意味着设计的创造——而不是它们的消费——已经完全民主化。大多数人永远不会达到训练有素、才华横溢的艺术家的审美精致,但我们都可以获得创造性的工具,将我们的愿望转化为我们可以分享的愿景。

这一新的突破意味着设计的创造——而不是它们的消费——已经完全民主化。

在这方面,我们发现自己回到了有远见的道格拉斯·恩格尔巴特,他在半个多世纪前发明了鼠标、超文本和视频会议,作为释放人类潜力的工具,致力于创造可以“增强”我们智力的机器,并帮助我们承担日益复杂的世界的负担。

DALL-E是下一代工具中的第一款,可以帮助我们与我们的梦想、愿景和人类想象力的无限深度一起工作和分享。我们已经生活在一个每天看到数千张图片的世界里——广告、模因、场景等——所有这些都是由人们精心制作的供人们消费的。

在我们前进的地方,机器将深深地嵌入到对话中,创建和消费图像,观看我们回应它们,使用这些响应生成新图像。计算机创造性游戏的时刻终于到了。在这之后,一切看起来都不一样了。

了解更多前沿技术,关注我就是你最好的选择!



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1