当前位置:首页|资讯|ChatGPT|人工智能

海睿思分享 | ChatGPT梦幻联动,解锁企业数字化转型新可能

作者:OceanMind海睿思发布时间:2023-07-05

原标题:海睿思分享 | ChatGPT梦幻联动,解锁企业数字化转型新可能

在当今这个充满活力和变化的世界里,人工智能 (AI) 的迅速发展正在改变着我们的生活方式。它不仅提高了我们的工作效率,而且正在重新定义我们的日常生活,以前所未有的方式提高了我们的生活质量。其中,以ChatGPT为代表的语言生成模型横空出世,通过强大的机器学习能力,渗透于我们生活的方方面面。而Midjourney,则作为一个新兴的AI作画程序收到了世界各地的关注。这两款工具,一款聚焦语言交流,一款专注艺术创作,当它们发生碰撞的时候,又会发生什么呢?

本篇推文我们就来介绍一下以Midjourney为主、ChatGPT为辅的创作流程可以为企业工作数字化、智能化带来怎样的艺术火花。

Midjourney与AI作画

早在60年代,AI艺术的概念和相关系统就产生了,其中就包括绘画与音乐作品等,而使用文字生成画作的方式属于AI艺术的一种形式。Midjourney作为这样一种智能作画系统,使用深度学习和神经网络的技术,将输入的描述性词句转化为多种风格的画作呈现出来,与之类似的有OpenAI开发的DALL-E2,微软的NUWA-infinity,以及著名的Stable Diffusion开源模型。

Midjourney于2023年5月4日新发布的5.1版本支持对输入文本的自然语言理解,并提高了作画的精度,减少无关信息的生成。虽然其技术尚未公布,但公众推测与现有AI绘画系统相类似,如通过使用LDM渲染模型等对大量的图片样本进行机器学习后得出结果。

Midjourney详解

Midjourney人工智能程序嵌入于一个名叫Discord的交流平台,通过输入指令的方式支持语义理解、修改版本和风格、提升分辨率、效仿用户上传图片风格(喂图)等。

以下为利用Midjourney生成UI收入看板的演示:

指令:/imagine UI design for income board --s 250 --v 5.1

输出:(Midjourney一次性输出四张备选)

从以上范例我们不难发现:

1. Midjourney目前主要适合英文输入,中文输入会造成语义理解错误

2. 如果指令的描述不够具体,生成的四张图片会有较大差异,由于生成的随机性,可能无法呈现使用者想要的画面效果

3. Midjourney在指令正确且合理的情况下只可以给出图片格式的结果,但无法直接转换为矢量图用于编辑

针对以上几个特点,如果我们需要生成更为具体的内容或者包含特定的元素,如何写好指令是重点,这也是为什么我们在后续考虑使用ChatGPT辅助我们生成指令。

ChatGPT与Midjourney的联合运用

由于Midjourney的指令理解系统尚有缺陷,我们可以通过训练ChatGPT写出适用于Midjourney的指令,从而解决以下几个问题:

  • 句段式语句要素提取与完善
  • 搜索合适专业术语丰富指令内容
  • 语言翻译
  • ……

以上一部分的UI页面设计为例,如果我们需要ChatGPT从主体、场景、风格、质量等方面完善对“UI收入看板”的描述,首先可以通过举例的方式让ChatGPT了解生成指令的形式,之后只需输入我们的要求即可自动生成。

ChatGPT优化前:UI design for income board

ChatGPT优化后:Crisp, clean UI design for income board, sophisticated data visualization with interactive income graphs, delineation of various revenue streams, real-time data synchronization, professionally styled user profile, subdued corporate color palette, intuitive user-friendly navigation, tactile response on button selection, structured grid layout, high-definition, pixel-perfect icons, seamless transitions, high-quality 4K resolution, and state-of-the-art rendering

输出:

通过选择最满意的作品并利用Midjourney自带的优化功能,我们可以获得风格和内容更类似、精确度更高的四幅备选作品。而ChatGPT生成的指令加入了更多的描述性字句,如“对交互式收入图表进行数据可视化”“结构化网格布局”“高质量 4K 分辨率”等等。这些都使对图片生成的需求更为细致具体,从而逐渐还原理想中画作的布局和构造。

AI作画在未来的应用

从之前的例子中可以看出,类似于Midjourney的AI创作软件已经可以做出最基本的界面和配色设计,但是生成的例子无法直接使用,因此需要后续处理后才能投入使用。除此之外,从社会角度来说,AI作画软件给大多数人提供了一种易于创造的机会,从而激发创造力与相关产业。而AI作画软件本身仍有不足之处,优化语义理解功能、细节或绘画逻辑的完善等方面仍需要更多的研发投入。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1