当前位置:首页|资讯|提示词|ChatGPT

AI算图咒语概论①|What the Prompt?

作者:你风哥WindBro发布时间:2024-02-05

你还记得,为了生成图片而写的第一串 Prompt 吗?

你还记得,跟 ChatGPT 说的第一句话吗?


最开始,刚接触到 AI 生成工具时,我没做甚么深入的了解,就点开了 Leonardo.Ai 和 ChatGPT 的页面,那时候的我也多少抱有幻想,以为电脑终于能够跟人类产生自然流畅的对话,并且能理解我们的意思,也许产生自我意识、会做梦、成为真正的生命,都指日可待……

毕竟 AI 题材的科幻片也没少看,有这么一点见证历史一页的兴奋,也是合情合理吧。🤣


不过真的使用下去后,很快,很快就理解到其实现在还差得很远。电脑——AI 现在依然无法做到「理解」人类的语言,它只是能够「产出」人类的语言罢了。

在我看来,

就像是聪明且受过悉心调教的动物。

在学习 AI 相关的知识时,越是瞭解生成式 AI 的工作原理,越让我想起这几年很流行的,训练宠物猫狗透过按留声按钮,来跟人类用人话交流的影片。或是更阳春一点,海生馆的海豚和海狗表演。(声明个人不支持强迫动物表演)

海豚的智商相当七岁人类,但当任一随机游客在表演中进行互动时,仍然需要使用训练员教导的手势,才能让海豚做出对应的动作,而不单单只是走上前,跟他说一声人类语言的「转圈」。

AI 也是一样,它真正理解跟计算的都不是人类的语言,理解人类语言的方式也不是人类的方式,如果你不学着怎么去跟它沟通,用它理解的方式来提出你的要求,那么得不到你想要的结果,也是合情合理吧?


当然了,AI 跟动物还是有区别的,大型语言模型 (LLM) 对人类语言的掌握度日益猛进,也许终有一天他们能达到人类也判断不出的自然跟流畅,能达到确实理解人类在口语上,完全不顾语法死活的对话内容的境界。


但起码现在不是,所以我们还是要学着怎么跟机器沟通,以期达到事半功倍的效果。



你好,初学者。

本篇面向 AI 算图新手、对写 prompt 没有概念的朋友,以 diffusion model 系 AI 绘图工具为例,分享我自己从零开始学习写图像生成 prompt 的经验,只谈基本架构跟新手上路的方向。

写 prompt 的路子有很多,我并不是唯一正解,只是其中的一种路子,希望每个走过路过的朋友,在看完后经过练习,都可以找到自己写 prompt 的风格。


基本观念

  1. 英文写效果最好。

    市面上的 AI 的训练几乎都是以英文来进行的,所以英文 prompt 的生成效果最好。

  2. AI 理解文字需要透过一个预先训练好的文字编码器 (text encode) 把人类的文字转换成 AI 看得懂的东西,而非直接去阅读文字。

  3. 写法主要分为单词片语自然语言两种,个人推荐单词片语式。

    自然语言就是人类讲话,带有描述、修辞、语法等口语化内容。在 SDXL 系列模型中,自然语言 prompt 的表现能力有显着提升。

  4. 基本法则是越靠前的 prompt 权重越重,也就是说 AI 会更重视它。

  5. 字词有天生权重,取决于各模型的训练方式,天生就重的 prompt 即使放在后段也不容易被其他词吃掉。反之有些轻的词,在不增加权重的情况下,放排头也不一定会出来。

  6. 同一个 prompt 在不同的模型、不同採样器 (sampler)、不同 LoRA 等不同条件中,会有不同的对应结果,因此需要明白 prompt 没有绝对的万用标准版

  7. 同样是生成式 AI,语言模型 (e.g. ChatGPT) 和绘图模型 (e.g. Stable Diffusion) 是两码子事,工作原理完全不一样。

  8. 各家 prompt 语法基本上不通用,效果也不尽相同,MJ 用 MJ 自己的,Leo 用 Leo 自己的,A1111 用 A1111 的,使用前请详阅各家公开说明书。🧐

  9. prompt 如果写了没有被训练过的内容,那这段 prompt 就不具备意义,而只作为一个乱数,但是,并不会导致无法生成,并且仍然会对生成结果造成一定的影响。

    简单来说,AI 会自己跳过它看不懂 (没学过) 的部分,类似于有边读边没边读中间

  10. 大部分 AI 读取 prompt 有一定长度限制,过长的 prompt 容易被忽略掉后段。

    在 SDXL 系列模型中,长篇 prompt 的表现能力有显着提升。



学习轨迹

刚开始真的推荐先从抄袭别人的prompt学起,这个阶段就像是学书法时的临摹字帖,学画画时的临摹名画。

抄,不能盲目抄,盲目抄的话写prompt的功力是不会进步的。

英文不是我们的母语,但生在这个时代我们有基本的google翻译和强悍的chatGPT,看不懂的词,稍微丢一下翻译工具,一点点慢慢地记、慢慢地学,很快你就会发现自己不知不觉背下了很多单字,英打速度也突飞猛进。

略有熟悉后,就可以试试看,自己从无到有写出一段prompt。一开始不用直接写超长,一点点加就好。


完善流程

总结基本概念,以下是我对新手写prompt的建议,也是我自己通常使用逐步完善prompt的方式:

用英文书写,单词构成,先写出简单的主体、想要表现的技法、色调、情绪等,加上基本上有写有保佑的best quality。

🔽

根据使用平台可接受的语法来添加语法,先刷几次看我写的东西有没有按照我想的方式表现出来。

🔽

依据结果调整prompt的前后顺序,并增加更多细节元素,如negative prompt、艺术家名称、第二色调等。

🔽

更换模型、更换画布尺寸、更换其他条件设置。刷图比对结果,根据结果调整prompt。



我第一串prompt真的是挖不出来了,目前可以找到最早的是:

Prompt:

Art nouveau, Alfons Maria Mucha, CLAMP, centered, approaching perfection, dynamic, highly detailed, watercolor painting, light blonde hair, light blue eyes, western facial features, full body, wearing fantasy ancient Chinese costumes, dress like a hobo, one is westerners facial features, deep eye socket, overall color is relatively deep, stick weapon,

Negative Prompt:

(((2 heads))), duplicate, blurry, abstract, disfigured, deformed, cartoon, animated, toy, figure, framed, 3d, cartoon, 3d, disfigured, bad art, deformed, poorly drawn, extra limbs, close up, b&w, weird colors, blurry, watermark, blur haze, 2 heads, long neck, watermark, elongated body, cropped image,out of frame,draft,deformed hands, twisted fingers, double image, malformed hands, multiple heads, extra limb, ugly, poorly drawn hands, missing limb, cut-off, over satured, grain, lowères, bad anatomy, poorly drawn face, mutation, mutated, floating limbs, disconnected limbs, out of focus, long body, disgusting, extra fingers, groos proportions, missing arms, mutated hands, cloned face, missing legs,

80%靠到处複製贴上,那时候对AI完全没有概念,英文也很烂。

现在回头检查一遍可以改掉的地方好多,写prompt有练习真的有差,现在的我也不会写那么长串的negative prompt了,大部分时候甚至是不写,或是只写基本款。

希望这个教学对你有帮助,有任何问题可以在下面留言。

可以的话,跟我分享一下你的第一串、或是可以回溯到的最早的prompt吧!



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1