当前位置:首页|资讯|AI绘画|自动驾驶|汽车|艺术|法律

AI绘画创作与版权:如何通过ComfyUI工具规避风险

作者:QAyong发布时间:2024-05-13

在数字化浪潮的推动下,人工智能(AI)已经渗透到我们生活的方方面面,从自动驾驶汽车到智能家居系统,再到我们今天要讨论的主题——AI绘画。AI绘画作为一种新兴的艺术形式,不仅挑战了传统绘画的界限,也引发了一系列法律和道德问题。(2023)京0491民初11279号案件对于AI绘画是否具有著作权进行确认,它不仅揭示了AI创业领域潜在的风险,也为我们提供了一个思考AI艺术创作权利归属的机会。

本文将深入探讨这一案例,分析其实务意义,并介绍ComfyUI这一工具如何帮助AI绘画行业规避风险。通过对案例的剖析,我们将了解到在AI绘画中如何证明智力成果和独创性,以及如何保护自己的创作不受侵权之苦。无论您是AI技术的研究者、法律专业人士,还是对AI艺术创作感兴趣的普通读者,相信这篇文章都能为您提供有价值的见解。

AI绘画侵权案基本案情

  • 2023年2月24日,原告李昀锴使用Stable Diffusion模型生成了数张人像图片,并将其中一张以“春风送来了温柔”为名发布在社交平台小红书上。

  • 2023年3月2日,一自媒体账号在百家号上发布了一篇名为《三月的爱情,在桃花里》的文章,使用了李昀锴制作的图片。

  • 2023年8月24日,原告李昀锴起诉被告刘某侵害作品署名权、信息网络传播权纠纷案在北京互联网法院在线公开审理。

  • 2023年11月27日法院作出(2023)京0491民初11279号民事判决,审理认为:

  1. 智力成果的认定:法院认为,原告在构思和生成涉案图片的过程中进行了一定的智力投入,如设计人物呈现方式、选择提示词、安排提示词顺序、设置相关参数等。因此,涉案图片体现了原告的智力投入,具备了“智力成果”要件。

  2. 独创性的认定:原告通过输入提示词和设置参数,对画面元素和布局构图进行了设计,体现了其个性化表达。法院认为,在没有相反证据的情况下,可以认定涉案图片由原告独立完成,具备“独创性”要件。

  3. 作品的认定:法院指出,人工智能模型生成的图片,本质上是人利用工具进行创作的结果。只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法的保护。

  4. 美术作品的认定:涉案图片是以线条、色彩构成的有审美意义的平面造型艺术作品,属于美术作品。法院认为,涉案图片在可以归属到具体作品类型时,不需要适用“其他作品条款”进行保护。

  5. 著作权的认定:原告是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人。因此,原告是涉案图片的作者,享有著作权。

综上,案涉图片构成作品,原告具有著作权,被告侵权应当负担侵权责任。

实务分析

《中华人民共和国著作权法》第三条规定:“本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。” 根据上述规定,审查原告主张著作权的客体是否构成作品,需要考虑如下要件: 1.是否属于文学、艺术和科学领域内;2.是否具有独创性;3.是否具有一定的表现形式,4.是否属于智力成果。

从AI绘画侵权案来看,目前AI绘画产生的图片已经具有著作权已经得到确认,但从实务角度来看,AI绘画从业者如何证明自己对生产的图片具有著作权这是一个问题。作为AI绘画行业从业者,如果面临类似的案件中,需要证明上述的要件才能胜诉。

那如何证明自己用AI绘画工具生成的图片是智力成果和具有独创性呢?

我们可以从该案的裁判文书中得到启发。

法院说理部分如下:

关于“智力成果”要件,“智力成果”是指智力活动的成果因此,作品应当体现自然人的智力投入。本案中,原告发布涉案图片时已经标注为“AI插画”,且原告可以利用 Stable Diffusion模型根据自已设定的提示词和参数还原该图片的生成过程,在无相反证据的情况下,可以认定涉案“春风送来了温柔”图片系原告利用生成式人工智能技术生成的。根据公开资料和相关调研显示,Stable Diffusion 模型是由互联网上大量图片和其对应文字描述训练而来,该模型可以根据文本指令,利用文本中包含的语义信息与图片中包含的像素之间的对应关系,生成与文本信息匹配的图片。该图片不是通过搜索引擎调用已有的现成图片,也不是将软件设计者预设的各种要素进行排列组合。通俗来讲,该模型的作用或者功能类似于人类通过学习、积累具备了一些能力和技能,它可以根据人类输入的文字描述生成相应图片,代替人类画出线条、涂上颜色,将人类的创意、构思进行有形呈现。本案中,原告希望画出一幅在黄昏的光线条件下具有摄影风格的美女特写,其随即在 Stable Diffusion 模型中输入了提示词,提示词中艺术类型为“超逼真照片”“彩色照片”,主体为“日本偶像”并详细描绘了人物细节如皮肤状态、眼睛和辫子的颜色等,环境为“外景”“黄金时间”“动态灯光”人物呈现方式为“酷姿势”“看着镜头”风格为“胶片纹理”“胶片仿真”等,同时设置了相关参数,根据初步生成的图片,又增加了提示词、调整了参数,最终选择了一幅自己满意的图片。从原告构思涉案图片起,到最终选定涉案图片止,这整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入,故涉案图片具备了“智力成果”要件。

当然,并非所有智力成果都是作品,只有具备“独创性”的智力成果才能构成作品。通常来讲,“独创性”要求作品由作者独立完成,并体现出作者的个性化表达。“机械性智力成果”应当被排除在外。比如按照一定的顺序、公式或结构完成的作品,不同的人会得到相同的结果,因表达具有唯一性,因此不具有独创性。而利用人工智能生成图片,是否体现作者的个性化表达,需要个案判断,不能一概而论。一般来说,人们利用 StableDiffusion 类模型生成图片时,其所提出的需求与他人越具有差异性,对画面元素、布局构图描述越明确具体,越能体现出人的个性化表达。本案中,从涉案图片本身来看,体现出了与在先作品存在可以识别的差异性。从涉案图片生成过程来看,一方面虽然原告并没有动笔去画具体的线条,甚至也没有百分之百的告知StableDiffusion 模型怎样去画出具体的线条和色彩,可以说构成涉案图片的线条和色彩基本上是 Stable Diffusion 模型“画的,这与人们之前使用画笔、绘图软件去画图有很大的不同。但是,原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。在庭审中,原告通过变更个别提示词或者变更个别参数,生成了不同的图片,可以看出,利用该模型进行创作,不同的人可以自行输入新的提示词、设置新的参数,生成不同的内容。因此,涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。综上,涉案图片具备“独创性”要件。

从这里面可以看出,法院对于智力成果的认定以及独创性的认定来看,“提示词”、“参数”这两个词被重复提及。法院认为,原告通过自己的设计,不断的改变提示词以及参数生成图片并对图片进行筛选这样的一个过程是创作过程。

那么原告是如何证明这一过程的呢?

法院裁判文书如下:

原告主张该图片系其于2023年2月24日通过软件StableDiffusion 生成,其提交再现涉案图片生成过程的视频,具体操作步骤如下:

1.打开bilibili网站,搜索用户“秋菜aaaki”,打开标题为“[AI绘画]Stable Diffusion整合包v4.2发布!全新加速解压即用 防爆显存 三分钟入门AI绘画......”的视频,打开视频下方提供的网盘链接“https://panbaiducom/s/1sVmVqA2CGUsZwyRdjoA5Vg”,下载“sd-webui-aki-V4.2.7z”压缩包。解压缩打开文件“A用户协议.txt”,显示:“本整合包仅用作 AIGC技术学习,基于Github 上开源项目 Stable Diffusion Webui制作,提供了算法的运行环境。使用本整合包即代表您已阅读并同意以下用户协议:您不得实施包括但不限于以下行为,也不得为任何违反法律法规的行为提供便利:反对宪法所规定的基本原则的。危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的。损害国家荣誉和利益的。煽动民族仇恨、民族歧视,破坏民族团结的。破坏国家宗教政策,宣扬邪教和封建迷信的。散布谣言,扰乱社会秩序,破坏社会稳定的。散布淫秽、色情、赌博、暴力、凶杀、恐怖或教唆犯罪的。侮辱或诽谤他人,侵害他人合法权益的。实施任何违背“七条底线”的行为。含有法律、行政法规禁止的其他内容的。因您的数据的产生、收集、处理、使用等任何相关事项存在违反法律法规等情况而造成的全部结果及责任均由您自行承担。”

2.打开“A启动器.exe”,主页面如图1所示。选择版本后点击一键启动。

3.返回bilibili网站,搜索用户“K43”打开标题为“Sale Diffusion 个人制做写实向融合模型 让你绘制出更美丽的亚洲,中国风少女人像”的文章,在文章中复制网址“https: //huggingface.co/dcy/AsiaFacemix/tree/main”并在浏览器中打开下载模型包“AsiaFacemix-pruned-fix,safetensors”“lora-hanfugirl-v1-5.safetensors”。

将模型“AsiaFacemix-pruned-fix.safetensors”移动到“models”-“Stable-diffusion”的文件夹后,将启动器 (Stable-diffusion 模型)的模型修改为“AsiaFacemix-pruned-fix.safetensors”。将模型“lora-hanfugirl-v1-5.safetensors”移动到“extensions”-“sd-webui-additional-networks”-“model“lora”的文件夹后,将启动器“Additional-Networks”中的模型1修改为lord-hanfugirl-v1-5.safetensors”。

4.在正向提示词(Prompt)输入:“(ultra photorealistic:1.3)extremely high quality highdetail RAW color photo,in locations,japan idol,highly detailed symmetrical attractive face,angular simmetrical face, perfectskin, skin pores,dreamy black eyes,reddish-brown plaits hairs,uniform,long legs, thighhighs, soft focus, (film grain, vivid colors,film emulation,kodak gold portra 100, 35mm, canon50 f1.2),Lens Flare,Golden Hour,HD,Cinematic,Beautiful DynamicLighting”。中文译文为: (超逼真照片 1:3),超高品质高细节的原始图像数据处理格式彩色照片,外景,日本偶像,高度细节对称且迷人的脸,棱角匀称的脸,完美的皮肤,皮肤毛孔,梦幻般的黑眼睛,红褐色的辫子,均匀,长腿,长筒袜,软对焦,(胶片纹理,生动的色彩,胶片仿真,柯达黄金肖像 100.35mm,佳能 50f1.2),镜头光晕,黄金时间,高清,电影,美丽的动态灯光。在反向提示词(Negative Prompt)输入“((3d,render,cg,painting,drawing,cartoon,anime,comic:1.2)), bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,signature,watermark,username.blurry,artist name,(longbody), bad anatomy,liquid body,malformed,mutated,badproportions,uncoordinated body,unnaturalbody,disfigured, ugly, gross proportions,mutation,disfigured,deformed,(mutation), (child: 1.2), b&w,fat,extra nipples,minimalistic,nsfw,lowres,badanatomy,bad hands,text,error,missing fingers,extra digit,fewer digits, cropped,worst quality,low quality,normal quality, jpeg artifacts,signature,watermark,username,blurry,disfigured,kitsch,ugly,oversaturated,grain,low-res,Deformed,disfigured,poorly drawn face,mutation,mutated,extra limb,ugly,poorly drawnhands,missing limb,floating limbs,disconnected limbs,malformed hands,blur, out of focus,long neck, long body,uglydisgusting,poorly drawn,childish,mutilated,mangled,old,surreal,text,b&w,monochrome, conjoined twins,multiple heads,extra legs,extra arms,meme,elongated,twisted,fingers,strabismus,heterochromia, closed eyes,blurred, watermark,wedding,group,dark skin,dark-skinned female,,tattoos,nude.lowres,badanatomy,badhands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality, low qualitynormal quality,jpeg artifacts,signature,watermark,username, blurry”中文译文为:((3d,渲染,例如: 绘画,素描,卡通,动漫,漫画1.2)),糟糕的解剖结构,糟糕的手,文字错误,缺失的手指,多余的数字,更少的数字,裁剪,最差的质量,签名,水印,用户名,模糊,艺术家的名字,(长体),糟糕的解剖结构,液体,畸形,突变,糟糕的比例,不协调的身体,不自然的身体,毁损,丑陋,粗大的比例。突变,毁损,变形(突变), (儿童: 1.2),黑与白,脂肪,多余的乳头,极简主义,不适宜工作场所,低分辨率,糟糕的解剖结构,糟糕的手,文字,错误,缺失的手指,多余的数字,更少的数字,裁剪,最差的质量、低质量,正常质量,jpeg 伪影,签名,水印,用户名,模糊,毁容,媚俗,丑陋。过饱和,纹理,低分辨率,变形,毁容,没画好的脸,突变,突变,多余的肢体,丑陋,没画好的手.缺失的肢体,漂浮的肢体,断开的肢体,畸形的手,模糊,失焦长脖子,长身体,丑陋,恶心,画得不好,幼稚,残缺,支离破碎,显老。超现实的,文本。黑和白单色,连体双胞胎,多个头部,多余的腿,多余的手臂,模因,拉长,扭曲,手指,斜视,异色,闭上眼睛,模糊,水印,婚礼,团体,深色皮肤,深色皮肤的女性,纹身,裸体,低分辨率,糟糕的解剖结构,糟糕的手文字,错误,缺失的手指,多余的数字,少的数字,裁剪,最差的质量,低质量,正常质量,Jpeg 伪影,签名,水印,用户名,模糊。其中,反向提示词中的“((3d,render,cg,painting,drawing,cartoon,anime,comic:1.2))” 系其自行编辑外,其余所有的反向提示词均系其直接复制于某论坛中用户分享的提示词内容。

5.将选代步数修改为 33,高度修改为 768,提示词引导系数修改为9,随机数种子修改为 2692150200,点击“生成”按键操作界面如图 2所示,生成结果如图 3 所示。

6.在上述参数不变的情况下,将“Additional-Networks”中的模型lord-hanfugirl-v1-5.safetensors的权重修改为 0.75生成结果如图 4 所示。

7.在上述参数不变的情况下,将随机种子修改为 2692150199。生成结果如图 5所示。

8.在上述参数不变的情况下,在正向提示词 (Prompt)增加 “ shy,elegent,cute,lust,cool pose,teen,viewingatcamera,masterpiece,best quality”,中文译文为:害羞、优雅可爱、情欲、酷姿势、青少年、机前浏览、杰作、最佳质量。生成结果如图 6 所示,该图片即涉案图片。

经当庭勘验,原告通过变更个别提示词或者变更个别参数,其生成的图片结果不同。

从文书中记载,原告通过现场演示,向法官展示了使用AI绘画工具输入与案涉图片相同的提示词以及参数来生成图片。

从上述内容可以看出:如何证明自己用AI绘画工具生成的图片是智力成果和具有独创性呢?

总结来说,要点如下:

  1. 需要有生成图片的提示词、参数、生成图片的筛选的记载

  2. 需要有图片的构图到图片的生成的过程展示。

那么在实务中,作为AI绘画行业从业者,如何保证自己提供的证据能证明上述要点呢?

笔者虽是法律行业从业者,平常爱好喜欢鼓捣AI相关的东西,从这里我推荐AI行业这使用comfyui工具进行AI绘画创作,方便证据的保留。

comfyui介绍

目前StableDiffusion AI绘画主流有两种操作方法,一种是我们常见的SD WebUI的操作方法,SD WebUI提供了一个更直观、用户友好的界面,适合初学者和日常使用。它的操作简单,功能一目了然,学习成本低,使得用户可以快速上手并生成图像,这种方法只需要用户根据图片设计,按选项设置参数和提示词就可以生成图片。

ComfyUI是一款基于节点工作流的AI绘画工具,它允许用户通过拖拽不同的节点来定制复杂的图像生成流程。这种方式提供了高度的灵活性和可定制性,使得用户能够精确控制图像生成的每个步骤。ComfyUI的特点在于其优化的性能和速度,它能够在较低的内存下运行,同时出图速度也相对更快

为什么要使用comfyui

目前webui使用方法占主流,但对与AI行业来说,我依然推荐使用Comfyui进行作业。理由主要也是基于明自己用AI绘画工具生成的图片是智力成果和具有独创性这一考虑。

目前的使用webui的生成图片,在我们上传分享网络平台的时候可以填写参数等相关信息,但这并不适合行业生产,一个保密需要就能将这个方法否定。如果使用webui生成图片还有保密需要,那么只能自己在本地创建一个文档作为日志记录图片设计、生成提示词、参数这些信息,而这样会降低自己的效率。

而对于comfyui来说,相比与webui来说,其有个最重要的功能就在于可以导出目前的工作流。

comfyui会将目前在界面中的提示词、参数等内容打包保存成json格式的文件。

当我们使用comfyui工具加载该文件,里面的提示词、参数等内容将会重新加载,可以说是做到了该图片内容生成过程的备份,当我们生成好图片后,只需要保存该张图片的工作流的json格式的文件就可以实现复现图片生成过程了。

除了上面的这个理由,comfyui这种可视化、节点化的工作方法天然地能够将人的想法反映出来,从证据上来看更加能够证明人使用AI绘画工具中具有智力的体现。

总结

AI绘画侵权案后,AI绘画是否具有著作权已经盖棺定论,但这不代表以后面对类似的案例就可以很轻松的主张权利,主张权利依然是个“技术活”。笔者个人推荐使用ComfyUI工具进行AI绘画创作,以后你如遇到类似的案例,保存的json格式的文件一定会帮助到你的。

(文章由Copilot辅助完成仅个人看法,欢迎讨论)



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1