前言
2024年2月15日,人工智能公司OpenAI公布了最新的文生视频大模型“Sora”。只要输入一段文字,Sora便可以根据用户的文本提示,理解用户在提示中表达的特殊需求。其采用类似于GPT-4对文本令牌进行操作的方式来处理视频“补丁”,并能够生成长达60秒钟的一镜到底视频。Sora还具有对物体在物理世界中存在方式的理解,可以进行深度模拟真实物理环境,生成包含多个角色、涉及特定运动的复杂场景。
Sora发布引发了大家对ChatGPT、Midjourney等生成式人工智能的生成内容所面临的著作权问题的进一步关注及探讨。本文拟结合我国“人工智能文生图著作权侵权国内第一案“[1](以下简称“春风图案”)以及“AIGC著作权侵权全球第一案”[2](以下简称“奥特曼案”),对AIGC的相关著作问题进行探讨,同时也拟基于Sora发布的背景,以Sora为例对未来AIGC的著作权问题可能面临的挑战进行初步讨论。
一、AIGC能否被认定为“作品”,受到《著作权法》保护?
《著作权法》第三条将作品定义为“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,因此判定AIGC是否能够被认定为“作品”,一般需要从四个方面进行考虑:1.是否属于文学、艺术和科学领域内;2.是否具有独创性;3.是否具有一定的表现形式;4.是否属于智力成果。AIGC属于文学、艺术领域,能够借助文字、图像、视频等形式可被人类感知与欣赏,从一般人的角度来看,明显属于艺术领域,并具有一定的表现形式。因此,在理论与实务中,大家重点关注内容主要为AIGC是否为智力成果,以及其是否具有独创性。
1.AIGC是否属于“智力成果”?
“智力成果”是指智力活动的成果,体现了智力活动主体的智力投入。根据传统著作权法的观点,“智力”是自然人独有的思想,即只承认人类能够成为进行智力活动的主体。[3]在生成式人工智能横空出世后,国际知识产权保护协会发布了《关于人工智能生成物的版权问题决议》,认为AIGC只有在其生成过程有人类干预(human intervention),且在该生成物符合受保护作品应满足的其他条件的情况下,才能获得版权保护。即,如果有人类参与,生成式人工智能进行生成的过程便能够被视为人类进行智力活动的过程,在理论上满足“智力成果”的条件。
在“春风图”案件中,针对案涉AI生成物是否属于智力成果这一问题,法院认为:“智力成果”是指智力活动的成果。因此,作品应当体现自然人的智力投入……本案中,原告创作过程进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入,故涉案图片具备了“智力成果”要件。即,简而言之,如果利用人工智能制作生成物的主体“进行了一定的智力投入”,便能够让该生成物满足“智力成果”的条件。
2.AIGC是否具有“独创性”?
独创性(Originality),主要包括“独”和“创”两部分。在我国司法实践中,“独”指“独立创作,源于本人”——即,劳动成果是劳动者从无到有独立地创造出来的,或是对已有作品进行再创作,而由此产生的保留了原作品基本表达的成果且与原作品之间存在着可以被客观识别的并非太过细微的差异;而“创”则意味着作品必须具备一定程度的创造性,体现作者的个性化表达。[4]
在判定AIGC是否具有“独创性”的问题上,笔者认为,核心的判断因素是体现作者的“个性化表达”,以使其具有“独创性”。综合智力成果与独创性的判断,我们认为判断AIGC能否构成作品的重要标准之一为“作者的智力投入与个性化表达”,判定过程中可以考量作者所参与的“增加提示词、修改参数”“调整修正”等行为进行判定。
例如在“春风图”案件中,针对AIGC是否满足“独创性”的问题,法院认为,利用人工智能生成图片,是否体现作者的个性化表达,需要个案判断,不能一概而论。在该案件中,利用Stable Diffusion 类模型生成图片时,其所提出的需求与他人越具有差异性,对画面元素、布局构图描述越明确具体,越能体现出人的个性化表达。原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。因此,利用该模型进行创作,不同的人可以自行输入新的提示词、设置新的参数,生成不同的内容。涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。综上,涉案图片具备独创性要素。
又如美国版权局在2023年2月给予漫画《Zarya of the Dawn》版权登记时,也采用了类似的逻辑。[5]2022年9月,数字艺术家Kris Kashtanova向美国版权局提交了该漫画书的版权登记申请并获得批准,然而在得知漫画中的图像是由Midjourney生成后,美国版权局于2023年2月撤销了原先的版权登记并重新给予新的版权登记范围,明确排除对AI生成的图画本身的版权登记。尽管Kashtanova通过声称其对漫画中的图画进行过PS加工处理来主张其对该部分拥有版权,版权局指出:AI生成内容被人工编辑、修改后,含有该类素材的新作品可以受版权保护,但前提是该新作品具有充分的独创性,而Kashtanova对图画的修改远未达到该标准。但由于漫画书中由Kashtanova人工创作的文本以及Kashtanova对文本和AI生成图画的选择、协调、编排体现了其创造性贡献,该部分内容将作为未出版的文学作品重新被予以版权登记。版权局明确指出,Kashtanova对文本和图画的选择、编排构成汇编作品,受版权法保护。
3.Sora发布之后,针对AIGC是否构成作品的判定思考
2024年2月15日,OpenAI公司公布文生视频大模型“Sora”,并在官网发布了“研究报告”,展示了目前Sora生成的实例。[6]在现阶段Sora的官网“研究报告”宣传视频中,OpenAI 展示了生成提示词与对应生成的视频,比如下面这个视频:
“一个穿着蓝色牛仔裤和白色T恤的女人愉快地在南非约翰斯伯格的冬日暴风雪/南非约翰斯伯格的美丽落日/印度孟买的美丽落日中漫步”
根据这个来自Sora官网的示例,即使只是基于简略的描述,生成视频的精细度与拟真度以及基于关键词进行联想补足的能力都相当之高。Sora甚至还能够自行根据场景加入不少未曾提到的细节——在所生成视频的背景中,人群、车流、树木等元素都是Sora通过提示词中的地点“印度孟买”自行生成的。
眼前的Sora生成物抛给了我们两个问题:首先,根据上述例子我们可以推测,视频载体本身比图片要复杂的特性以及Sora强大的联想能力,会使得生成物中脱离指令者想象与控制的部分被进一步扩大,“独创性”的认定难度也会进一步加大。
根据“春风图”案件审判逻辑,Stable Diffusion中提示词与参数各种要素的共同作用体现了原告的审美选择和个性判断,因此生成图片具有足够的独创性。而在这个例子中,生成提示词中已然加入了许多细节词汇(如人物性别、穿着、地点、天气等),但生成视频的细节则远远超出了一般使用者的期待。在目前智力投入和个性化表达认定还未有一个清晰标准的情形下,我们难以对其中的个性化表达是否足够来判断生成物是否具有独创性。诚然,Sora还没有正式对外开放使用,我们也无法具体得知指令者可以进行哪些方面的介入或是对视频的哪些方面进行调整,还需要通过更多的实际使用信息辅佐来进行探讨及论证。
其次,Sora的强大能力或许还会给未来的司法判决带来基于先前判例之上的新挑战——即这些新时代视频生成物的可版权性,或许需要一个比美术作品要高的门槛。我们提出如此想法的原因,源自于对AIGC与人类投入之间的不平衡的思考。许多学者曾针对人类指令者的行为和最终生成作品效果之间的因果关系对生成物的可版权性进行讨论,如Balganesh指出了三个认定因果关系的元素:(1)输入提示词的人类是否对AIGC生成的过程有足够的控制;(2)生成物的最终呈现是否与指令者的贡献成比例;以及(3)在输入指令后生成物是否能够体现作者的创意选择。[7]随着AI生成技术的进化,AI使用者用同样的投入所获得的生成结果会不成比例地被放大——从图片到视频,从低劣模仿到高度拟真,AI使用者仅需进行一些简单的操作,就可以在极短时间内生成大量可版权的作品,并因此稀释掉许多人类创作者的作品。投入与生成的差异越大,这种给行业带来的风险便越严峻。以上述Sora的生成实例为例,人群、具有印度特色的车流等特征的特定组合所形成的背景,仅是基于一句“印度孟买的美丽落日”而生成的,而且生成的是高拟真度、高帧率的视频,远远超出了一张文生图的规格与质量。仅凭一些简单的描述,就可以生成人类创作者需要花费时间精力与财力去进行取景拍摄或是虚拟建模才能得到的结果,这样的结果与指令者的付出显然不成比例。虽然根据Sora的实际使用状况,指令者或许可以通过调节参数和其他设置,对视频的最终生成有所贡献,但这对于生成视频质量的影响也略显得“杯水车薪”,这无疑给独创性的认定带来了全新的挑战。或许,这种“因果关系”的判断,今后也可能会被法院纳入考量范围之中。
二、AIGC著作权归属问题
AIGC著作权的权属应当归谁,也是自AIGC面世以来被广泛讨论的一个问题。不同的观点各自认为,AIGC应当归AI产品用户、AI公司、甚至是AI本身。在“春风图”案件中,法院在判定AIGC著作权归属问题提供了较为明确的指引,法院认为:
根据《著作权法》第十一条等相关规定,作者限于自然人、法人或非法人组织,这与民法典规定的民事主体一致,故人工智能模型本身无法成为我国著作权法上的作者。正因如此,虽然涉案图片是涉案人工智能模型所“画”,但是该模型无法成为涉案图片的作者。
而涉案人工智能模型设计者既没有创作涉案图片的意愿,也没有预先设定后续生成内容,其并未参与到涉案图片的生成过程中,在该案件中,AI公司其仅是创作工具的生产者。其通过设计算法和模型,并使用大量数据“训练”人工智能,使人工智能模型具备面对不同需求能自主生成内容的功能,在这个过程中必然是进行了智力投入,但是设计者的智力投入体现在人工智能模型的设计上,即体现在“创作工具”的生产上,而不是涉案图片上。故涉案人工智能模型设计者亦不是涉案图片的作者。此外,在该案件中,从相关主体的约定来看,根据在案证据,涉案人工智能模型的设计者,在其提供的许可证中表示,“不主张对输出内容的权利”,可以认定设计者亦对输出内容不主张相关权利。
从前述认定可以看出,首先认定了人工智能模型本身不属于“自然人、法人或非法人组织”,因此无法成为著作权法上的作者。因此,尽管近年来学界多次提出“虚拟法律人格”说(为人工智能生成物的知识产权保护确立一个虚拟意义上的法律人格,让其暂时充当这种知识产权的权利人,从而使这种知识产权能够得到有效保护)[8]和“代理人”制度(为人工智能的虚拟法律人格指定现实中的“代理人”,这些“代理人”可以是人类或法律实体,代表人工智能生成物行使其知识产权,并代表其主张权利、进行许可或合作等行为)来试图论证令人工智能本身成为著作权主体的可能性,法院不倾向认为相关生成物著作权应当由人工智能享有。
其次,在权属是属于AI公司还是AI产品用户问题上,法院认为AIGC往往由指令直接决定,对独创性的分析也聚焦于用户给出的指令本身。与之相比,AI公司更多的贡献在于训练AI以及改进优化模型算法,难以认定其参与了作品生成的主要工作。并且法院也重点关注了相关主体的约定,认为涉案人工智能模型的设计者,在其提供的许可证中表示,“不主张对输出内容的权利”,可以认定设计者亦对输出内容不主张相关权利。最终认定涉案AIGC的著作权归属于AI产品用户。
前述判定思路,也为Sora生成物等AIGC的著作权归属提供了指引。根据OpenAI公司在软件用户协议的知识产权条款的约定:在使用者遵守用户协议条款的前提下,OpenAI公司同意向使用者转让其对ChatGPT自动生成输出内容的所有权利、所有权和权益,同时使用ChatGPT服务时输入输出的整体内容亦由使用者负责。[9]即基于用户协议的约定,OpenAI公司也倾向于认为应由使用者对其使用ChatGPT生成内容享有所有权利并对产生的法律责任负责。如果OpenAI不对针对Sora之使用的用户协议条款进行较大的修改,同为OpenAI旗下产品的Sora生成物若具有可版权性,其权利归属也应当为相应的使用者。
三、AIGC著作权侵权问题
在被誉为“全球AIGC著作权侵权第一案”的“奥特曼案”中,法院认定被告在提供生成式人工智能服务过程中侵犯了原告对涉案作品(奥特曼形象作品)所享有的复制权和改编权,并应承担相关民事责任。
事实上,此类AIGC著作权侵权案件近期在各国频起,其中最具影响力的莫过于去年年末发生的美国纽约时报诉 OpenAI 及微软案。纽约时报认为 OpenAI 和微软通过收集和储存大量数据和文本对其 ChatGPT 产品进行训练,其中也包括《纽约时报》的相关新闻作品。根据纽约时报向纽约南区联邦地区法院所提交的证据,ChatGPT 的输出近乎逐字地复制了《纽约时报》作品的重大部分,其声称这无疑构成了未经授权对《纽约时报》作品的复制和衍生。对于纽约时报和 OpenAI 孰更有理以及其中的争议焦点,法律业界也有不同的看法。在纽约时报案的评论中,一些评论家提出我们应当考虑AI的工作原理——AI本身对元数据的接触,和用户输入文本指令后的生成,是两个完全不同的阶段,因此我们无法证明在用户输入文本时是否有构成对原作品的接触,也无法证明其接触的是否就恰好是原告主张权利的作品,因此应当同传统著作权法案件中“接触”的认定采取不同的分析思路。
这些相关的法律争议焦点,在“奥特曼案件”中法官的论述中也有所体现。例如,基于“接触+实质性相似”的著作权法侵权认定公式,广州互联网法院给予了“接触”要件一个更低的达成标准,认为案涉奥特曼作品享有较高的知名度,且可在爱奇艺等各大视频网站进行访问、查阅及下载,在无相反证据的情况下,被告存在接触案涉奥特曼作品的可能性。此外,关于该案件被告是通过第三方服务商提供生成式AI服务、被告实际上未进行模型训练行为的查明与认定来看,是被告存在接触作品的可能性,还是“大模型”开发运营主体有接触作品的可能性,谁会构成“接触”的主体,这些问题也有待进一步释明。随着AIGC著作权侵权案件的增加,或许在今后的司法实践中,法院在认定侵权时也会面临更多的思考和挑战。
Sora等新型AIGC虽然具有革新性的技术,但其侵权认定也会受到这个案件的直接影响。以Sora目前的研究报告显示为例,Sora生成视频的原理主要分为以下几步:(1)原始视频数据会通过视觉编码器被压缩成低维度的时间和空间潜在表示,并被分解为时空patch;(2)Sora会在压缩后的潜在空间中训练,并进行后续的生成;(3)在接受后续的文本提示指令后,高维度的清晰成果便得以生成。因此,尽管Sora的生成技术具有行业上的革新性,其也仍然遵循了从“AI接触元数据”到“接受文本提示后产出生成物”的两个基本阶段,仍可以参考“第一案”的裁判思路进行侵权认定。
除了侵权要件的认定之外,“奥特曼”案件中还有很多观点值得关注:例如法院以该案中被告未遵循《生成式人工智能服务管理暂行办法》和《互联网信息服务深度合成管理规定》中的合规义务(没有按照建立投诉举报机制,未对潜在风险进行提示,缺乏对生成内容的显著标识)为由,从而认定其构成著作权法意义上的“过错”。该认定,进一步彰显相关合规义务在知识产权侵权案件中的重要地位,相关从业者应当在经营过程中注意严格遵守相关合规义务,以避免相关的著作权侵权风险。
此外,在责任承担问题上,在“奥特曼”案件中法院强调,人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,被认为是发展新质生产力的主要阵地。我国人工智能技术快速发展、数据和算力资源日益丰富、应用场景不断拓展,为开展人工智能场景创新奠定了坚实基础。考虑到生成式人工智能产业正处于发展的初期,需要同时兼顾权利保障和产业发展,不宜过度加重服务提供者的义务。在技术的飞速发展过程中,服务提供者应当主动积极履行合理的、可负担的注意义务,从而为促进形成安全与发展相济、平衡与包容相成、创新与保护相容的中国式人工智能治理体系提供助益。侵权损害赔偿方面,法院在判决书中指出,“被告在应诉后,积极采取技术性措施,防范继续生成相关图片,且实现了一定的效果;被告仅面向用户生成案涉图片,影响范围有限。”最终酌定了10000元这一较低的赔偿额,该认定也会驱使我们对未来AIGC侵权救济中的利益平衡问题展开进一步思考。
结语
在人工智能技术迅猛发展和不断革新的当下,Sora的面世无疑对现有的著作权法律实践提出了新的思考和挑战。展望未来,在人工智能技术日益进步的时代背景下,相关领域的从业者必须在遵循《著作权法》等相关法律法规立法宗旨的基础上,充分考虑当代社会的特点,对现有的著作权保护机制进行灵活的阐释与适用,方能应对层出不穷的新挑战与新问题。相信未来通过立法和司法的不断完善,即使在人工智能技术迅猛发展的时代,相关法律也能够与时俱进,为所有相关方提供一个公平公正的法律框架,为人工智能技术健康有序发展提供有效的法律保障。
感谢实习生赵子涵对本文的贡献。
向上滑动阅览
[1] 参见北京互联网法院(2023)京0491民初11279号民事判决书
[2] 参见广州互联网法院作出(2024)粤0192民初113号民事判决书
[3] 参见王迁:《知识产权法教程(第七版)》,中国人民大学出版社,2021年版。
[4] 同前注2。
[5] Re: Zarya of the Dawn (Registration # VAu001480196)(https://copyright.gov/docs/zarya-of-the-dawn.pdf)
[6] 参见https://openai.com/research/video-generation-models-as-world-simulators
[7] 参见Shyamkrishna Balganesh, Causing Copyright, 117 COLUM. L. REV. 1, 71 (2017).
[8] 参见王雪乔:《人工智能生成物的知识产权保护立法研究》,载湖南科技大学学报(社会科学版)2020年3月。
[9] https://openai.com/policies/terms-of-use