#本文仅代表作者观点,不代表IPRdaily立场,未经作者许可,禁止转载#
“本文以一案例的被告为研究视角,以其身份定位为始、民事责任为尾对整个审判思路进行初步剖析。”
来源:IPRdaily中文网(iprdaily.cn)
作者:杨思雪 北京金山云网络技术有限公司
杨淼 北京金山云网络技术有限公司
全球首例生成式AI服务提供者侵犯著作权案(2024年粤0192民初113号)生效已两月有余,学界对此问题的探讨一直在持续。在AIGC技术革新的背景下,传统著作权观念受到前所未有的挑战,著作权所有者与AIGC之间的治理争议日益加剧,该案为判断AIGC服务提供者是否构成著作权侵权提供了重要的司法指引。尽管如此,随着技术的不断革新,AIGC服务的应用形态和场景将变得更加多元和复杂。在保护著作权所有者的权益与促进技术创新之间寻找平衡,将是一个长期且复杂的议题。
本文以该案的被告为研究视角,以其身份定位为始、民事责任为尾对整个审判思路进行初步剖析,斗胆尝试总结AIGC服务提供者在法律层面上的困境,以期为司法界及产业提供参考,如有不当之处,请谅解。
一、身份定位不清——非模型训练方的AIGC服务提供者
本案中,法院以被告通过可编程接口的方式接入第三方服务商的系统,进而向用户提供生成式人工智能服务,符合《生成式人工智能服务管理暂行办法》(以下简称“《办法》”)第二十二条第二款:“(二)生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人”的描述,进而将本案被告的身份界定为“生成式人工智能服务提供者”。但从本案侵权行为所涉及的整个AIGC工作流程来看,“生成式人工智能服务提供者”实际上是一个较为模糊的界定。
AIGC生成具体内容的整个过程涉及多方主体,按照技术结构大概可以分为模型训练方(如OpenAI)、面向B端的模型二次开发方(ChatGPT开放B端接口,为相关公司在其业务经营中使用AIGC提供技术支持,ChatGPT即为模型二次开发方)、面向C端的应用方(如Stable Diffusion等提供的文生图服务)、用户。其中,一定程度上,模型的二次开发方和应用方均为AIGC服务提供者。本案的被告“并没有使用案涉奥特曼形象进行训练”“关于原告将案涉奥特曼物料从其训练集中删除的诉请,因被告未实际进行模型训练行为,本院对该项诉请不予支持”并且“被告经营的Tab网站可生成与案涉奥特曼形象相同或相似的图片”,故而可以得出:本案的被告系面向C端的应用方,其以接口调用的方式将模型训练方/模型二次开发方所提供的AIGC技术切实融入用户需求,实现具有AI对话及AI生成绘画功能的Tab网站落地,其自身并未参与预训练环节,更像是AIGC技术与用户之间的“中间商”,更为合适的身份界定应当为“非模型训练方的AIGC服务提供者”。
法院基于《办法》将被告认定为生成式人工智能服务提供者符合立法之规定,《办法》特意以括号的形式强调了以“可编程接口等方式提供生成式人工智能服务”属于生成式人工智能服务者。但笔者认为,从技术角度来讲,进行模型训练与否在效果上存在明显差异,主客观状态也并不等同,在进行法律评价时更不应一概而论,法律的评价应当以违法行为为评价的基础,而非囿于立法之模糊定位。当然,以上所述的流程中,被告或许真的参与了模型训练,笔者不得而知,本文仅基于判决书所提供的内容和逻辑展开分析。
二、侵权行为判定之谜——从判定标准到重复评价
1、无抗辩之力的判定标准——接触+实质性相似
本案中,法院以“接触+实质性相似”规则为判定标准,以传统的著作权侵权判定思路和标准来讲,本案被告方存在接触的可能性,案涉图片也确实构成实质性相似,认定侵权并无不妥。但,法院在判决书中指出“关于原告将案涉奥特曼物料从其训练数据集中删除的诉请,因被告并未实际进行模型训练行为,本院对该项诉请不予支持。”也就是说,法院认为的被告侵权的具体流程应该为:被告接触了案涉奥特曼形象——但没有用奥特曼形象训练既得模型——用户使用——产生了最终的侵权作品。
“接触+实质性相似”规则属于法院判断侵权的、约定俗成的司法规则,该规则的具体内容是指,如果在后创作的作品与在先作品构成实质性相似,且在后创作作品的作者具有接触在先作品的可能性,则推定排除在后作品为其作者独立创作而成,在后作品作者的行为构成剽窃行为。接触可能性在当前的技术背景下,原告方只需要如本案原告一般举证证明其在先发表、网络发布、知名度等,即可推定被告方存在接触可能性。相较于原告举证的轻易性,被告想要举证以推翻“接触”认定的可能性则约等于零,而在本案AIGC的技术背景下,被告的举证责任变得更加艰巨。AIGC的输出取决于它的输入,如果明确被告没有将涉案图片用于训练模型的输入,即可说明最终输出的侵权结果与被告的接触与否并无因果关系。但因为接触可能性的存在,哪怕被告举证证明自己并未实际使用案涉奥特曼形象训练模型,被告依然会被认定符合判定侵权的标准,也即,原告的先发表行为等于将被告钉在了“侵权柱”上,被告基本不可能抗辩成功。
笔者认为,AIGC背景下,“接触+实质性相似”的判定标准应当随技术发展有所调适,在著作权侵权案件中可责难一定是行为而非“机会”。首先,从调适可能性来讲,该判定标准并非采法定主义由立法直接规定,而是缘起于我国对美国相关判例规则[1]的借鉴,随着我国技术与侵权手段等实际情况的变化,司法规则有适应性调整的可行性和需求性。其次,从调试的必要性来看,AIGC背景下的“接触+实质性相似”规则适用可能是割裂的,从本案逻辑来看,“接触”并决定输入的另有其人,只是被告所经营的输出端产生了“实质性相似”的侵权作品罢了,侵权主体与侵权结果之间的因果关系是侵权事实认定必不可少的一环,如果再生硬地照搬该判定规则对被告进行判定,仿佛不具有说服力,约等于是架空了“接触”这个构成要件的目的和意义。
2、不甚明晰的认定结果——同一行为和重复评价
本案中,法院认定被告侵犯了原告的复制权和改编权,对于原告所主张的信息网络传播权,法院的态度是:“考虑到本案是生成式人工智能发展背景下生成物侵权的新情况,且本院已支持了其复制权、改编权侵权的主张,在同一被诉侵权行为已经纳入复制权、改编权控制范畴的情况下,本院不再进行重复评价”,对其持重复评价和回避评价的态度,在特殊的技术背景下,法院采用审慎的态度也并无不妥。但以AIGC发展势头之猛,对生成式人工智能生成的侵权事实进行评价已是箭在弦上,类案终究需要予以解决,理清该问题具有一定的必要性。
首先,针对复制权和改编权的“同一行为”到底是什么呢?如上所述,本案被告所涉及到的行为仅是内容输出行为,将带有版权内容的结果提供给了用户,被告并不参与模型训练。那在内容输出这一行为中,到底可能侵犯哪些权利呢?法院认定被告侵犯原告复制权和改编权,在本案文生土图的内容输出过程中,用户输入Prompt引导已训练好的模型产生期望的输出结果,案述侵权结果才能够跃然于画布之上。这一过程中,被告做了什么呢?将所获得的模型提供给用户、呈现最终结果,但这两个流程好像都和复制沾不上边。数字环境下的复制行为是指能够使得作品以数字化的形式高质量地被固定在新型物质载体之上,在本案中在被告没有实际接触案述奥特曼形象的情况下,因模型训练方的训练是自然语言向词向量即数字的转换,牵强来讲只能认为被告复制了模型训练方训练好的参数,但对非原图的复制好像也不能称之为复制。但如果认为该参数保留了原作品基本的表达,加上用户的Prompt,又生成了保留原作品基本表达的作品,被认为是著作权法上的改编行为好像也无可厚非。
其次,针对“重复评价”来讲,究竟重复在哪里呢?笔者很疑惑,以上两项权利与信息网络传播权并不重合。复制权和信息网络传播权,前者控制的是单纯的复制行为,而后者控制的是由上传等导致的作品处于可为公众在其选定的时间和地点获得的状态[2],这与改编权的改变以形成新作品也并不相同。信息网络传播行为交互式网络传播行为,能够使用户“按需”获得作品,但在AIGC的背景下,模型输出结果的不可控性,我们无法得知用户能够在何时能够获取到作品,或许经过用户多次调试后,真的能够得到作品,但也无法保障是在用户“选定的时间”获得作品,从技术层面看,似乎本案又并不构成对信息网络传播权的侵犯,故而谈不上重复评价的问题。
三、AIGC服务提供者损害后果之补救——民事责任部分
1、停止侵害真的能停?
法院认为,被告未实际进行模型训练,所以不支持原告将奥特曼物料从其训练数据集中删除的诉请,而是要求被告进一步采取关键词过滤等措施,防范再生成与案涉奥特曼作品实质性相似的图片。原告之所以要求删除数据集,也是知晓AIGC的输出由其输入决定,诉其内容输出侵权只是手段,想要禁止AI对其作品内容进行训练才是原告的维权目的。
但已训练好的模型,不仅完全删除存在困难,哪怕是删除数据集也很难避免模型再生成侵权作品。AI大模型本质上是通过不断地调整模型参数来尽可能缩小模型预测结果和实际目标之间的差距,通过大量数据对大模型进行训练,其复杂性和非线性特征使得在完成训练的模型中定位和删除特定数据的难度明显增大[3],即便是大模型的创造者——模型所有者、开发者与服务提供者都无法确切得知需要删除的数据在哪里[4],待删除数据处于信息不可知的状态,想要删除数据存在困难。其次,大模型具有推理能力已然被证实,也是当前AI技术应用的焦点之一,其推理能力可能会使得已删除的数据又被重新推理还原,删除原始数据并不能解决输出端的版权侵权问题。当前已知的确保能够根本上解决删除问题的手段唯有重新训练模型,但其成本高昂,也很难保证模型不会根据其他数据推理出奥特曼形象。
好在技术的发展从不会让人悲观,机器遗忘(Machine Unlearning,MU)技术应运而生,旨在从预训练模型中移除不良数据的影响及其相关模型能力,同时保持对其他信息的完整知识生成,而不影响因果无关的信息。[5]如果该技术真的能够达到预期效果,原告及之后著作权人的诉请都由“删除”变“遗忘”,讨论合理使用制度好像也没有必要操之过急,不如让“技术的子弹再飞一会儿”。
2、赔偿损失真有过错?
知识产权侵权行为在理论上被分为直接侵权和间接侵权,直接侵权行为不以主观过错为构成要件,但系承担赔偿责任的前提,主观过错乃间接侵权行为的构成要件之一。[6]依照本案法院的观点,被告的行为属于直接侵权行为,在对赔偿责任的论述中,法院以《办法》第四条之生成式人工智能服务提供者应当“尊重知识产权”而判定被告应当具有合理的注意义务,并以投诉机制、潜在风险提示机制、显著标识等欠缺论证了被告未尽到合理的注意义务,具有主观过错,需要承担赔偿责任。
笔者认为,《办法》属于部门规章,属于公法,在法律责任部分,《办法》第十八条规定:“使用者发现生成式人工智能服务不符合法律、行政法规和本办法规定的,有权向有关主管部门投诉、举报”而非向人民法院起诉,在最终的法条依据部分,并未提及《办法》,足可见法院并不能直接适用《办法》来认定被告赔偿责任的承担。而法院所提到的被告未尽到合理注意义务的情形,由《办法》所述可由有关主管部门予以处罚,在无特别规定的情况下,再将其于私法中予以评价则属于对同一违法行为的重复评价,因此,不能以《办法》之规定认定被告未尽到合理注意义务而存在过错。
总的来讲,笔者认为,AIGC的输出不可控,其运作过程更是涉及多方主体,因果关系多元化,最终侵权结果的产生并非如本案被告的服务提供商一方导致,故而在对AIGC侵权案件进行归责时,应当以AIGC的运作流程及各方具体的侵权行为为基础进行评价。现行著作权评价思维虽可在短期内对AIGC著作权案件进行归责,但仔细推敲归责逻辑,仍有不尽完美之处。法院判决书中强调“考虑到生成式人工智能产业正处于发展的初期,需要同时兼顾权利保障和产业发展,不宜过度加重服务提供者的义务”,但不甚清晰的法律定位、异常艰巨的举证责任不禁让笔者产生疑问,只是调用模型的平台服务提供者的义务真的没有被加重吗?新的技术背景下,要求如本案被告一般的平台服务提供者对用户使用第三方训练的模型生成的内容进行全面审查并承担侵权责任何尝不是一种苛责?综上,笔者认为,免除抑或是减轻“善意”平台服务提供者的责任是协调AIGC产业发展和知识产权权益保护关系的有效路径,具体内容上或可以借鉴“避风港原则”来缓解AIGC平台服务提供者畸重的法律责任,以尽快建立新的技术背景下的平台责任规则,促成AIGC背景下的著作权法思维完善体系,助力AI技术的良性成长与行业的长期发展。
注释:
[1]美国法院在1869年的Laurence v. Dana案(15F. Cas. 26, 1869S)中提出。
[2]王迁. 复制权与信息网络传播权的关系[J]. 湖南师范大学社会科学学报,2022,51(02):1-9.
[3]LIANG W, TADESSE G A, HO D, et al. Advances, challenges and opportunities in creating data for trustworthy AI[J]. Nature Machine Intelligence, 2022, 4(8): 669-677.
[4]丁晓东.人机交互决策下的智慧司法[J].法律科学(西北政法大学学报),2023,41(4):58-68.
[5]https://mp.weixin.qq.com/s/XGK5jHKD-Iqk_6Z5KxDMoA
[6]王迁,知识产权法教程[M],第七版,北京中国人民大学出版社,2021:14-22.
(原标题:浅议AIGC服务提供者的法律困境——以“奥特曼案”的被告为视角)
来源:IPRdaily中文网(iprdaily.cn)
作者:杨思雪 北京金山云网络技术有限公司
杨淼 北京金山云网络技术有限公司
编辑:IPRdaily辛夷 校对:IPRdaily纵横君