生成式人工智能长期以来面临版权争议,一方面,此类人工智能的训练数据为文字、图片、视频等在传统上受版权保护的作品内容;另一方面,AIGC的文学艺术表现力愈发接近人类创作的水准。人工智能大模型的出现加剧了此类争议:在预训练阶段,大模型以无监督的方式广泛获取各类型的版权内容,高质量的内容还能在监督微调阶段激发模型能力,更强大的模型则能够在简单的指令下生成更为“逼真”的内容。不论是文本、图像甚至视频,大模型生成内容的能力都发展到了惊艳甚至让人惊讶的程度,也让历经技术变革的版权制度再次面临诸多挑战。
作为回应,北京互联网法院在2023年11月率先做出裁判,认定用户使用提示词通过扩散模型生成的图片受版权保护,也是我国首例由司法判定人工智能“文生图”受版权保护的案例。而在2024年2月8日,广州互联网法院率先回应AIGC版权侵权问题,实现了“全球首判”。
近期大洋彼岸纽约时报版权人等也以侵犯版权为由起诉OpenAI和微软,繁杂的证据、多样的诉求、巨额的赔偿要求引发了全球热议。相比之下,广互案案情比较简单。此案原告为奥特曼系列作品的版权独占授权人(版权人为日本圆谷制作株式会社),被告通过API接口调用大模型服务,用户通过输入提示词“生成奥特曼”即显示和奥特曼形象一致的图片,也可生成包含奥特曼局部特征或具有特殊风格(如插画风)的图片。
法院认定被告侵权,AIGC生成和奥特曼类似的图片构成违法“复制”,基于奥特曼元素的AIGC再创作构成违法“改编”。被告被判令要求停止生成侵权图片,即用户正常使用与奥特曼相关的提示词,不能生成与案涉奥特曼作品实质性相似的图片。因被告未实际进行模型训练,法院没有支持删除训练数据的诉求。在计算损害赔偿方面,判决认定被告存在过错,原因是被告未按照《生成式人工智能服务管理办法》要求建立投诉举报机制,未对潜在风险进行提示,缺乏对生成内容的显著标识,判令被告赔偿原告损失合计10000元。
判决虽然认定调用API接口生成实质性相似的图片侵犯了原作品版权人的复制权和改编权,但受限于被告并非模型训练者,而仅仅提供图片生成服务这一事实,判决留下了三个未解决的问题。
一、能否从合理使用角度回应AIGC技术带来的版权侵权挑战
法院从最终生成图片的结果“近似”推导出AIGC对原作品进行了“复制”,但扩散模型对原始图像的“还原”或“再现”与版权法长期以来禁止的直接“拷贝”式的复制差异明显。此外“改编”在传统版权法含义里指的是利用原作品进行的“再创作”,有先后的顺序之分,但在AIGC技术中并没有此类差别。对此法院并未回应AIGC技术带来的核心差异,以及此类技术是否构成合理使用(包括转换性使用)。目前大模型生成能力愈发强大,一方面在各类场景中用户期待模型能够生成更为逼真的图片,而另一方面AIGC侵犯版权的风险依然普遍存在,对于各方期待的通过合理使用制度进行平衡,本案并没讨论。
二、在生成内容侵犯版权的情况下是否应当删除训练数据
判决不支持删除训练数据的原因是被告为AIGC服务提供者而不是大模型开发者,不涉及模型训练。但是判决并没有直接否定删除训练数据的可能性,在判决中也强调提示词阻断不能完全消除侵权图片的生成。值得指出的是,采用此前数字内容平台版权保护常用的“侵权通知-删除”规则并不适用与大模型输出内容的管理。大模型训练数据规模庞大、来源多样,判断所有数据的版权合规性难度很大,而且大模型版本往往经过多次迭代,模型的使用基本脱离了原始训练数据,删除原始数据的手段并不能解决输出端的版权侵权问题。
三、AIGC服务提供者的版权注意义务为什么和人工智能合规责任相关
判决认定被告的“过错”时,援引的并非版权法的规定,而是认定被告没有按照《生成式人工智能服务管理暂行办法》建立投诉举报机制,未对潜在风险进行提示,缺乏对生成内容的显著标识,从而构成版权法意义上的“过错”。然而《暂行办法》核心在于要求提供者承担内容管理责任,保护用户的合法权益,其出发点并不是把提供者作为“平台”,要求其按照避风港规则处理版权人的保护请求。而从《深度合成服务管理规定》开始建立的人工智能生成内容水印和标识制度,也并未在本意上用于识别、追踪和保护版权作品。判决将版权注意义务和人工智能合规责任混同,其内在原因和适用边界还待进一步探讨。
总体来看,大模型研发投入大、迭代快、竞争强,在多模态发展的关键阶段亟需稳定、可预期的制度环境,扩大模型数据供给,降低模型数据合规压力。本判例适用范围有限,也未能解决各方关注的大模型版权侵权中的核心问题。如何平衡用户对AIGC更准更真的实际需求和版权保护的要求,应当采取哪些更为合理的手段控制侵权内容生成,以及怎么界分AIGC服务提供者版权责任和其他合规义务,还期待进一步的探讨和澄清。
责编:崇修(转载及媒体合作请评论区或邮箱留言)