“全球AIGC版权侵权首判”留下的三个问题

作者：阿里研究院发布时间：2024-02-27

生成式人工智能长期以来面临版权争议，一方面，此类人工智能的训练数据为文字、图片、视频等在传统上受版权保护的作品内容；另一方面，AIGC的文学艺术表现力愈发接近人类创作的水准。人工智能大模型的出现加剧了此类争议：在预训练阶段，大模型以无监督的方式广泛获取各类型的版权内容，高质量的内容还能在监督微调阶段激发模型能力，更强大的模型则能够在简单的指令下生成更为“逼真”的内容。不论是文本、图像甚至视频，大模型生成内容的能力都发展到了惊艳甚至让人惊讶的程度，也让历经技术变革的版权制度再次面临诸多挑战。

作为回应，北京互联网法院在2023年11月率先做出裁判，认定用户使用提示词通过扩散模型生成的图片受版权保护，也是我国首例由司法判定人工智能“文生图”受版权保护的案例。而在2024年2月8日，广州互联网法院率先回应AIGC版权侵权问题，实现了“全球首判”。

近期大洋彼岸纽约时报版权人等也以侵犯版权为由起诉OpenAI和微软，繁杂的证据、多样的诉求、巨额的赔偿要求引发了全球热议。相比之下，广互案案情比较简单。此案原告为奥特曼系列作品的版权独占授权人（版权人为日本圆谷制作株式会社），被告通过API接口调用大模型服务，用户通过输入提示词“生成奥特曼”即显示和奥特曼形象一致的图片，也可生成包含奥特曼局部特征或具有特殊风格（如插画风）的图片。

法院认定被告侵权，AIGC生成和奥特曼类似的图片构成违法“复制”，基于奥特曼元素的AIGC再创作构成违法“改编”。被告被判令要求停止生成侵权图片，即用户正常使用与奥特曼相关的提示词，不能生成与案涉奥特曼作品实质性相似的图片。因被告未实际进行模型训练，法院没有支持删除训练数据的诉求。在计算损害赔偿方面，判决认定被告存在过错，原因是被告未按照《生成式人工智能服务管理办法》要求建立投诉举报机制，未对潜在风险进行提示，缺乏对生成内容的显著标识，判令被告赔偿原告损失合计10000元。

判决虽然认定调用API接口生成实质性相似的图片侵犯了原作品版权人的复制权和改编权，但受限于被告并非模型训练者，而仅仅提供图片生成服务这一事实，判决留下了三个未解决的问题。

一、能否从合理使用角度回应AIGC技术带来的版权侵权挑战

法院从最终生成图片的结果“近似”推导出AIGC对原作品进行了“复制”，但扩散模型对原始图像的“还原”或“再现”与版权法长期以来禁止的直接“拷贝”式的复制差异明显。此外“改编”在传统版权法含义里指的是利用原作品进行的“再创作”，有先后的顺序之分，但在AIGC技术中并没有此类差别。对此法院并未回应AIGC技术带来的核心差异，以及此类技术是否构成合理使用（包括转换性使用）。目前大模型生成能力愈发强大，一方面在各类场景中用户期待模型能够生成更为逼真的图片，而另一方面AIGC侵犯版权的风险依然普遍存在，对于各方期待的通过合理使用制度进行平衡，本案并没讨论。

二、在生成内容侵犯版权的情况下是否应当删除训练数据

判决不支持删除训练数据的原因是被告为AIGC服务提供者而不是大模型开发者，不涉及模型训练。但是判决并没有直接否定删除训练数据的可能性，在判决中也强调提示词阻断不能完全消除侵权图片的生成。值得指出的是，采用此前数字内容平台版权保护常用的“侵权通知-删除”规则并不适用与大模型输出内容的管理。大模型训练数据规模庞大、来源多样，判断所有数据的版权合规性难度很大，而且大模型版本往往经过多次迭代，模型的使用基本脱离了原始训练数据，删除原始数据的手段并不能解决输出端的版权侵权问题。

三、AIGC服务提供者的版权注意义务为什么和人工智能合规责任相关

判决认定被告的“过错”时，援引的并非版权法的规定，而是认定被告没有按照《生成式人工智能服务管理暂行办法》建立投诉举报机制，未对潜在风险进行提示，缺乏对生成内容的显著标识，从而构成版权法意义上的“过错”。然而《暂行办法》核心在于要求提供者承担内容管理责任，保护用户的合法权益，其出发点并不是把提供者作为“平台”，要求其按照避风港规则处理版权人的保护请求。而从《深度合成服务管理规定》开始建立的人工智能生成内容水印和标识制度，也并未在本意上用于识别、追踪和保护版权作品。判决将版权注意义务和人工智能合规责任混同，其内在原因和适用边界还待进一步探讨。

总体来看，大模型研发投入大、迭代快、竞争强，在多模态发展的关键阶段亟需稳定、可预期的制度环境，扩大模型数据供给，降低模型数据合规压力。本判例适用范围有限，也未能解决各方关注的大模型版权侵权中的核心问题。如何平衡用户对AIGC更准更真的实际需求和版权保护的要求，应当采取哪些更为合理的手段控制侵权内容生成，以及怎么界分AIGC服务提供者版权责任和其他合规义务，还期待进一步的探讨和澄清。

责编：崇修（转载及媒体合作请评论区或邮箱留言）