AI绘画侵权实锤！扩散模型可能记住你的照片，现有隐私保护方法全部失效

作者：量子位发布时间：2023-02-04

AI绘画

衡宇发自凹非寺

量子位 | 公众号 QbitAI

AI绘画侵权，实锤了！

最新研究表明，扩散模型会 牢牢记住训练集中的样本，并在生成时“依葫芦画瓢”。

也就是说，像Stable Diffusion生成的AI画作里，每一笔背后都 可能隐藏着一次侵权事件。

不仅如此，经过研究对比，扩散模型从训练样本中“抄袭”的能力是GAN的2倍，且生成效果越好的扩散模型，记住训练样本的能力越强。

这项研究来自Google、DeepMind和UC伯克利组成的团队。

论文中还有另一个糟糕的消息，那就是针对这个现象， 现有的隐私保护方法全部失效。

消息一出，网友炸开了锅，论文作者的相关推特转发眼看就要破千。

有人感慨：原来说它们窃取他人版权成果是有道理的！

支持诉讼！告他们！

有人站在扩散模型一侧说话：

也有网友将论文结果延伸到当下最火的ChatGPT上：

现有隐私保护方法全部失效

扩散模型的原理是去噪再还原，所以研究者要研究事情其实就是：

它们到底 有没有记住用来训练的图像，最后在生成时进行“抄袭”？

训练集里的图像往往从互联网大海中捞取，有版权的、有商标的，有的还有隐私性，比如私人的医疗X光片什么的。

为了弄清楚扩散模型到底能不能 记忆和再生个体训练样本，研究人员首先提出了“记忆”的新定义。

一般来说，关于记忆的定义集中在文本语言模型上，如果可以提示模型从训练集中恢复一个逐字序列，就表示这个序列被提取和记忆了。

与之不同，研究团队 基于图像相似度来定义“记忆”。

不过团队也坦白讲，对于“记忆”的定义是偏向保守的。

举个例子，左图是用Stable Diffusion生成的一张“奥巴马的照片”，这张照片和右图任何一张特定训练图像都不神似，因此这个图像不能算作根据记忆生成。

接着，他们提取了包含个人照片、公司招标在内的1000多个训练样本，然后设计了一个 两阶段的数据提取攻击（data extraction attack）。

具体操作是使用标准方法生成图像，然后标记那些超过人工推理评分标准的图像。

在Stable Diffusion和Imagen上应用这种方法，团队提取了超过100个近似或相同的训练图像副本。

而后，为了更好地理解“记忆”是怎么发生的，研究人员从模型中采样100万次，在CIFAR-10上训练了几百个扩散模型。

目的是分析模型准确性、超参数、增强和重复数据删除中，哪些行为会对隐私性产生影响。

最终得出了如下结论：

首先，扩散模型比GAN记忆更多。

但扩散模型也是评估的图像模型中 隐私性最差的一群，它们泄漏的训练数据是GANs的两倍多。

而且， 更大的模型可能会记住更多的数据。

随着这个结论，研究人员还研究了20亿参数的文本-图像扩散模型Imagen，他们尝试提取出500张分布外得分最高的图像，让它们作为训练数据集中的样本，发现都被记忆了。

因此，在复制和非复制图像上，Imagen比Stable Difusion隐私性更差，研究人员把原因归结于Imagen使用的模型比Stable Difusion容量大，因此记得的图像越多。

此外， 更好的生成模型（FID值更低）存储的数据更多。

换句话来讲，随着时间的推移，同一个模型泄露的隐私更多，侵犯的版权也更多。

（按FID排序的GAN模型，FID值越低，效果越好）

通过训练模型，团队发现 增加效用会降低隐私性，简单的防御措施（如重复数据删除）不足以完全解决记忆攻击。

因此，隐私增强技术并不能提供一个可接受的隐私-效用权衡。

最终，团队对训练扩散模型的人提出了四个建议：

建议将训练数据集的重复数据删除，并尽量减少过度训练；
建议使用数据提取攻击或其他审计技术来评估训练模型的隐私风险；
如果有更实用的隐私保护技术，建议尽可能使用；
希望AI生成的图片不会免费对用户提供涉及隐私的部分。

版权方未曾停止维权

研究一出，可能对正在进行的诉讼产生影响。

刚过去的1月底，图库老大哥盖蒂图片社（Getty Images）以侵犯版权的名义，在伦敦高等法院起诉了Stability AI。

△Stability AI

盖蒂图片社认为，Stability AI“非法复制和处理了数百万受版权保护的图像”，以此训练名下的Stable Difussion。

Stable Difussion的部分训练数据是开源的。经过分析和查验水印发现，包括盖蒂在内的许多图片社都不知不觉间为Stable Difussion的训练集提供了大量素材，占比不小。

但从始至终，Stability AI都 没有与图片社对接过。

许多AI公司都认为这种做法受到美国合理使用原则等法律的保护，但大部分版权所用者都不同意这种说法，认为这种行为侵犯了自己的权益。

1月中旬的时候，三位艺术家已经对Stability AI以及Midjourney提起诉讼。

法律专家也各执一词，为达成统一意见，但他们纷纷同意法院需要针对版权保护问题做出裁决。

盖蒂图片社的CEO Craig Peters表示，公司已经向Stability AI发了通知，表示“你就快在英国吃官司啦”！

公司还放话：

我们对侵权行为带来的损失并不计较，也无意让AI艺术工具停止开发。

把Stability AI告上法庭并不是为了我们盖蒂一家的利益。

选择起诉有更深层次的长期目的，希望法院 设定新的法律来规范现状。

— 完—

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入交流群，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

小米SU7订车半年未交车！车主在线投诉，怎么解？

近日，来自江苏的何女士通过网络平台投诉，称其6月30日下定的小米SU7，至今未交车。和她差不多时间下单的朋友已经提车了，这让她对小米汽车交付订单的标准产生了质疑。事情经过根据何女士的描述，她在今年6月30日交了定金，7月2日进行了锁单。在三周前，交付时间显示5-8周，销售顾问表示不会再更新进度。三周后，交付时间又更新成了3-6周。销售顾问表示车辆还在生产中。何女士每次在交付群中询问交付进度，要么是几小时才回复，要么几天才回复，甚至不回复，直到打了400电话投诉才回复。当初销售顾问说最快月初就能交车，结果现

律驰驾道 2024-12-25

坦克300穿越者2024款说明书｜TANK 300 Crosser 2024

坦克300穿越者说明书为PDF电子版本，坦克300穿越者车主手册帮助车主快速掌握车辆的各种实用功能，免费下载方便携带，坦克300穿越者用户手册是车主必备的电子使用手册。点击进入：https://www.carobook.com/tank-sms/tank-300-crosser-2024-owners-manual.html [图片] 坦克300穿越者延续了较为硬朗的外观设计风格，整体造型力量感十足。前脸部分，熏黑进气格栅中带有对比色饰条进行点缀，搭配两侧标志性的圆形LED前灯组极具辨识度。另外，该车引

CarOBook车主随身手册 2024-12-25

2025上海国际低空经济博览会

[图片] 2025首届国际低空经济博览会，是经上海市政府批准，由国家会展中心（上海）有限责任公司、东浩兰生（集团）有限公司和上海市国际展览（集团）有限公司联合主办，围绕低空经济这一战略性新兴产业的国际化博览会。以“启航低空经济，赋能千行百业”为主题，重点展示低空基础设施、制造与配套服务等产业链，低空交通运输、城乡管理、商业融合应用、个人消费等应用链。低空博览会通过主题展览、专业论坛、对接活动和演示体验等内容和形式，关注低空企业发展需求和应用场景落地方案，为低空经济管理、研究、生产、服务与应用等展商和观

簡單點Dr 2024-12-25

保障物流信息共享安全，团体标准担当重任

在当今全球化和数字化的经济背景下，物流行业作为连接生产与消费的桥梁，其运作效率与安全性直接关系到整个供应链的稳定性。随着信息技术的飞速发展，物流信息共享已成为提升物流效率、降低成本、优化资源配置的关键手段。然而，信息共享的同时，也带来了数据安全与隐私保护的严峻挑战。如何在确保物流信息高效流通的同时，保障信息安全，成为物流行业亟待解决的重要课题。在此背景下，团体标准作为行业自律与规范的重要载体，承担起保障物流信息共享安全的重任。一、物流信息共享的重要性与挑战物流信息共享是指通过信息技术手段，将物流过程中的各

中一信团体标准 2024-12-25

售6.99万元起，奇瑞瑞虎5x 高能版上市

12月23日，奇瑞瑞虎5x 高能版正式上市，共推出3款车型，售价区间为6.99-8.39万元。新车定位为一款小型SUV，引入Lion 5.0 AI座舱，配备20.5英寸星云环绕屏。 [图片] 瑞虎5x高能版采用了全新的设计语言，整体风格更加年轻时尚。前脸部分，大尺寸的进气格栅与点阵式镀铬装饰相结合，与两侧日间行车灯融为一体，营造出强烈的视觉冲击力。车身侧面造型颇具轿跑SUV的风格，呈现前低后高的姿态，搭配五辐式运动轮毂，运动感十足。车尾部分则采用了贯穿式的尾灯设计，搭配“CHERY”标识，提升了辨识度。车

聚察汽车 2024-12-25

中标联合 2024-12-25

全新宝马2系四门版将于2025年1月初上市

全新宝马2系四门版将于2025年1月初上市。宝马2系四门版定位紧凑型轿车，国产版的轴距进行了加长。 [图片] 全新宝马2系四门版前脸配备改进的肾脏形格栅，首次提供带LED灯光的选项，使整车更具辨识度。车尾则在霍夫梅斯特弯曲处增加了微妙的“2”标志，彰显了其独特的身份。车身线条流畅，车顶线条简洁且一气呵成，打造出紧凑而精干的车身轮廓，动感十足。车身尺寸方面，新车长宽高分别为4663/1801/1457mm，轴距2780mm。 [图片] 在内饰方面，全新宝马2系四门版采用了最新家族化座舱布局，提供双联屏、点阵

车大斌 2024-12-25

AI绘画侵权实锤！扩散模型可能记住你的照片，现有隐私保护方法全部失效

推荐体验

相关资讯

AI绘画侵权实锤！扩散模型能记住你的照片，现有隐私保护全部失效

AI绘画可能会记住你的照片，“人脸识别”面临新的隐私安全挑战

苹果试图保护你的隐私，OpenAI可能做不到

又有AI产品被质疑侵权，AI绘画与隐私保护如何平衡？

B站上传用户真人照片道歉，隐私保护真的很重要！

近期资讯

小米SU7订车半年未交车！车主在线投诉，怎么解？

坦克300穿越者2024款说明书｜TANK 300 Crosser 2024

2025上海国际低空经济博览会

保障物流信息共享安全，团体标准担当重任

售6.99万元起，奇瑞瑞虎5x 高能版上市

奔腾B70黑骑士上市，售价12.09-12.38万元

TDK电容代理中国代理商

TDK陶瓷电容授权代理商

城市轨道交通团体标准对数字化转型的深远意义

全新宝马2系四门版将于2025年1月初上市

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响