ChatGPT新漏洞：失控背出个人隐私泄露训练数据，OpenAI修复后依然有效

作者：量子位发布时间：2023-11-30

ChatGPT OpenAI

ChatGPT最新漏洞曝光，一句话就能让训练数据原封不动地泄露。

只需要让它重复一个词，它就会在一定次数后“发疯”，甚至毫无防备说出某人的个人隐私信息。

DeepMind的研究人员联合华盛顿大学、康奈尔大学等高校，发现了ChatGPT的数据泄露漏洞。

利用他们的方法，只要预算充足，可以提取出大约1GB的训练数据。

更可怕的是，训练时间越长——也就是越强大的模型，泄露出来的数据反而越多。

研究团队已在论文发表之前90天把这一情况报告给了OpenAI，后者也做出了一定修复。

但到现在还是有网友发现，把论文里的词改一改，bug就会卷土重来。

那么，这个漏洞究竟是怎么一回事呢？

数据泄露防不胜防

作者攻击ChatGPT（API访问，3.5-turbo版本）的方式，叫做分歧攻击。

他们发现，当ChatGPT被要求重复一个单词多次时，模型会在某些情况下偏离正常的聊天式生成，开始输出与训练数据更接近的文本。

这些内容五花八门，除了个人信息，还包括文学作品、学术论文、链接、代码……甚至是工作场所不宜内容。

为了验证这些内容是否来自于训练数据，作者用了多个公开模型的训练数据组成了AuxDataset数据集（由于ChatGPT数据集未公开，只能通过其他模型的数据来估计）。

结果发现有上万条内容命中了AuxDataset，这些内容长度不等，最长的有4000多token。

作者还发现，这种攻击方法对单词提示更有效，而对多词提示则效果较差，特别是当被要求重复的词是company时，能获得到的信息是最多的。

作者使用Good-Turing估计器估计了ChatGPT中可提取记忆的总量，结论是至少有150万个独特的50-gram序列（相邻的50个token）是可提取的。

不过由于预算有限，作者表示这个估计可能低估了可提取数据的规模。

不仅是API，在正式的网页版ChatGPT中测试，也有概率得到同样的结果，说明模型之外的“系统护栏”也没能防住这波攻击。

我们简单实测了一下，发现这个漏洞到目前仍然没有被完全修复。

当重复词为“text”时，ChatGPT没有输出其他内容，但给对话起了一个奇怪的标题。

而当重复词为“company”时，ChatGPT经过三次regenerate后输出了一段疑似是ins文案的内容。

不过作者表示，这种攻击方法目前只对3.5版本奏效，GPT-4由于专门做过防泄露方面的对齐，逃过了一劫。

这种对齐在3.5版本中也有设置，但3.5的防御措施可以通过论文中展示的提示词攻击方法来绕过。

除了ChatGPT，作者也对Llama、Falcon、Mistral等开源或半开源模型进行了测试，结果发现同样存在数据泄露现象。

而越强大的模型，泄露出的数据也越多，ChatGPT泄露的数据量明显超过了其他模型。

泄露现象出现的范围也不局限在语言模型，该团队之前还从Stable Diffusion中提取了训练数据集中的约100张人物照片和其他类型的图像。

他们发现，当用训练数据集中人物的姓名做Prompt时，Stable Diffusion就会“偷懒”，直接把照片当做输出结果。

网友：还有其他攻击方法

这篇论文中提到的方式并不是孤例，还有其他攻击方法也能达到类似的结果，比如用没什么实际意义的123ABC加上简单的代码就让ChatGPT生成了一段关于臭氧层的文本。

发现者解释到，这是ChatGPT的输入清理机制的漏洞导致的，它清除了套娃式的两个<|endoftext>标签中处于内部的一个，但外部的“壳”则由于初始形态被拆开而被忽略。

作者和网友们的这些新发现，意味着ChatGPT违反了欧盟通用数据保护条例（GDPR）的规定，OpenAI可能会因此遇到麻烦。

GDPR第17条规定，数据主体（用户）有权要求控制者（模型开发者）立即删除与其有关的个人数据，也就是拥有“遗忘权”。

不过，一般个人对此也不必那么担心，因为这种攻击方式成本不低。

在这个实验中，研究者提取几MB数据，就已经花费了200美元。

那么，对于ChatGPT泄露数据这件事，你有什么看法？

论文地址：https://arxiv.org/abs/2311.17035

参考链接：

[1]https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html

[2]https://stackdiary.com/chatgpts-training-data-can-be-exposed-via-a-divergence-attack/

本文来自微信公众号“量子位”（ID:QbitAI），作者：克雷西，36氪经授权发布。

近期资讯

种下科学的种子让梦想发光

孩提时代，未来要做什么？真正让我对科研种下梦想种子的，是参加了一次课外体验活动——参观华南理工大学人工智能实验室，是那位给我们做实验演示的讲解老师。她不仅知识渊博，对科学充满热爱，更有着一种令人钦佩的执着和坚定。

南方都市报 2024-12-31

从“科学技术”到“技术科学”

日前召开的2024中国高校科技成果交易会上，省委主要领导分享了3个小故事。这从侧面反映出江苏在承接科技成果转化方面的优势和条件。以中试熟化为例，有研究表明，未经过中试的科研成果，其产业化成功率仅为30%，而中试后产业化成功率可达80%。举一反三，“重科学轻转化”的科研文化是否能得到扭转？

新华日报 2024-12-31

成都奋力建设全国先进制造业基地

12月25日，工业和信息化部，中国电子信息产业发展研究院旗下的赛迪顾问发布《2024年先进制造业城市研究》，其中成都市上榜“2024先进制造业百强市”，排名第8位，比去年上升一位。

封面新闻 2024-12-31

中建三局数字工程公司创新提供智能建造解决方案走出数智化发展新路径

近年来，中建三局数字工程公司坚持以科技创新为引领，聚焦企业数字化、建造智能化、城市智慧化领域，从传统建筑施工企业转变为建筑业数字化设计、研发、施工企业，获评国家高新技术企业。

中国经济网 2024-12-31

深远海多功能科学考察及文物考古船“探索三号”在三亚入列

12月29日，我国首艘设计拥有完全自主知识产权的深远海多功能科学考察及文物考古船“探索三号”抵达三亚崖州湾科技城的南山港公共科考码头并正式入列。“探索三号”由海南省人民政府及三亚市出资，“十四五”科技部重点研发计划及中国科学院战略性先导科技专项研发经费支持。

环球网 2024-12-31

iPhone 17/17 Air即将量产，真的是横置条形摄像头

据爆料，iPhone17和iPhone17Air的后摄模组都是采用“条形跑道”设计，与谷歌Pixel9系列相机DECO类似，而且iPhone17和iPhone17Air下个月就进入量产环节，届时供应链会有更多外观细节释出。值得注意的是，这种设计将成为明年的新趋势，明年有不少安卓新机改成了这种设计。

中关村在线 2024-12-31

早报：雷军今晚将举行跨年直播 iPhone 17 Slim曝光

【CNMO科技早报】今天是2024年的最后一天，今晚不少卫视都会推出跨年晚会，而除了晚会外，一些名人也开始退出跨年直播来吸引观众，而这之中也包括了雷军。12月30日晚，雷军在个人微博透露，将会在今天晚上举办一场围炉跨年直播，与广大网友们一起跨年。目前，关于iPhone17Slim仍有许多未知因素，我们可能需要更多时间才能揭开其全部面纱。

手机中国 2024-12-31

听到孩子愤怒的抗议和怼我时，欣慰有边界感的孩子，最值得肯定

昨天晚上，因为手机真是心情糟糕到极点了。现用的手机自动重启了几十次，听着开机和关机的声音，真让我崩溃啊。正在这时听到顺丰给我打电话，说手机到了，心想真是救火正当时。迫不及待的拆快递和换手机卡，心想这下真是雪中送炭啊。可是刚装上手机就看到不识别卡，想着是不是没装好卡呀，退出重装一下，结果卡再也弹不出来了。

爱读书的百合 2024-12-31

2023年全国旅游及相关产业增加值占比4.24%

深圳商报 2024-12-31

技经观察丨上九天揽月，竞逐月球新战略高地

2024年，全球主要航天国家月球探索领域呈现蓬勃发展态势，月球探索深度与广度进一步拓展，逐步延伸推进原位资源利用、载人月球探测、驻月基地建设等战略高点发展。美国积极推进重返月球战略部署，加强地月空间力量建设，为夺取太空战略新高地摩厉以需。

全球技术地图 2024-12-31

ChatGPT新漏洞：失控背出个人隐私泄露训练数据，OpenAI修复后依然有效

数据泄露防不胜防

网友：还有其他攻击方法

推荐体验

相关资讯

马斯克担心“出卖”个人隐私数据

ChatGPT和个人隐私：用户数据保护的挑战

ChatGPT遭意大利禁用，原因侵犯个人隐私！

OpenAI就ChatGPT漏洞致部分用户信息泄露道歉目前漏洞已修复

@太原人，AI绘画火爆朋友圈，保护好个人隐私，避免信息泄露

近期资讯

种下科学的种子让梦想发光

从“科学技术”到“技术科学”

成都奋力建设全国先进制造业基地

中建三局数字工程公司创新提供智能建造解决方案走出数智化发展新路径

深远海多功能科学考察及文物考古船“探索三号”在三亚入列

iPhone 17/17 Air即将量产，真的是横置条形摄像头

早报：雷军今晚将举行跨年直播 iPhone 17 Slim曝光

听到孩子愤怒的抗议和怼我时，欣慰有边界感的孩子，最值得肯定

2023年全国旅游及相关产业增加值占比4.24%

技经观察丨上九天揽月，竞逐月球新战略高地

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响