研究发现AI生成文本水印能被轻易擦掉，水印伪造成功率达80%左右

作者：DeepTech深科技发布时间：2024-04-05

人工智能

研究人员发现，在人工智能生成文本中添加的水印很容易被删除，而且会被窃取和复制，使其变得毫无用途。他们表示，这类攻击破坏了水印技术的可靠性，可以欺骗人们相信他们本不应该相信的内容。

水印的工作原理是，在人工智能生成的文本中插入隐藏“信息”，使计算机能够识别出文本来自于人工智能系统。它们是一项相当新的发明，但已经成为对抗人工智能所产生的错误信息和抄袭内容的流行解决方案。

例如，2024 年 5 月生效的欧盟《人工智能法案》要求，开发者要为人工智能生成的内容加上水印。

但瑞士苏黎世联邦理工学院的博士生罗宾·斯塔布（Robin Staab）表示，新的研究表明水印技术的水平并没有达到监管机构的要求。他参与了这项最新研究。

该研究尚待同行评审，但将在 2024 年 5 月份的国际学习表征会议（ICLR，International Conference on Learning Representations）大会上演讲。

人工智能语言模型的工作原理是预测句子中的下一个单词，并在这些预测的基础上生成可能性最大的单词。

文本水印算法将语言模型的词汇划分为“绿色列表”和“红色列表”，然后让人工智能模型从绿色列表中选择单词。

绿色列表中的单词越多，文本就越有可能是由计算机生成的，因为人类写出的句子倾向于使用随机性更高的单词组合。

研究人员篡改了五种以这种方式工作的水印。斯塔布说，他们能够通过 API 访问采用了水印技术的人工智能模型，并多次向其发送提示，对水印实施逆向工程。

通过收集到的回应，攻击者可以摸索出一套类似的水印规则，并建立一个相似的模型来“窃取”水印。他们通过分析人工智能输出并将其与普通文本进行比较来实现这一点。

一旦研究人员大致了解了水印单词（列表）包含了什么，他们就可以执行两种攻击。

第一种被称为欺骗攻击（spoofing attack），攻击者会使用他们从水印规则中获得的信息，生成像是被加上了水印的文本。

第二种攻击允许攻击者分离水印和人工智能生成的文本，这样就可以伪装成是人类写的。

最终，该团队伪造水印的成功率约为 80%，剥离水印的成功率为 85%。

没有参与苏黎世联邦理工学院团队这项研究的研究人员，如美国马里兰大学可靠人工智能实验室副教授兼主任索海尔·菲兹（Soheil Feizi），也发现水印技术不可靠，容易受到欺骗攻击。

（来源：STEPHANIE ARNETT/MITTR | IMAGEFX, ENVATO）

菲兹说，苏黎世联邦理工学院的研究结果证实，现有水印技术存在很多问题，甚至可以延伸到当今最先进的聊天机器人和大型语言模型中。

他说，这项研究“强调了在大规模部署此类检测机制时，谨慎行事是多么的重要”。

参与了这项研究的苏黎世联邦理工学院博士生尼古拉·约万诺维奇（Nikola Jovanović）表示，尽管有这些发现，水印仍然是检测人工智能生成内容的最有希望的方法。

但他补充道，在大规模部署水印之前，还需要完成更多的研究。在那之前，我们应该对这些工具的可靠性和有用性降低期望。他说：“它是有用的，总比什么工具都没有好。”

支持：Ren

排版：刘雅坤

相关资讯

不能用 AI 代写作业了？OpenAI 正研发 ChatGPT 文本水印，检测成功率惊人

而据《华尔街日报》报道，OpenAI内部开发了一种可以准确检测用户是否利用ChatGPT撰写文章或学术论文的方法。内部文件透露，当由ChatGPT生成的文本达到一定程度时，水印技术的准确性高达99.9%。

OpenAI ChatGPT 华尔街

AppSo 2024-08-05

复旦再推AI文本检测工具“谛听” 识别ChatGPT成功率达80％

GPT-4让AI更加具有像人一样的能力，AI生成的文本的流畅度也令人惊叹，越来越难以辨识。在这一背景下，AI检测文本工具可以通过对生成文本进行追踪和检测，来识别文本是否由AI生成，这也成为防止大型AI

复旦 ChatGPT GPT-4

第一财经 2023-03-17

再也不能用ChatGPT写作业了！新算法给AI生成文本加水印

明敏 Alex 发自凹非寺量子位 | 公众号 QbitAIAI生成文本，又遇新对手！凭借识别AI生成文本中的“水印”，一种新算法能够准确判断文本到底是谁写的。无需访问模型参数、API，结果置信度高达99.999999999994%。方法一经发布就引来大量网友围观。这回拿ChatGPT“作弊”，怕不是要更难了？要知道，最近一段时间，ChatGPT先是成...

ChatGPT

量子位 2023-02-04

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

据NewAtlas报道，研究人员利用自主协作的GPT-4机器人小组成功入侵了一半以上的测试网站，这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是，他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞（zero-dayvulnerabilities）。

GPT-4

金融界 2024-06-09

如何使用ChatGPT 提升创业成功率

内容提要了解 ChatGPT 的功能确定您的目标市场和问题陈述使用 ChatGPT 进行头脑风暴完善你的创业想法与团队协作评估想法并确定优先顺序，开启创业之路推荐好用免费的ChatGPT服务，手机电脑端均可总结其他相关文章深度体验ChatGPT，内有体验链接与方法，手机电脑端均可使用ChatGPT深度体验- 1，高效处理工作学习中的邮件、会议记录ChatGPT深度体验-2，和ChatGPT一起高效写代码ChatGPT 深度定制优化版(含图片)体验指南ChatGPT深度体验-3, 工作中与ChatGPT一

ChatGPT 编程

轻松Ai享生活 2023-04-05

近期资讯

SpaceX上周末“双响炮”，2024年度第134次火箭发射目标近在咫尺

12月31日消息，SpaceX于12月29日通过官方账号在X平台发布推文，宣布成功连续两次发射猎鹰9号火箭，成功部署22颗星链卫星，并将Astranis卫星送入轨道，完成2024年度第132和133次发射。

砍柴网 2024-12-31

东航第10架C919交付入列

钛媒体App12月31日消息，中国东航第10架C919身披央视新闻“闪耀中国红”涂装正式入列。当天上午9时59分，这架C919执行MU500调机航班，从上海浦东国际机场起飞，10时14分抵达上海虹桥国际机场，正式入列东航机队。

钛媒体快报 2024-12-31

深圳市华万彩实业取得一种色母粒切割设备专利，提高了对色母粒杆进行传输过程中的稳定性

金融界2024年12月31日消息，国家知识产权局信息显示，深圳市华万彩实业有限公司取得一项名为“一种色母粒切割设备”的专利，授权公告号CN222223164U，申请日期为2024年4月。

金融界 2024-12-31

证券时报 2024-12-31

轻松掌握换开关技巧，保障安全并解决常见问题的方法解析

换开关其实是一件并不复杂的事情，只要你有耐心，遵循一些基本的安全原则，就能轻松搞定。接下来，我就来和你聊聊怎么换开关，过程中的一些小注意事项，以及一些常见问题的解决方法。在开始之前，咱们得先准备一些工具和材料。其实，换开关用到的东西并不多，通常只需要一个螺丝刀（十字或一字的，看你开关的类型）、电工胶带、可能还需要一个电压测试仪。

新报观察 2024-12-31

日系车还有救吗：全球产量连跌！你会买一台支持吗

快科技12月31日消息，据日本媒体报道称，丰田等8家日本乘用车制造商最新公布的11月生产、销售和出口数据显示，8家车企的全球产量为212.2162万辆，同比下降11.0%，已经连续7个月同比下降。数据

雪花 2024-12-31

南航C909成功首航广州至文莱航线

今日（12月31日）8:52分，中国南方航空CZ5509航班从广州白云国际机场起飞，前往文莱首都斯里巴加湾市。这是南航首次使用C909飞机执飞国际客运航线，不仅标志着南航C909机型首次跨越国界、开启跨海国际航线运营新征程，也创下南航C909飞机执飞航线最长航程近2400公里的记录。

北青网 2024-12-31

AI爆火两年，技术飞快跑，大模型突破商业化困局了吗？

这两年，普通人对大语言模型的能力兴奋，随便一条指令就能生成流畅自然的文本，科幻电影里的场景，如今早已经成为现实。如同移动支付、智能手机、LTE共同点燃了移动互联网时代的繁盛，AI行业这一年也在寻找这样的PMF（ProductMarketFit）而焦虑。大语言模型的技术怎么落地，从一开始就是个抓肝挠心的问题。

爱范儿 2024-12-31

安阳职业技术学院：国际智能服务机器人大赛再创佳绩

12月29日，备受瞩目的2024“一带一路”暨金砖国家技能发展与技术创新大赛第二届智能服务机器人应用技术赛项国内赛决赛在安阳职业技术学院成功落下帷幕，这场为期两天的技能盛宴至此画上了圆满句号。

大象新闻 2024-12-31

各台跨年节目单出炉！你pick哪一家

《启航2025——中央广播电视总台跨年晚会》今晚在央视综合频道、综艺频道、音乐频道等播出，与观众共同迎接充满希望的2025年。结合XR/AR虚拟现实，融入无人机、机器人表演等科技手段，拓展节目表现形式。

上游新闻 2024-12-31

研究发现AI生成文本水印能被轻易擦掉，水印伪造成功率达80%左右

推荐体验

相关资讯

不能用 AI 代写作业了？OpenAI 正研发 ChatGPT 文本水印，检测成功率惊人

复旦再推AI文本检测工具“谛听” 识别ChatGPT成功率达80％

再也不能用ChatGPT写作业了！新算法给AI生成文本加水印

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

如何使用ChatGPT 提升创业成功率

近期资讯

SpaceX上周末“双响炮”，2024年度第134次火箭发射目标近在咫尺

东航第10架C919交付入列

深圳市华万彩实业取得一种色母粒切割设备专利，提高了对色母粒杆进行传输过程中的稳定性

华为孟晚舟最新发声！

轻松掌握换开关技巧，保障安全并解决常见问题的方法解析

日系车还有救吗：全球产量连跌！你会买一台支持吗

南航C909成功首航广州至文莱航线

AI爆火两年，技术飞快跑，大模型突破商业化困局了吗？

安阳职业技术学院：国际智能服务机器人大赛再创佳绩

各台跨年节目单出炉！你pick哪一家

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响