再也不能用ChatGPT写作业了！新算法给AI生成文本加水印，置信度高达99.999999999994%

作者：量子位发布时间：2023-02-04

ChatGPT

明敏 Alex 发自凹非寺

量子位 | 公众号 QbitAI

AI生成文本，又遇新对手！

方法一经发布就引来大量网友围观。这回拿ChatGPT“作弊”，怕不是要更难了？

要知道，最近一段时间，ChatGPT先是成为美国高中生的写作业利器，后面帮专业媒体写稿子，引发巨大恐慌。如Nature、纽约教育部等，都针对ChatGPT发布禁令。

马里兰大学学者们提出的这一新方法，为解决这些麻烦提出了个新思路。

不少网友都觉得，这个方法提出的正是时候，而且效果看着也不错。

有学者还和美国高中生喊话，你们要做好准备了！

作者表示，方法代码将在2月15日免费开源。

计算文本由AI生成的概率

所谓模型水印，人类无法看到，但是计算机可以。

这是一种现在被常用于大规模语言模型（LLM）中的方法，能让AI生成的文本带有“特殊标记”。即把信号嵌入到生成的文本中，让算法能从一小段token中检测出来。

最近，OpenAI方面也表示，考虑在ChatGPT中添加水印，以降低模型被滥用带来的负面影响。

这篇最新论文的作者，就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印，然后再进行检测。其中水印的嵌入不会影响文本生成质量。

具体来说，大规模语言模型每次生成一个token，每个token将从包含大约5万个词汇的词汇表中进行选择。

在新token生成之前，该方法会从基于最近已生成的token为随机数生成器（RNG）提供“种子”，以此来压一个水印。

然后使用RNG，能将词汇表分为 黑名单和 白名单，并要求LLM接下来只能从白名单中选择词汇。

如果整段文本中， 白名单中的词汇越多，就意味着越有可能是AI生成的。

黑白名单的区分，基于一个原则：

人类使用词汇的随机性更强。

举例来说，如果在“美丽的”后面生成词汇，水印算法会将“花”列入白名单，将“兰花”列入黑名单。

论文作者认为，AI更可能使用“花”这个词汇，而不是“兰花”。

然后，就能通过计算整段文本中白名单token出现的情况，来检测水印。

如果一共有生成了N个token，所有的token都使用了白名单词汇，那么这段文字只有 2的N次方分之一概率是人类写的。

即便这段文字只有25个词组成，那么水印算法也能判断出它到底是不是AI生成的。

但作者也表示，水印有时候也不一定完全靠谱。

比如模型输出了“SpongeBob Square”，下一个单词一定会是“Pants”吧？但是Pants会被标记到黑名单里，即认为是只有人才会写的词。

（注：SpongeBob SquarePants是《海绵宝宝》动画片的英文，可理解为一个专有名词）

这种情况会严重影响算法的准确性，因此作者将其定义为 低熵token，因为模型几乎不会有更好的选择。

对应来看，也会有 高熵token，比如“海绵宝宝感觉____”这个句式里，能填入的词汇太多了。

对于这一情况，作者选择针对高熵token制定更强的规则，同时保留低熵token，确保水印质量更好。

与此同时，他们还添加了波束搜索（Beam search），允许LLM能够排布一整个token序列，以避免黑名单词汇。

这么做，他们能确保LLM使用白名单词汇的概率在大约 80%左右，而且不影响文本生成质量。

因为在这段文字中，包含36个token。如果是人类写的，那么文本中应该包含9±2.6个白名单词汇（白名单词汇的概率约为25%）。

但这段文字中，包含了 28个白名单词汇。

计算来看，这段文字由人类写出的概率，仅有 0.0000000000006% （6乘以10的-15次方）。

如下标注的是文本中的黑名单token。

需要注意的是，如果想要水印正常发挥作用，并不受到攻击，就必须对文本进行一些标准化处理，并且需要检测某些类型的对抗性提示。

这一方法是对外公开的，将在 2月15日开源代码。

加一个随机秘钥，也能变成保密模式并且托管到API上，这能保证水印不会被篡改。

论文中使用的模型是Meta开源的 OPT-1.3B模型。

由于不用访问底层模型，所以该检测方法的速度很快，成本也不会很高。

而且可以使用标准语言模型生成带水印的文本，不用再重新训练。

网友：似乎很容易绕过？

巴特，不少网友觉得，这个方法的具体实践效果可能远不及理想，质疑之声迭起。

有人提出：

如果我在AI生成的文字基础上，修改几个词，还能被查出来吗？那在替换成近义词后，检测准确率会下降多少？

毕竟大家往往不会一字不改、直接用AI生成的内容。

对此，论文通讯作者、马里兰大学副教授Tom Goldstein回答称：

对于一段自带水印的文字，至少得修改40%-75%的token，才可能成功去除水印。

（如果用其他程序修改内容话），为发生同义词攻击，导致生成内容的质量很低。

简而言之，想要通过换近义词来消除水印，得大篇幅修改，而且若不是人亲自手动修改的话，效果会很拉胯。

还有人提出：

对于专门设计过的低熵token序列，应该能检测出水印。但是，长度和检测率之间（存在一些矛盾），它们的优先级应该如何权衡？

对此，Tom教授表示：

根据设定，使用波束搜索时，绝大多数（通常是90%）的token在白名单上，即使是低熵token，也会被列入白名单。

所以，至少得修改一半以上的token，才能删除水印，而这需要一个超级强大的LLM模型才行，一般人很难接触到。

不过，研究者们也在论文中承认，这种方法确实存在一些局限性。

比如，检测水印的z统计量，只取决于白名单大小参数γ和生成白名单的哈希函数，和其他不少重要的参数并没有什么相关性。

这就让他人可以在下游水印检测器上做手脚，可以改变水印采样算法，重新部署水印，最终让原本生成的水印失效。

就连OpenAI CEO Sam Altman也表示：

创造完美检测AI抄袭的工具，从根本上来说是不可能的。

（尽管他说OpenAI打算启用水印大法）

但话说回来，人们为了限制AI生成文字的负面影响，还是煞费苦心——

之前就有人搞出了一个检测ChatGPT的网站，名曰GPTZero，只需要把相应的内容粘进去，几秒内就能分析出结果。

论文地址：

https://arxiv.org/abs/2301.10226

— 完—

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入交流群，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

定期清理手机存储空间，提升使用体验与性能的实用指南

在这个数字化时代，手机几乎成了我们生活中不可或缺的工具。无论是拍照、上网、聊天，还是办公、购物，手机都在助我们一臂之力。但随着使用时间的增加，手机里总会积累大量的文件、缓存和应用，这些东西不仅占用存储空间，还可能导致手机变得越来越慢。所以，定期清理手机是个不错的主意。今天就来聊聊手机怎么清理，让你的手机焕然一新。

新报观察 2024-12-30

如何简单有效地升级QQ，享受全新功能与安全保障

软件，承载了无数人的青春记忆。在这个信息快速传播的时代，保持软件的更新和升级变得尤为重要。升级不仅可以让你享受到最新的功能，还能提高安全性，修复一些潜在的bug。那么，QQ怎么升级呢？接下来，我就来给大家详细说说。首先，升级的方式其实挺简单的。你可以在手机应用商店里找到QQ，直接点击更新按钮。

新报观察 2024-12-30

掌握iPad屏幕录制技巧，轻松记录生活与工作瞬间

在这个数字化的时代，iPad已经成为了许多人生活中不可或缺的一部分。今天，我们就来聊聊iPad怎么录制屏幕，让你轻松掌握这一技能。首先，如果你想要在iPad上录制屏幕，确保你的设备运行的是iOS11或更高版本。

新报观察 2024-12-30

掌握iPad截图与录屏技巧，让你的数字生活更高效便捷

在这个数字化的时代，iPad已经成为了我们日常生活中不可或缺的一部分。不论是用来阅读、学习，还是娱乐、工作，iPad都为我们提供了极大的便利。而在使用iPad的过程中，截图这个功能就显得尤为重要了。无论是想要保存一段精彩的对话、分享一张有趣的图片，还是记录下某个页面的信息，截图都是一个简单又实用的工具。

新报观察 2024-12-30

抖音客服联系指南：解决常见问题的有效方法与注意事项

在这个信息泛滥的时代，抖音已经成为了很多人生活中不可或缺的一部分。不论是用来获取娱乐内容，还是用来分享生活点滴，抖音都为我们提供了一个极为便利的平台。那么，抖音的客服究竟该怎么联系呢？

新报观察 2024-12-30

如何高效查询公交车实时位置与到达时间的多种方法

在城市生活，公交车是我们日常出行的重要交通工具。无论是上班、上学，还是外出游玩，公交车都能带我们到达目的地。现在的科技真是发达，手机几乎成了我们生活中不可或缺的一部分。

新报观察 2024-12-30

如何设计高效实用的目录提升阅读体验与效率

在我们日常生活中，目录的作用其实是非常重要的。无论是一本书、一个报告，还是一个网站，目录都能帮助我们快速找到所需的信息。今天就来聊聊怎么弄好一个目录，让它既清晰又实用。首先，我们得明确目录的基本结构。一般来说，目录主要包括标题和页码。标题应该简洁明了，能够一眼让读者知道这部分内容讲的是啥。而页码呢，则是帮助读者快速找到相应的内容。

新报观察 2024-12-30

如何选择和操作游戏机，享受健康游戏乐趣

在这个数字化的时代，游戏机已经成为了许多家庭娱乐生活中不可或缺的一部分。无论是孩子还是成年人，游戏机都能带来无尽的乐趣和放松。今天，我们就来聊聊游戏机怎么玩，如何选择适合自己的游戏机，以及一些实用的小技巧。在开始之前，选择一台适合自己的游戏机是非常重要的。市面上有很多种类的游戏机，比如家用游戏机、掌机和PC游戏。

新报观察 2024-12-30

如何轻松打开RAR文件：实用方法与技巧分享

RAR文件是一种常见的压缩文件格式，它能将多个文件和文件夹打包在一起，以便于存储和传输。也许你在网上下载了一个包含RAR格式的文件，或者从朋友那里得到了一些压缩包，然而，打开这样一个文件却让你感到困惑。别担心，接下来我会详细介绍如何打开RAR文件，让你轻松搞定这个小难题。首先，咱们得知道RAR文件的特性。

新报观察 2024-12-30

掌握喇叭线接法，提升音响音质与设备使用寿命的技巧与注意事项

喇叭线的连接在我们日常生活中其实并不陌生，特别是对喜欢听音乐、看电影的人来说，了解如何接好喇叭线是非常重要的。无论是家用音响系统还是汽车音响，喇叭线的接法都能直接影响到音质的表现和播放效果。接下来，我会详细讲讲喇叭线怎么接，让你轻松掌握这个技巧。首先，喇叭线其实就是传输音频信号的一种电缆，通常由两根导线组成，一根是正极，一根是负极。

新报观察 2024-12-30

再也不能用ChatGPT写作业了！新算法给AI生成文本加水印，置信度高达99.999999999994%

推荐体验

相关资讯