数字经济应用实践专家骆仁童博士人为:这是重大的进步,天天被DeepFake忽悠的日子要结束了,为所有AI生成的内容中嵌入水印是社会和技术发展的必然。
最近,美国七家科技巨头公司联合宣布,将在未来为所有AI生成的内容嵌入可识别的水印,以维护信息安全。这项技术将有助于更安全地分享AI生成的文本、图像、音频和视频,同时不会误导别人。目前,对于不同形式的生成品分别如何嵌入水印这一点,尚不明确。但功能是确定的——嵌入后,用户就可以知道当前生成品的来历,是哪个生成式AI工具搞出来的。
这项决定是因为用户和政策制定者们对DeepFake等问题的高度关注。DeepFake已经成为了一种威胁,而水印的添加可以天然隔开真和假,构筑起一道障壁,杜绝混淆视听。OpenAI表示将会研发一种水印机制,加入到视频或音频中。谷歌也表示除了水印以外,还会有其它创新型技术,把关信息推广。拜登政府还将创建一个基金会,确保对于AI的所有发展都要先有承诺和保证,再推广落地,避免风险。
这些公司做出的承诺强调了人工智能未来发展的三个原则:安全、保障、信任。这标志着在开发负责任的人工智能上,人类迈出了关键的一步。
如何加水印
前段时间,来自马里兰大学的研究人员提出了一种高效的水印技术,可以让合成文本在很短的token跨度(仅需25个token)内被检测到,同时误报率(将人类文本误判为机器生成)极低。
水印是文本中的隐藏模式,对人类来说是不可察觉的,但可以通过算法识别为合成文本。
论文地址:https://arxiv.org/pdf/2301.10226.pdf
众所周知,AI语言模型的工作原理是对逐个单词进行预测和生成。
在每个单词之后,水印算法会随机将语言模型的词汇分成「绿色列表」和「红色列表」,然后提示模型选择绿色列表中的单词。
在一段文字中,如果绿色列表中的单词越多,那么这段文字很可能是由机器生成的。而由人写的文字往往会包含更随机的单词组合。
举个栗子,对于单词「美丽」,水印算法可以将「花」归类为绿色,将「兰花」归类为红色。采用带有水印算法的AI模型则更有可能使用「花」这个词,而不是「兰花」。
概括来说,水印算法所具备的特性如下:
- 水印可以在没有任何模型参数知识或访问语言模型API的情况下,通过算法进行检测。这一特性使得检测算法可以开源,即使模型不是。这也使得检测变得廉价且快速,因为无需加载或运行LLM。
- 可以使用标准语言模型生成带有水印的文本,无需重新训练。
- 水印可以从生成文本的连续部分中检测出来。这样,即使只使用生成的一部分来创建更大的文档,水印仍然是可检测的。
- 如果不修改相当比例的生成token,就无法去除水印。
- 可以用严格的统计方法来衡量水印是否被检测到。
虽然马里兰大学提出的方法,仍有一些问题尚未解决。例如,在流媒体环境下,或者当短跨度的水印文本位于较长的非水印文本中时,测试水印的最佳方法是什么?
但研究人员认为,他们实验的结果足以证实,水印可以成为对抗恶意使用生成模型的实用工具。
至于剩下的问题,就留给未来的研究了。
∷∷∷∷∷∷∷∷∷∷
骆仁童老师主讲课程
智慧应用 | 数字应用 | 人工智能
数字化 | 产业智能 | 创新创业