当前位置:首页|资讯|生成式AI

AI不能再人为作恶!美七大科技巨头联名,给AI生成内容加水印

作者:神经童非童发布时间:2023-08-02








数字经济应用实践专家骆仁童博士人为:这是重大的进步,天天被DeepFake忽悠的日子要结束了,为所有AI生成的内容中嵌入水印是社会和技术发展的必然。

最近,美国七家科技巨头公司联合宣布,将在未来为所有AI生成的内容嵌入可识别的水印,以维护信息安全。这项技术将有助于更安全地分享AI生成的文本、图像、音频和视频,同时不会误导别人。目前,对于不同形式的生成品分别如何嵌入水印这一点,尚不明确。但功能是确定的——嵌入后,用户就可以知道当前生成品的来历,是哪个生成式AI工具搞出来的。

这项决定是因为用户和政策制定者们对DeepFake等问题的高度关注。DeepFake已经成为了一种威胁,而水印的添加可以天然隔开真和假,构筑起一道障壁,杜绝混淆视听。OpenAI表示将会研发一种水印机制,加入到视频或音频中。谷歌也表示除了水印以外,还会有其它创新型技术,把关信息推广。拜登政府还将创建一个基金会,确保对于AI的所有发展都要先有承诺和保证,再推广落地,避免风险。

这些公司做出的承诺强调了人工智能未来发展的三个原则:安全、保障、信任。这标志着在开发负责任的人工智能上,人类迈出了关键的一步。




如何加水印

前段时间,来自马里兰大学的研究人员提出了一种高效的水印技术,可以让合成文本在很短的token跨度(仅需25个token)内被检测到,同时误报率(将人类文本误判为机器生成)极低。

水印是文本中的隐藏模式,对人类来说是不可察觉的,但可以通过算法识别为合成文本。

论文地址:https://arxiv.org/pdf/2301.10226.pdf

众所周知,AI语言模型的工作原理是对逐个单词进行预测和生成。

在每个单词之后,水印算法会随机将语言模型的词汇分成「绿色列表」和「红色列表」,然后提示模型选择绿色列表中的单词。

在一段文字中,如果绿色列表中的单词越多,那么这段文字很可能是由机器生成的。而由人写的文字往往会包含更随机的单词组合。

举个栗子,对于单词「美丽」,水印算法可以将「花」归类为绿色,将「兰花」归类为红色。采用带有水印算法的AI模型则更有可能使用「花」这个词,而不是「兰花」。

概括来说,水印算法所具备的特性如下:

- 水印可以在没有任何模型参数知识或访问语言模型API的情况下,通过算法进行检测。这一特性使得检测算法可以开源,即使模型不是。这也使得检测变得廉价且快速,因为无需加载或运行LLM。

- 可以使用标准语言模型生成带有水印的文本,无需重新训练。

- 水印可以从生成文本的连续部分中检测出来。这样,即使只使用生成的一部分来创建更大的文档,水印仍然是可检测的。

- 如果不修改相当比例的生成token,就无法去除水印。

- 可以用严格的统计方法来衡量水印是否被检测到。

虽然马里兰大学提出的方法,仍有一些问题尚未解决。例如,在流媒体环境下,或者当短跨度的水印文本位于较长的非水印文本中时,测试水印的最佳方法是什么?

但研究人员认为,他们实验的结果足以证实,水印可以成为对抗恶意使用生成模型的实用工具。

至于剩下的问题,就留给未来的研究了。


∷∷∷∷∷∷∷∷∷∷

骆仁童老师主讲课程

智慧应用 | 数字应用 | 人工智能 

 数字化  | 产业智能 | 创新创业




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1