前段时间,关于 AI 检测毕业论文的话题引发了广泛讨论,并一度登上了热搜榜, 围观者观点无外乎 AI 检测论文的程度有些过火,甚至也有人质疑是否应该使用 AI 进行检测。
而据《华尔街日报》报道,OpenAI 内部开发了一种可以准确检测用户是否利用 ChatGPT 撰写文章或学术论文的方法。
报道称,这项技术的背后用到了一种数字水印,虽然肉眼上不可察觉,但可以通过 OpenAI 的检测技术进行识别。检测工具会提供一个分数,以评估整篇文档或其中一部分由 ChatGPT 撰写的可能性。
内部文件透露,当由 ChatGPT 生成的文本达到一定程度时,水印技术的准确性高达 99.9%。
去年七月,包括 OpenAI、Meta 在内的七家科技巨头承诺将采用一些安全措施来增强 AI 技术的安全性。
这七家科技巨头都承诺将共同开发和应用一种水印系统,适用于 AI 生成的所有类型的内容,包括文本、图像、音频和视频。
据知情人士和《华尔街日报》查阅的内部文件显示,ChatGPT 文本检测器也已经准备就绪,随时可以发布。一位知情人士表示:「这不过是按一下按钮的事情。」
OpenAI CEO Sam Altman 和 CTO Mira MUrati 也曾参与有关这个「反作弊」工具的讨论,但据知情人士透露,Altman 虽然支持这个项目的开发,但却并未积极推动其公开发布。
一个关键的考虑因素在于,根据 OpenAI 对 ChatGPT 高黏度用户所进行的一项调查结果,69% 的用户认为作弊检测技术可能会引发对使用 AI 的不实指控。
近 30% 的用户表示,如果 ChatGPT 启用了水印功能而其竞争对手没有,他们可能会减少使用 ChatGPT。
OpenAI 去年也曾推出一款名为「AI Text Classifier」 的文本检测器,旨在检测文本是否是由 AI 生成。
然而,根据 OpenAI 的数据,该工具在识别 AI 生成文本方面的正确率仅为 26%,同时将人类缩写内容错误识别为 AI 生成的错误率达到了 9%,因此,该工具仅推出半年后便遭到了停用。
与此同时,《华尔街日报》引述 OpenAI 一位女发言人的话称,OpenAI 担心这项工具可能对非英语为母语的群体造成不公平的影响。
她强调「我们正在开发的文本水印技术在技术上有很大潜力,但在探索其他可能性时,我们也在权衡其带来的重要风险……考虑到所涉及问题的复杂性和对 OpenAI 之外整个生态系统可能产生的影响,我们认为采取谨慎的态度是必要的。」
斯坦福大学生物医学数据科学助理教授 James Zou 曾领导一众科学家,使用 7 个流行的 GPT 检测器评估了 91 篇由非英语母语人士撰写的托福(鉴定非英语为母语者的英语能力考试)作文。
研究发现,在 7 个 GPT 检测器中,由非英语母语人士撰写的超过一半的作文被错误地标记为由 AI 生成,甚至有一个检测器错误地将近 98% 的作文标注为由 AI 生成。
相比之下,以英语为母语的八年级学生写的作文在检测后,同样的 AI 检测器将超过 90% 的作文标注为由人类生成。
此外,这类 AI 检测器的普及度也是一个微妙的平衡点。
倘若使用检测器的人过少,该工具的效果将大打折扣,如果使用的人太多,被破解的风险也随之激增。
可以预见的是,随着 AI 的不断进步和渗透到我们的日常生活,验证作品的「含人量」将逐渐成为我们不得不面对的新常态。