OpenAI的文本分类器悄悄停用：它们也分不清AI生成的内容了

作者：机器之能发布时间：2023-07-26

OpenAI

机器之能报道

编辑：梓文

OpenAI 停用 AI 分类器。

今年 1 月 31 日 OpenAI 发布的 AI 分类器已于 7 月 20 日悄悄停用。

OpenAI 没有发布宣布该消息的新公告，而是在曾经发布 AI 分类器的网页上加入了一段它不可再用的文字。

图源：https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text

OpenAI 表示，AI 分类器停止使用是因为它的准确率太低。他们将致力于研究更加有效识别文本来源的技术，并承诺开发、部署判断音频或视频内容是否是 AIGC 的机制。

再也无「盾」抵「长矛」

有网友调侃，OpenAI 不仅致力于识别 AI 内容，还致力于让 AI 内容更像人类。这两件矛盾的事情，原本就是很难达到平衡的。不过 OpenAI 的终于在数据面前卸下了最后的「倔强」，它的「盾」，终究是被破了。

其实，在 AI 分类器刚发布时，OpenAI 就已经说明了它的不可靠性。

最初，AI 分类器在英语文本「挑战集」的评估中，分类器正确地将 26% 的 AI 编写的文本识别为「可能是人工智能编写的」，而 9% 的情况下将人工编写的文本错误标记为 AI 编写的文本。AI 分类器的可靠性通常随着输入文本长度的增加而提高。与之前发布的分类器相比，这款分类器在处理来自最新人工智能系统的文本时可靠性明显提高。

并且该 AI 分类器的局限性极大，OpenAI 不将其定义为主要的决策工具，而是一种确定来源的补充方法。因为：

1. 分类器在短文本（低于 1000 个字符）上非常不可靠，甚至更长的文本有时也会被分类器错误标记。

2. 有时，人类编写的文本会被分类器错误地标记为 AI 编写。

3. 建议仅对英文文本使用分类器。它在其他语言中的表现明显更差，并且在代码上不可靠。

4. 无法可靠地识别非常可预测的文本。例如，无法预测前 1，000 个质数的列表是由 AI 还是人类编写的，因为正确答案总是相同的。

5. AI 编写的文本可以通过编辑来躲避分类器。分类器可以根据成功的攻击进行更新和重新训练，但不清楚检测是否具有长期优势。

6. 众所周知，基于神经网络的分类器在训练数据之外的校准能力很差。对于与训练集中的文本有很大差异的输入，分类器有时会非常自信地做出错误预测。

以上这些信息说明，OpenAI 的 AI 分类器这个「盾」其实本就不够坚固。现在它因为准确率的进一步降低，已经在辨别文本类 AIGC 上发挥不了作用而被停用。

这意味 AI 输出的文本内容已经与人类已经十分相似，分辨难度也从「高级」变为了「地狱级」。

同样，当 AI 生成的音频和音频也与人类产出难以区分时，我们又该如何应对？

如何识别AI内容成为难题

毕业季刚刚过去，毕业生终于卸下了毕业论文的重担，准备奔赴社会。但与往年不同的是，今年许多毕业论文的「第二作者」其实是 GPT。

今年 3 月，上海市教育委员会副主任倪闽景曾谈到 GPT 对于教育的影响，他说道：「ChatGPT 把教育逼到了墙角」。

这是什么原因导致的？

OpenAI 创建的 GPT 成为强大的工具。它不仅可以帮助人们快速了解某一方面知识、提供相应的行动思路，还能生成逻辑严密的长文，甚至能够不断对输出内容进行润色。这对于教育行业而言，可喜却又可忧。喜的是效率提高，学生能够站在 GTP 的「肩膀」上有更多成长，忧的是成长的只有 GPT，而非人类自己。

早在去年 12 月上旬，洛杉矶联合学区就暂停了对 ChatGPT 网站的访问，自此国外院校不断加入该行列，推进 ChatGPT 的禁用。国内虽未有严令禁止的条例，但是各高校也在论文写作上不同程度地限制了对 GPT 的使用。

不止校内，校外禁止 GPT 参与的行为也比比皆是。尤其是各种期刊。如 Nature 在去年 12 月发文表达了对 ChatGPT 沦为学生代写论文工具的担忧，继而在 1 月底下场，针对 ChatGPT 代写学研文章、列为作者等系列问题作出了规定，ChatGPT 和其他任何 LLM 工具都不可以成为论文作者。

但这些措施或许并未真正起效，因为 AIGC 的识别难度太高。

今年四月，iParadigms 研发出 Turnitin 检测 AI 写作系统已被墨尔本大学、新南威尔士大学等高校采用。

据 Turnitin 6 月发布的统计，在该系统发布的两个月内检测过的 6500 万篇论文中，有 210 万篇文章中 AI 写作内容达 80%，670 万篇论文中 AI 写作内容达 20%。这个数据说明 AI 写作几乎已经全面入侵了教育、学术领域。

那么这个可以检测 AI 内容的 Turnitin 是教育者们新的「救命稻草」吗？答案是否定的。

虽然 Turnitin 可以通过一定技术分析文本片段，并评判在文章内 AI 生成内容所占比例。但 Turnitin 官网也表示，其 AI 写作检测并不总是准确的。Turnitin 首席产品官提示，鉴于 AI 书写检测中的误报，教师要综合专业经验和对学生的了解进行判断。

至于 Turnitin 未来会不会与 OpenAI 的 AI 分类器殊途同归，就等待时间来验证吧。

在留言区留下你的想法吧。

参考链接：

https://decrypt.co/149826/openai-quietly-shutters-its-ai-detection-tool

https://baijiahao.baidu.com/s?id=1756709397637388684&wfr=spider&for=pc

https://twitter.com/KevinAFischer/status/1683898199981928450

Turnitin AI detection feature reviews more than 65 million papers | Turnitin (https://www.turnitin.com/press/turnitin-ai-detection-feature-reviews-more-than-65-million-papers?utm_source=twitter&utm_medium=organic&utm_campaign=communications)

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

OpenAI的文本分类器悄悄停用：它们也分不清AI生成的内容了

推荐体验

相关资讯

善用Embedding，我们来给文本分分类

对抗性训练方法在半监督文本分类中的应用

威尔史密斯本尊整活Sora，网友：我分不清！我真的分不清啊

深度学习【Kaggle大赛】CommonLit文本复杂性识别大赛指导班（nlp·文本分类）

虚拟和现实已分不清！OpenAI首个AI视频模型发布

近期资讯

对打娃哈哈，乐百氏还要抢香飘飘生意

海外短剧APP素材投放榜：Dramawave登顶，Shot Short猛增，这些海外市场值得关注

中国最唬人的职位，坑了多少应届生

焦点分析 | 比亚迪的短板，不再是智能化

上海国资开始了

市值70亿，阿里CEO赶飞机投的智驾公司上市了

首次！100位美国达人来FastMoss达人选品展览会！还有100位东南亚达人！覆盖多个品类，总粉丝数超2亿！

Docker Container 可观测性最佳实践

挣扎于资金泥沼，圣诺医药自救这一年

并购“热火朝天”

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响