ChatGPT下架官方检测工具，承认AI文字无法鉴别

作者：量子位发布时间：2023-07-26

ChatGPT

没有公告，OpenAI悄然关闭了AI文本检测工具，页面直接404了。

官方对此没有公开回应，几天后才有人找到一则简短说明，藏在半年前工具发布的博客页面中。

……AI检测器由于准确率较低而不再可用……我们正在研究更有效的文本检测技术，并承诺开发音频和视觉检测技术。

对于CloseAIOpenAI不发公告就杀死一个产品这种行为，很多网友是不满意的。

但是对关闭AI检测器本身倒是有不少人表示赞同，特别是学生群体。

太多老师相信这玩意有效，大量冤枉学生用AI作弊，已经变成了一场猎巫运动。

准确率和瞎猜差不多

这个官方检测工具，准确率究竟有多低呢？

OpenAI自己给出的数据，只能正确识别26%的AI生成文本，同时冤枉9%的人类编写文本。

1月份刚发布时就被网友总结为“和瞎猜差不多”。

另外有人做过实验发现，市面上各种检测工具会把圣经、美国宪法等历史文本都被判定可能为AI编写，总不能写下这些内容的历史人物都是时间穿越者吧？

但还是有很多老师试图用各种检测方法来检查学生作业。

最著名的一次，得克萨斯农工大学一位教授差点判定半个班的学生延毕。

目前最新的趋势是，教师要求学生用在线文档写作业并检查编辑记录，但聪明的学生也能找到规避办法。

最终对于教育领域，有人提出可能大作业/课程论文将成为历史，闭卷考试或口语考试将成为主流。

目前的检测方法都能规避

网友指出，OpenAI同时开发生成和检测工具本身就是矛盾的。

如果一边做的好就意味着另一边没做好，同时还有可能存在利益冲突。

但是第三方开发的检测方法，可靠性也不高。

最早被称为“ChatGPT克星”的是普林斯顿本科生Edward Tian开发的GPTZero，用复杂性和长短句的变化来衡量文章是否由AI生成。

当时GPTZero计划专为教育工作者打造，老师可以把全班学生的作业丢进去检测。

但到了7月份，作者承认已放弃了检测学生作弊这个方向，计划下个版本的GPTZero将不再检测文本是否由AI生成，而是突出最像人写的部分。

另外一个很受关注的检测方法，是马里兰大学开发的水印法，要求大模型在生成文本的时候就藏下记号，并用统计方法识别。

但是规避的办法也很简单，比如有人开发了简单的同义词替换工具，就能破坏统计特征。

甚至有人开始怀疑，人们到底是为了什么非要区分这个。

就像数字到底是人计算的还是计算机完成的，早就没人在意了。

演讲者的稿是自己写的还是秘书写的，不是也没人在意吗。

人类行为学研究，正在用AI充当被试

无法区分AI和人类的内容，似乎也不全是坏事。

已经有心理实验用AI代替人类被试加速研究了。

Cell子刊上一篇文章指出，在精心设计的实验场景中，ChatGPT的反应与大约95%的人类参与者的反应呈相关性。

并且机器被试不会疲倦，使科学家能以前所未有的速度收集数据并测试有关人类行为的理论。

而在最近一篇Science主刊的观点文章上，滑铁卢大学心理学教授Igor Grossman认为：

“人工智能可以改变社会科学研究的游戏规则，谨慎的偏见管理和数据保真度是关键。”

参考链接

[1]https://twitter.com/KevinAFischer/status/1683898199981928450

[2]https://www.reddit.com/r/ChatGPT/comments/159j8rc/openai_quietly_kills_its_own_ai_classifier_citing/

[3]https://news.ycombinator.com/item?id=36862850

[4]https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(23)00098-0

[5]https://www.science.org/doi/10.1126/science.adi1778

[6]https://theconversation.com/beyond-the-hype-how-ai-could-change-the-game-for-social-science-research-208086

本文来自微信公众号“量子位”（ID:QbitAI），作者：梦晨，36氪经授权发布。

近期资讯

【旗舰】三星S25Ultra屏幕/影像规格曝光独家搭载2代抗反射玻璃

此前有海报显示三星将于1月22日在美国举行GalaxyUnpacked活动，届时将发布全新GalaxyS25系列。这两日关于三星S25Ultra配置有更多消息。

小白测评 2024-12-28

蓝色起源 New Glenn 火箭完成最终关键测试，预计 2025 年 1 月 6 日首飞

12月28日消息，杰夫・贝索斯旗下商业航空公司蓝色起源于当地时间周五对其“新格伦”（NewGlenn）运载火箭完成了首次综合静态点火测试，也是其首飞发射前的最后一次关键测试。虽然，蓝色起源顺利完成了本次关键测试，但之前计划的“2024年底发射”似乎已经来不及实现。

IT之家 2024-12-28

赛西科技取得可燃气体泄露检测装置专利，能够快速对不同区域的泄露燃气进行大范围检测

金融界2024年12月28日消息，国家知识产权局信息显示，湖南赛西科技有限公司取得一项名为“一种可燃气体泄露检测装置”的专利，授权公告号CN222212103U，申请日期为2023年12月。

金融界 2024-12-28

iPhone 17标准版将支持高刷，苹果历史首次！

我们知道，苹果的刀法非常精准，标准版机型是不会给配备高刷屏幕的。但据最新爆料，供应链物料基本确认，iPhone17标准版将支持高刷。这是苹果历史上第一次为标准版引入高刷，对于标准版来说堪称史诗级提升，日常体验大大提升。苹果从iPhone13Pro开始引入高刷，经过五年的刻意刀法，终于要在iPhone17上普及。

中关村在线 2024-12-28

小米给小米SU7车主送新年礼物：免费领四个Are you OK气门塞

快科技12月28日消息，继小米汽车官宣提前完成年交付13万辆的目标后，官方给13万多的车主发福利了！甚至雷军今年还凭借这首成名曲，成为了《歌手2024》摇人榜第一名，排名甚至超过了韩红、周杰伦等知名歌手，票数超百万。

快科技 2024-12-28

嫦娥五号月球样品在北京天文馆展出

我国成为世界上第三个成功带回月球样品的国家后，公众也可以近距离观看由我国自主带回的月球样品了。12月28日下午，“问月——中国探月工程嫦娥五号月球样品展”在北京天文馆B馆一层展厅拉开帷幕。涵盖了月壤各种形态的共计0.6克嫦娥五号月球样品与公众见面，带领公众走进月球的神秘世界，深度解读月壤中的科学奥秘。

北青网 2024-12-28

苏州市东拓新能源取得气密检测机专利，操作更加方便

金融界2024年12月28日消息，国家知识产权局信息显示，苏州市东拓新能源有限公司取得一项名为“一种气密检测机”的专利，授权公告号CN222212095U，申请日期为2024年5月。专利摘要显示，本实用新型提供一种气密检测机。

金融界 2024-12-28

如何设置文档页边距提升专业性与可读性技巧解析

在日常生活中，我们经常会接触到各种文档，无论是工作报告、学术论文，还是个人的日记，页边距的设置都是一个不可忽视的细节。其实，页边距不仅影响到文档的美观，还关系到可读性和排版的效果。

新报观察 2024-12-28

闻道虽有先后，专攻或可超车？——母机上的“黑马”跑进链博会

如果按照控制方式来分类，可分为数控机床和普通机床，而数控化是先进制造机床的大趋势。

中国对外贸易杂志 2024-12-28

消息称 iQOO 神秘新机测试苹果同款压感按键

IT之家12月28日消息，博主@数码闲聊站今日爆料称，iQOO神秘新机测试苹果同款压感按键，或许是用于肩键（存疑），手板是搭配定制大尺寸马达+极窄纯直屏。IT之家注意到，今年9月发布的iPhone16系列手机在机身侧面配备一个拍照按键，具有触觉反馈功能，点击即可启动相机应用程序。

IT之家 2024-12-28

ChatGPT下架官方检测工具，承认AI文字无法鉴别

准确率和瞎猜差不多

目前的检测方法都能规避

人类行为学研究，正在用AI充当被试

参考链接

推荐体验

相关资讯

准确率近乎瞎猜！ChatGPT官方检测工具悄悄下架

不准确！OpenAI下架智能检测工具

OpenAI正在开发新AI图像检测工具

语法错误检测工具哪个好？

语法错误检测工具有哪些？

近期资讯

【旗舰】三星S25Ultra屏幕/影像规格曝光独家搭载2代抗反射玻璃

蓝色起源 New Glenn 火箭完成最终关键测试，预计 2025 年 1 月 6 日首飞

赛西科技取得可燃气体泄露检测装置专利，能够快速对不同区域的泄露燃气进行大范围检测

iPhone 17标准版将支持高刷，苹果历史首次！

小米给小米SU7车主送新年礼物：免费领四个Are you OK气门塞

嫦娥五号月球样品在北京天文馆展出

苏州市东拓新能源取得气密检测机专利，操作更加方便

如何设置文档页边距提升专业性与可读性技巧解析

闻道虽有先后，专攻或可超车？——母机上的“黑马”跑进链博会

消息称 iQOO 神秘新机测试苹果同款压感按键

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响