OpenAI开发ChatGPT「反作弊神器」，99.9%超高命中率，但没发布

作者：新智元发布时间：2024-08-05

OpenAI ChatGPT

【导读】OpenAI又左右互搏上了，给AI生成的文本打水印，高达99.9％准确率抓「AI枪手」作弊代写。

去各大高校图书馆转一圈，会发现头上一副耳机、手边一杯咖啡，电脑上一个AI工具网页几乎成了当代大学生标配。

学生热衷于在ChatGPT的帮助下完成作业，教师们却头疼于无法杜绝学生用ChatGPT作弊的行为。

人工智能可以根据一个提示，在几秒钟内免费创建整篇论文或研究论文。教师和教授表示，他们迫切需要帮助来打击滥用行为。

《每日邮报》2023年1月30报道称，UNSW的1名学生使用ChatGPT自动生成论文被抓，这也是全澳第一个使用AI技术作弊被抓的学生。

UNSW人工智能教授Toby Walsh表示，各大高校都在评估如何阻止学生使用AI技术作弊。

随后，新州、昆州和塔州都封锁了校园网络对于ChatGPT的访问，以防学生通过该技术作弊。

但Walsh教授表示，阻止校园网络访问ChatGPT是没有意义的，因为学生们可以通过代理绕过封锁。

「想要彻底阻止学生作弊，只能把他们放在一个没有网络的环境里，给他们一张纸和一支笔。」

CDT最近进行的一项调查发现，59%的中学教师确信有些学生使用了AI来帮助完成学业，比前一个学年上升了17个百分点。

要想靠老师和学校的盯梢，避开ChatGPT的诱惑很难办到，解铃还须系铃人——让AI企业亲自出马解决抓「AI枪手」。

据悉，OpenAI已经开发出一款能够高精度识别ChatGPT生成文本的工具，但迟迟未发布。

「文本水印」抓作弊，成功率99.9％

ChatGPT由人工智能系统提供支持，生成原理是根据输入内容预测句子中接下来出现的token。

OpenAI正在讨论的反作弊工具将稍微改变token的选择方式，这些变化会留下一种称为水印的图案。

这些水印肉眼无法察觉，但可以通过OpenAI的检测技术发现，检测器提供整个文档或部分文档由ChatGPT编写的可能性的分数。

根据内部文件，当ChatGPT创建足够多的新文本时，水印的有效率可以达到99.9%。

虽然准确率超高，OpenAI工作人员仍然担心，换一种方式可以轻松卡Bug，通过简单的技术来删除水印。

例如让Google将文本翻译成另一种语言，然后再翻译回来，或者让ChatGPT在文本中添加表情符号，然后手动删除它们。

另一方面，公司内部普遍认为，谁可以使用该探测器将也是一个棘手的问题。

如果拥有该工具的人太少，工具基本上就没有用处。如果太多人获得访问权限，有些人可能会尝试破译水印技术。

OpenAI员工也讨论过，直接向教育工作者或外部公司提供检测器，帮助学校识别人工智能撰写的论文和抄袭作品。

谷歌其实也开发过一种水印工具，可以检测Gemini AI生成的文本，叫做SynthID，正处于Beta测试阶段，尚未广泛使用。

OpenAI有一个工具可以确定图像是否是使用文本到图像生成器DALL-E 3创建的，该工具于去年春天发布用于测试。

该知情员工表示，该公司优先考虑音频和视频水印而不是文本，因为其危害更为严重，尤其是在美国繁忙的选举年。

AI文本分类器

早在2023年1月，OpenAI就发布了一种算法，旨在检测多个AI模型（包括其自己的模型）编写的文本。

但它的成功率仅为26%，七个月后OpenAI就将其撤回。

其他公司和研究人员还开发了一些工具来检测人工智能创建的文本，许多教师表示他们已经使用过这些工具。

但它们有时无法检测由高级大语言模型编写的文本，并且准确率很低，可能产生误报。

最近在佐治亚州一所私立高中任教的教育工作者人工智能顾问Mike Kentz表示，起初，学生们确实被震慑到，以为老师们已经完全掌握了一种方法，可以弄清楚他们是否使用了人工智能代写。

但到了年底……他们慢慢发现，等一下，我的老师好像不知道。

一些老师鼓励学生使AI来帮助研究或提供想法反馈。但问题是，当学生使用像ChatGPT这样的应用程序来完成所有工作时，学生甚至不会去检查自己交的是什么。

去年，犹他大学政治学教授Josh McCrain给学生布置了一份写作作业，作业要求插入了难以辨认的小文字，其中提到了和作业无关的蝙蝠侠。

如果他们将作业复制并粘贴到人工智能中，作业提示内容就会被合并，「蝙蝠侠」就会干扰作业内容。

果然，少数学生提交了作业——一篇蝙蝠侠论文。

McCrain教授正在调整写作作业，更多地关注人工智能不太熟悉的时事，并恳求学生不要将他们的工作外包给人工智能。

「这就是我试图向学生们强调这一点的地方：你需要自己学习这些东西。」McCrain教授说。

争论不休

知情人士称，有关水印工具的讨论早在OpenAI于2022年11月推出ChatGPT之前就已经开始。

它是由计算机科学教授Scott Aaronson开发的，过去两年他在德克萨斯大学休假期间一直在OpenAI从事安全工作。

2023年初，OpenAI联合创始人之一John Schulman在一份共享的Google文档中概述了该工具的优缺点。

OpenAI高管随后决定，在采取进一步行动之前，他们将征求一系列人士的意见。

在接下来的一年半时间里，OpenAI高管反复讨论，并寻求新数据集优化算法，犹豫是否发布该技术。

内部文件显示，2023年4月，OpenAI委托进行了一项调查，结果显示，世界范围的人们以四比一的比例支持人工智能检测工具的想法。

同月，OpenAI对ChatGPT用户进行了调查，发现69%的人认为作弊检测技术会导致使AI技术错误指控。

近30%的人表示，如果ChatGPT部署了水印功能，而竞争对手没有部署水印，他们会减少使用。

另外，OpenAI内部还有一种反对的声音是反作弊工具可能会损害ChatGPT的写作质量。

知情人士称，OpenAI今年早些时候进行了一项测试，发现文本水印不会降低输出质量。

6月初，OpenAI高级员工和研究人员再次聚会讨论该项目。该组织一致认为水印技术效果良好，但去年的ChatGPT 用户调查结果仍然是一个头疼的问题。

内部文件显示，OpenAI需要在今年秋天之前制定一项计划，围绕AI透明度以及相关潜在新法律来左右公众舆论——

「如果做不到这一点，我们就有可能失去负责任企业的信誉。」

参考资料：

https://www.wsj.com/tech/ai/openai-tool-chatgpt-cheating-writing-135b755a?mod=tech_lead_story

本文来自微信公众号“新智元”，编辑：耳朵好困，36氪经授权发布。

近期资讯

Tele-FLM-1T与星辰语义大模型重磅发布，TeleAI：完成全国产化万卡万参大模型训练！

人工智能作为数字化转型的核心动力，正在以前所未有的速度重塑各个行业，尤其是推动了通信行业与其他领域的深度融合。AI赋能下，通信行业从传统的“连接服务提供者”转变为“智能解决方案的引领者”，在AI浪潮中扮演着至关重要的角色。

CSDN 2024-12-27

潘禺：谷歌量子计算芯片给了国内产业界紧迫感

12月10日，谷歌重磅推出量子计算芯片“Willow”，在公关宣传攻势下，马斯克送上了“Wow”，奥特曼也发来了贺电。Willow是一款拥有105个物理量子比特的量子芯片，亮点在于其惊人的计算速度和错误校正能力。随着量子比特数量的增加，错误率通常会指数增长，但Willow通过先进的量子纠错技术，实现了错误率的指数级降低。

观察者网 2024-12-27

蓝鲸新闻 2024-12-27

祥鑫科技：公司在发布冷媒直冷新技术前已进行相关专利布局

有投资者在投资者互动平台提问：祥鑫科技此次发布的冷媒直冷新技术是重大创新项目，请问公司有没有及时提前申请国际和国家专利，保证公司发明创新项目的安全和独立性生产。

每日经济新闻 2024-12-27

河南交投平宛高速公路有限公司取得快速组合的道路施工模板专利，提高了施工的便利性

金融界2024年12月27日消息，国家知识产权局信息显示，河南交投平宛高速公路有限公司取得一项名为“一种快速组合的道路施工模板”的专利，授权公告号CN222205943U，申请日期为2024年5月。

金融界 2024-12-27

容声509升冰箱BCD-509WD2FPQLA：补贴1200元，高端家电性价比之选

#年货节好物集市#在高端冰箱市场中，消费者最为关注的指标莫过于保鲜效果、节能性能以及智能化水平。保鲜技术直接关系到食物的新鲜度和营养保持，节能性能则涉及到长期使用成本，而智能化功能则为用户带来便捷操作体验。

小米地瓜 2024-12-27

美团副总裁毛一年：美团已投资宇树、银河通用等多家机器人公司

12月27日消息，在今日的2024美团机器人研究院学术年会上，美团副总裁、美团机器人研究院理事长毛一年表示，美团积极投资机器人创新企业，目前已投资立镖机器人、未来机器人、九识智能、非夕机器人、银河通用机器人、宇树科技等机器人公司。机器人作为一项新领域新赛道，尤其是人形机器人，受到国家政策的大力支持。

砍柴网 2024-12-27

幻方量化DeepSeek-V3首个版本上线

钛媒体App12月27日消息，幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源，API服务已同步更新，接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。

钛媒体快报 2024-12-27

OpenAI开发ChatGPT「反作弊神器」，99.9%超高命中率，但没发布

「文本水印」抓作弊，成功率99.9％

AI文本分类器

争论不休

推荐体验

相关资讯