ChatGPT也在评审你的顶会投稿，斯坦福新研究捅了马蜂窝，“这下闭环了”

作者：量子位发布时间：2024-04-02

ChatGPT 斯坦福

尴了个大尬！

人们还在嘲讽有人用ChatGPT写论文忘了删掉“狐狸尾巴”，另一边审稿人也被曝出用ChatGPT写同行评论了。

而且，还是来自ICLR、NeurIPS等顶会的那种。

来自斯坦福的学者对一些顶级AI会议（如ICLR、NeurIPS、CoRL等）中的审稿意见进行了分析，结果发现——

在ChatGPT出现之后，这些同行评论的“AI含量”大增，最多的高达16.9%，而有ChatGPT之前这个比例大约是2%。

证据也很直观，AI常用的词汇出现频率，在ChatGPT发布之后噌的一下就上去了。

消息一出，Reddit的机器学习板块立刻就炸了锅，有网友直呼：闭环了！

在X上，也有人发出了同样的疑问：

既然写论文和审稿都是大模型在干，那科学家去干什么了？

那么，这究竟是怎么一回事呢？

顶会审稿意见AI含量超1/6

来自斯坦福大学多个学院以及加州大学圣芭芭拉分校的研究人员发表了一项研究，主题是关于ChatGPT对AI学术会议同行评审的影响。

研究人员一共分析了ICLR、NeurIPS、CoRL和EMNLP这四个顶会中的同行评审意见，对其“AI含量”进行了计算。

ICLR 2024: 估计α值为10.6%

NeurIPS 2023: 估计α值为9.1%

CoRL 2023: 估计α值为6.5%

EMNLP 2023: 估计α值为16.9%，超过了1/6

α值指在所有内容中疑似由AI生成或“显著修改”的内容所占的比例

而在ChatGPT问世之前，α值的水平大约是在2%，作为对照的Nature系列期刊评审意见的α值则未发生显著变化。

除了得出这些数据，研究人员还发现了“AI含量”较高的评审意见大多具有一些共同特点。

从内容角度上看，“AI含量”高的意见，引用的作者中包括“et al.”的学术内容也较少。

而且，“AI含量”高的内容，在语义上也更加同质化，比如“commendable”（值得称赞的）、“meticulous”（细致的）和“intricate”（复杂的）等形容词大量出现。

同时作者也展示了在AI生成的内容中出现最频繁的形容词和副词各100个，下图中字号越大代表出现频率越高。

而除了内容本身，高”AI含量“的内容的作者在行为上也表现出了一些共同之处。

一是提交的时间更加接近截止期限，特别是截止前三天提交的意见“AI含量”明显更高。

除了提交时间晚，高“AI含量”意见的作者，普遍对自己提交的内容自信程度也更低。

评审者对自己评审意见信心水平的自我评估（满分5分）结果显示，“AI含量”较高的审稿人，自我评分也更低（不大于2分）。

此外，对自己的审稿意见自信程度低的另一个表现是，他们也较少对论文作者反驳做出回应。

在ICLR 2024和NeurIPS 2023上，这类审稿人中有超过12.5%从未对反驳意见做出任何回复，约10%只回复了一次。

那么，作者又是如何分析出这些审稿意见中的AI含量的呢？

为此，研究人员设计了一种分布式“GPT量化”方法，能够在语料库级别有效估计AI含量，而不必逐篇分析。

首先，研究人员收集了已知由人类编写（ChatGPT出现前的审稿意见）和AI生成（由研究者直接用ChatGPT编写）的文本的数据集，作为参考分布。

然后，作者估计了人工编写的（P）和AI生成（Q）的内容的token分布，尤其重点关注形容词的出现概率。

最后将这种分布模型拟合到未知成分的目标语料库，假设每个文档都是从人类和人工智能分布的加权组合中，即(1-α)P+αQ，并使用最大似然估计来推断α的值。

完成方法的构建之后，研究者又合成了多组α值确定的标准数据集，并在此之上对前面提出的方法进行了验证，结果最大误差仅有2.4%。

于是，作者使用该方法分析了最近几个会议中的审稿意见，最终得到了前面的结论。

而当这项研究被更多人所得知后，引发了广泛的讨论，其中有不少人对这种现象表达了担忧。

不过，也有人猜测出现这种现象的原因，可能是审稿人母语不是英语，于是用ChatGPT对英文写作进行了调整润色。

基于此，有人提问到，用ChatGPT来改写而不是直接生成评论也是错的吗？

有人给出了半肯定的答复，但理由不是关乎原创性，而是出于对文本质量的担忧，人们还是应该谨慎使用ChatGPT。

当然也有人说，科学写作，本身就是ChatGPT的一种合理用途。

总之对于这件事，担忧也好宽容也罢，这种现象都已然存在了，而按照原作者的观点，这几个问题是人们应该思考的：

是否应该披露AI在同行评审中的使用

在AI极具诱惑力的情况下，应该如何激励好的实践

在人工智能同质化的境地下，人们能否保持“智力多样性”

是否应该重新考虑人类/AI混合知识工作的可信度

当然了，在学术界，ChatGPT生成的内容，还远不只是审稿意见。

论文作者也爱用

除了审稿人被曝用ChatGPT写评论之外，拿它来写论文的人更是屡见不鲜……

在谷歌学术中搜索2023年及以后包含“certainly, here is”这种ChatGPT常用开头的论文，剔除直接包含“ChatGPT”和“LLM”的论文后，结果共有50余篇。

随机翻阅其中的几篇，果然是发现了ChatGPT的使用痕迹，ChatGPT在这些论文中被用做了总结、翻译、制作表格等多种用途。

甚至其中还包括正式出版的论文合集：

而另一个ChatGPT常用句式“As of my Last Knowledge Update”，在相同条件下的搜索结果有114条。

而且出现形式上也更加离谱，“Certainly组”当中至少还有一些只是用ChatGPT做了些辅助工作，“As of my…”这一组干脆直接拿来搞正文内容了。

此外，“As an AI language model, I”也有40多条搜索结果，不过也不排除其中有误伤的情况出现。

当然要论离谱，可能还要属这种把ChatGPT的按钮“Regenerate Response”也一起复制进去的了，而且数量还不算少，有将近一百篇。

露出鸡脚马脚被发现的论文数量尚且如此，删去了这些关键字从而“躲过一劫”的究竟有多少，就更是不得而知了。

当然，并不是说研究者不能使用ChatGPT来辅助论文撰写，包括Elsevier、Springer（Nature出版商）在内的许多知名出版机构都表示并不禁止ChatGPT的使用，只要进行声明即可。

总之，无论是论文本身还是审稿意见，亦或是其他文本写作，如何以更合理的方式运用AI，值得人们继续深入思考。

论文地址：https://arxiv.org/abs/2403.07183

本文来自微信公众号“量子位”（ID:QbitAI），作者：关注前沿科技，36氪经授权发布。

近期资讯

筱晓光子 2024-12-27

鲍哲南院士、崔屹院士最新Nat. Chem.：解析SEI形成机制和传输机理！

算筹-科研服务 2024-12-27

25款腾势D9上市33.98万元起，立MPV 6大标杆

25款腾势D9正式上市，售价33.98万元起，提供DM-i混动版和纯电版共8个版本，价格区间33.98万至46.98万元。提供多种优惠政策，包括膨胀金、置换补贴、贴息等。新车在设计、舒适、驾驭、三电、智能、安全六大维度全面升级，树立全能MPV标杆。综合续航高达1100km，纯电续航200km，百公里馈电油耗5.85L。支持快充技术，15分钟续航243公里。 [图片] [图片] [图片] [图片] [图片]

婉婉聊汽车 2024-12-27

企业数字化转型加速，现代 IT 如何用 Datadog 全面提升可观测性？

作为 Gartner 可观测平台魔力象限的领导者，Datadog 凭借全面的功能、直观的用户界面和强大的产品路线图赢得了全球企业的信任。企业 IT 架构正变得日益复杂，从本地服务器到云端部署，从单体应用向微服务，还有容器、 Kubernetes 等云原生技术的兴起，各种技术栈的引入使得运维工作面临着前所未有的挑战。如何实时监控分布式系统和第三方 SaaS 应用的健康状况？如何在数十个甚至上百个服务中寻找故障源头，快速定位性能瓶颈？如何在保障系统安全的同时，提供优质用户体验？根据 451 Rese

优阅达 2024-12-27

布谷相亲婚恋app软件源码开发搭建服务器环境配置及功能清单

近些年由于各大短视频平台带火了开封王婆户外说媒相亲婚恋节目，导致近期婚恋相亲软件或小程序卖的火热，现山东布谷科技就开发过的相亲婚恋app应用软件源码所应用到的技术栈及功能清单详细剖析,希望对从事婚恋相亲行业运营及技术研发的朋友有一定的作用！ [图片] 布谷相亲婚恋系统软件源码部署环境安装要求（只有在相同的环境下才更容易避免一些不必要的麻烦）: ●安装Center OS 7.9，我们自己的服务器使用的是7.9建议相同系统，非强制 ●安装宝塔环境（强烈推荐使用） ●安装软件环境：PHP 7.3、Nginx默

山东布谷科技_sun 2024-12-27

【麦克威排烟天窗】一文告诉你易熔采光带怎样才能消防过关

易熔采光带要想消防过关，需要满足以下多方面的要求：一．材料性能方面易熔采光带的防火等级必须达到 B1 级及以上，以确保在火灾发生时，不会轻易燃烧，从而延缓火势蔓延，为人员疏散和消防救援争取时间。易熔采光带怎样才能消防过关，应在 120℃-150℃能自行熔化，以便在火灾引发的高温下，采光带能够及时熔化，形成排烟口，排出火场中的烟和热。同时，其在正常使用环境温度下，又要保持稳定的物理性能。在火灾发生燃烧至可熔性采光带时，不能产生熔滴，防止因熔滴滴落造成的财产损失和人身伤害。二．安装设计方面一般易熔采光带需设置

麦克威排烟天窗 2024-12-27

从零开始，掌握未来科技—新疆保华润天航空无人机培训课程全解析

在这个科技日新月异的时代，无人机已经成为了摄影、测绘甚至是救援工作中不可或缺的工具。而位于风景秀丽的新疆，保华润天航空提供的CAAC无人机培训课程，正等待着每一位对天空充满好奇与热情的朋友。你是否曾梦想过像鸟儿一样自由飞翔？或是在高空中捕捉那些绝美的风景？在这里，一切都不再是梦。无论你是完全的新手，还是希望提升自己飞行技巧的老手，我们的专业教练团队都将为你量身定制培训计划，确保你能在最短的时间内掌握核心技能。课程内容涵盖了从基础理论到实际操作的全方位教学，包括但不限于无人机的构造、飞行原理、安全法规以及高

新疆无人机保华润天 2024-12-27

ChatGPT也在评审你的顶会投稿，斯坦福新研究捅了马蜂窝，“这下闭环了”

顶会审稿意见AI含量超1/6

论文作者也爱用

推荐体验

相关资讯