GPT-4成学术造假“神器”，伪造数据快且合理，Nature请专家鉴别

作者：量子位发布时间：2023-11-23

GPT-4

GPT-4成学术造假“神器”，伪造数据快且合理，Nature请专家鉴别

萧箫发自凹非寺

量子位 | 公众号 QbitAI

学术造假有了GPT-4，变得更容易了。

这两天，一篇刊登在Nature上的新闻表示，GPT-4生成的造假数据集，第一眼还真不一定看得出来。

除非请来业内专家仔细对数据集进行评估，才能发现个中细节的不合理性。

这个新闻的来源是一篇发表在JAMA Ophthalmology上的论文。

论文使用GPT-4为一项医学学术研究生成了一个假数据集，发现它不仅能创造出看似合理的数据，甚至还能用来准确支撑错误的论文观点。

对此，有网友表示十分理解：

大模型最重要的能力就是生成“看似合理的文本”，因此它非常适合干这活儿。

还有网友感慨：技术“有良心”的程度，也就和用它的研究人员一样了。

所以，GPT-4创造的假数据究竟长啥样？

GPT-4学术造假有一手

先来看看GPT-4是怎么生成假数据的。

具体来说，研究人员采用了GPT-4的高级数据分析（ADA，原代码解释器）功能，来生成一个假数据集。

这个过程中，研究人员给GPT-4提供了一些专业知识和统计学要求，让它生成的数据看起来更加“合理”。

第一步，给GPT-4输入一系列数据要求。

研究人员先给GPT-4提供了一系列详细的提示词，要求它创建一个关于圆锥角膜（keratoconus）眼部疾病患者的数据集。

圆锥角膜是一种疾病，会导致角膜变薄，导致注意力受损和视力不佳。

目前治疗圆锥角膜疾病的方式主要有两种，一种是穿透性角膜移植（PK），另一种是深板层移植（DALK）。

在没有任何实质性证据的情况下，研究人员让GPT-4捏造一组数据，支撑DALK比PK效果更好的观点。

随后，再设定了一系列统计标准，如要求GPT-4生成的术前和术后数据产生统计学上的显著差异。

第二步，就是生成数据了。

这个过程中可能会由于GPT-4字数限制，导致答案生成暂停，通过“继续”提示就能恢复生成过程。

最终，GPT-4成功生成了包含160名男性和140名女性患者的数据集，并做出了一组支撑DALK比PK效果更好的数据。

由GPT-4生成的假数据集长这样，表格1是关于分类变量的数据，包括患者性别、手术类型、免疫排斥等情况：

表2是关于连续变量，包括术前术后的视力矫正情况等：

论文作者之一Giuseppe Giannaccare博士表示，如果非常快速地查看这个数据集，很难识别出它其实“不是人做的”。

专家审查才能发现

为了验证GPT-4做出来的数据是否真的令人信服，Nature特意请来了英国曼彻斯特大学生物统计学家杰克·威尔金森（Jack Wilkinson）和同事Zewen Lu，来检查数据可信度。

检查结果表明，许多捏造出的患者在性别、名字匹配度上就有问题（例如Mary的性别一栏是男性一样）。

然后，一些数据之间的相关性也不高，包括术前和术后视力测量与眼部成像检查（eye-imaging test）之间的数据相关性等。

最后，患者的年龄也设置得不同寻常。

在检查之后，用GPT-4生成假数据集的研究人员也承认，大模型在生成数据集上还存在有缺陷的地方。

但杰克·威尔金森（Jack Wilkinson）依旧对结果表示了担忧：

一旦知道自己“哪里露馅了”，AI很容易就能纠正它，并生成更加具有说服力的结果。

有网友认为，这篇文章最大的意义并不在于证明“GPT-4有幻觉”；

更重要的是，它证明了GPT-4生成看似合理的数据集“非常容易”，也算是一种对期刊的警告（记得严格审稿！）。

不过，也有网友感觉研究意义不大，因为即使没有ChatGPT这样的工具，真想造假的学者也能很容易伪造出一套数据。

One More Thing

此外，这两天一段关于ChatGPT的视频在抖音上也是火得不行。

视频中，终于毕业的歪果仁小哥直呼“感谢ChatGPT帮助我完成所有作业和考试”（手动狗头）

那么，对于ChatGPT在学术研究上可能带来的问题，你怎么看？

近期资讯

轻松制作苹果手机拼图，记录生活美好瞬间的方法与技巧

工具，更是我们记录生活、分享美好瞬间的好帮手。而拼图功能则是苹果手机中一个非常实用的功能，能够让我们把多张照片组合成一张漂亮的拼图，方便分享给朋友或者社交媒体。那么，今天就来聊聊苹果手机怎么拼图，帮助大家轻松制作出好看的拼图。首先，想要拼图，我们需要选择合适的照片。可以在相册中挑选几张你喜欢的照片。

新报观察 2024-12-29

轻松开启定位功能的实用指南与隐私保护建议

可是，很多人可能对怎么开启定位这个问题感到困惑。今天，就来聊聊如何轻松地开启定位功能，让你的生活更加便利。

新报观察 2024-12-29

解除手机锁屏密码的多种方法与注意事项总结

手机锁屏密码是保护个人隐私的重要手段，但有时我们可能会忘记这个密码，或者因为其他原因想要解除锁屏密码。今天，我就来聊聊几种解除锁屏密码的方法，帮助大家轻松应对这种情况。假设你之前在手机上绑定了谷歌账户，当你输入错误的密码多次后，屏幕上会出现一个选项，提示你使用谷歌账户来解锁。

新报观察 2024-12-29

如何准确使用卷尺：技巧与注意事项分享

卷尺是我们生活中常见的工具，无论是在家里装修、测量家具，还是在工地上进行专业测量，卷尺的使用都十分广泛。虽然看似简单，但很多人对卷尺的使用并不太了解，甚至在测量时会出现误差。今天，我就来聊聊卷尺怎么看尺寸，教你如何准确地使用卷尺来获取你想要的测量结果。首先，卷尺的基本构造是有一个卷尺带和一个卷尺壳。

新报观察 2024-12-29

轻松安装新电视的步骤与注意事项指南，助你尽享观影乐趣！

安装电视其实并没有想象中那么复杂，只要你按照步骤来，就能轻松搞定。今天，我就来跟大家聊聊怎么把你的新电视安装好，让你能尽快享受到精彩的节目。你需要找一个合适的地方，避免阳光直射，这样可以减少反光影响观影体验。一般来说，距离沙发的最佳观看距离是电视屏幕对角线长度的1.5到2.5倍。

新报观察 2024-12-29

选购电视的关键因素：尺寸、类型、分辨率与预算指南

选择电视并不是一件简单的事情，尤其是在如今各种型号、品牌、技术层出不穷的市场环境中。要想选到一台满意的电视，得考虑的因素可真不少。接下来，咱们就来聊聊在选购电视时需要关注的几个关键点。首先，屏幕的尺寸是一个必须考虑的重要因素。你得想想你的客厅有多大，坐在哪里看电视比较舒服。一般来说，电视的尺寸与观看距离是有关系的。

新报观察 2024-12-29

如何在iPhone上批量删除联系人，轻松管理通讯录

录。无论是通过iCloud、第三方软件还是直接在手机上操作，总有一种方法适合你。祝你清理顺利！

新报观察 2024-12-29

如何在QQ音乐上关注好友，享受音乐社交的乐趣与互动体验

如果你是QQ音乐的新手，或者想要更好地利用这个平台与好友分享音乐，那关注好友的功能绝对是你不能错过的。点击进入后，找到“好友”或者“社交”相关的选项，具体名称可能会随着版本的更新有所变化。这里你可以看到你的好友列表，当然前提是你的好友也在使用QQ音乐。

新报观察 2024-12-29

共享充电宝使用与归还指南：轻松应对日常需求

充电宝，作为现代生活中不可或缺的小工具，已经成为了我们日常出行的必备良品。无论是上班、上学，还是旅行，充电宝都能在关键时刻为我们的手机、平板等电子设备提供源源不断的电力支持。

新报观察 2024-12-29

轻松上手WPS制作PPT的技巧与步骤，助你高效表达信息

在这个信息化的时代，制作一个精美的PPT已经成为许多人的日常工作之一。今天就来聊聊怎么用WPS制作PPT，保证你看完之后能轻松上手。点击“新建”，然后选择“演示文稿”，你就进入了PPT的制作界面。

新报观察 2024-12-29

GPT-4成学术造假“神器”，伪造数据快且合理，Nature请专家鉴别

GPT-4成学术造假“神器”，伪造数据快且合理，Nature请专家鉴别

推荐体验

相关资讯

GPT-4成学术造假“神器”，伪造数据又快又合理，Nature请统计学专家“断案”

GPT-4成学术造假“神器” 伪造数据又快又合理

GPT-4“炉火纯青”的数据造假能力助研究论文登上学术期刊，Nature请专家调查

GPT-4数据造假，让研究论文登上学术期刊

ChatGPT可伪造看似合理“支持”科学假说的试验数据

近期资讯

轻松制作苹果手机拼图，记录生活美好瞬间的方法与技巧

轻松开启定位功能的实用指南与隐私保护建议

解除手机锁屏密码的多种方法与注意事项总结

如何准确使用卷尺：技巧与注意事项分享

轻松安装新电视的步骤与注意事项指南，助你尽享观影乐趣！

选购电视的关键因素：尺寸、类型、分辨率与预算指南

如何在iPhone上批量删除联系人，轻松管理通讯录

如何在QQ音乐上关注好友，享受音乐社交的乐趣与互动体验

共享充电宝使用与归还指南：轻松应对日常需求

轻松上手WPS制作PPT的技巧与步骤，助你高效表达信息

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响