难辨真假！研究人员使用ChatGPT生成数据集支持科学假说

作者：快智学术发布时间：2024-02-15

ChatGPT

来源 | 科学网

编辑 | 学术君

编译｜卜金婷

ChatGPT又摊上事了。

11月9日，JAMA Ophthalmology刊登了一篇论文，研究人员使用GPT-4和其拓展的高级数据分析功能（ADA）配对，生成关于圆锥角膜患者的虚假数据集，从而支持一个未经证实的科学假说。

对于部分圆锥角膜患者而言，有两种治疗方法可供选择：一种是穿透性角膜移植术（PK），即切除全层病变角膜，以捐赠者的健康组织取代；另一种是深板层角膜移植术（DALK），仅替换病变的部分角膜组织，保留角膜内层完整。

随后，研究人员要求GPT-4 ADA编造临床数据，以支持DALK比PK效果更好的结论。

GPT-4 ADA生成的数据包含160名男性和140名女性参与者。结果显示，接受DALK的参与者在视力测量和眼部成像测试中得分均高于接受PK的参与者。

但真实情况并非如此。2010年报告的一项有77名参与者的试验显示，在术后长达两年时间内，两种手术效果相似。

“在外行看来，这显然是一个真实的数据集。”英国曼彻斯特大学生物统计学家Jack Wilkinson说。

此外，Wilkinson还对其他版本的大语言模型生成的数据集进行了检查，他表示这些数据集缺乏令人信服的证据，因为它们难以准确捕捉变量之间的关系。

应Nature新闻团队的要求，Wilkinson和他的同事Zewen Lu评估了这个伪造的数据集。

结果显示，许多“参与者”的性别和名字不匹配。此外，术前和术后进行的视力测量及眼部成像测试之间缺乏相关性。Wilkinson和Lu还检查了数据集中是否存在非随机的模式，眼部成像数值通过了这个测试，但年龄值以7或8结尾的参与者人数过多。

研究人员承认他们的数据集存在缺陷，只要仔细观察就能发现端倪。意大利卡利亚里大学眼科外科医生、研究的合著者Giuseppe Giannaccare说：“我们的目的是强调，在短短几分钟内，你就可以创建一个没有真实数据支持的数据集，这些数据可以支持或反驳已有的科学证据。”

AI能够深度伪造数据，这大大增加了研究人员和期刊编辑对研究诚信的担忧。

微生物学家、职业学术打假人Elisabeth Bik表示，这意味着，研究人员能够轻而易举地生成大量虚假数据集。

EMBO Reports的主编Bernd Pulverer也认为这是一个令人担忧的问题。“实际上，同行评审往往不会重新分析研究的数据，因此不太可能发现AI精心策划的违规行为。”Pulverer补充说，“期刊需要更新质量检查以识别AI伪造的数据。”

Wilkinson正在领导一个项目，主要是设计工具评估有问题的研究。“AI是导致问题产生的原因，但我们也可以基于AI自动化检查其中一部分。”但他警告说，“AI的进步可能很快就可以规避这些检查。”

参考链接：

https://www.nature.com/articles/d41586-023-03635-w

近期资讯

gygfth 2024-12-27

N06625（一种镍基高温合金）具有良好的热加工、冷加工和机械加工性能

1. 基本信息 N06625，也称为Inconel 625，是一种镍基高温合金，以其卓越的耐腐蚀性和高温强度而闻名。这种材料在航空航天、石油化工、核工业等多个领域得到了广泛应用。 2. 化学成分 N06625的化学成分如下： · 碳(C)：≤0.10% · 硅(Si)：≤0.50% · 锰(Mn)：≤0.50% · 磷(P)：≤0.015% · 硫(S)：≤0.015% · 镍(Ni)：≥58.0% · 铬(Cr)：20.0～23.0% · 铁(Fe)：≤5.0% · 钼(Mo)：8.0～10.0% ·

上海钢泽合金 2024-12-27

彰显企业风采，专业为您呈现——中科致研企业简介PPT设计，让品牌形象熠熠生辉！

企业简介PPT能够提升企业形象，加强市场竞争力，提高商务沟通效率，吸引投资，以及体现公司的专业性。具体体现如下：1、品牌形象塑造：企业简介PPT是企业形象的重要展示窗口，一个专业、有吸引力的PPT能够有效地传达企业的核心价值观、业务范围和实力，有助于塑造良好的品牌形象。2、商务沟通效率：在商务沟通中，一份高质量的企业简介PPT能够提高信息传递的效率，让客户或合作伙伴在短时间内了解企业，促进合作。3、市场竞争力：在激烈的市场竞争中，企业需要通过各种方式提升自己的竞争力。专业的PPT设计能够体现企业的专业性和

中科致研 2024-12-27

05Cr17Ni4Cu4Nb（一种沉淀硬化型马氏体不锈钢）主要合金元素

1. 概述 05Cr17Ni4Cu4Nb，也称为17-4PH，是一种沉淀硬化型马氏体不锈钢材料。这种不锈钢以其特定的化学成分和独特的物理特性，在工程领域中占有重要地位。其名称中的数字与字母组合代表了它的主要合金元素及其大致含量，这些元素共同决定了材料的性能和应用范围。 2. 化学成分 05Cr17Ni4Cu4Nb的化学成分如下： · 碳(C)：≤0.07% · 硅(Si)：≤1.00% · 锰(Mn)：≤1.00% · 磷(P)：≤0.040% · 硫(S)：≤0.030% · 铬(Cr)：16.00-1

上海钢泽合金 2024-12-27

轩展科技 | 无人机风机叶片检测，SONY ILX-LR1全画幅相机的适配优势

SONY ILX-LR1全画幅相机以其约6100万有效像素的高分辨率成像能力，为无人机风机叶片检测提供了前所未有的细节捕捉能力。这款相机的轻量化设计，机身重量仅243克，极大地减轻了无人机的负载，同时保持了设备的紧凑性，使其能够灵活地安装在无人机上，而不会对飞行性能造成明显影响。 [图片] 一、小型轻便 SONY ILX-LR1相机非常小巧轻便，机身尺寸仅为约100x74.0x42.5mm，重量轻约243克，这样的尺寸和重量设计，使得它非常适合安装在无人机上进行高空作业。相较于传统的大型相机，ILX-LR

轩展科技 2024-12-27

新疆可以买抵押车吗

在新疆购买抵押车是否可行呢？答案是肯定的。首先，抵押车与普通二手车不同，它通常是因为车主未能按时偿还贷款而被银行或金融机构出售的车辆。由于贷款未结清，车主未能完全拥有车辆的所有权，因此，抵押车在交易过程中出售的是债权，并非所有权，这也是为什么之所以便宜的原因。在新疆，抵押车市场逐渐成熟，许多消费者通过专业的抵押车平台了解和购买抵押车。这些平台提供了详尽的车辆信息，包括车况、里程数等，让消费者能够做出明智的购车决策。通过这些渠道购买的抵押车通常价格相对较低，适合预算有限的消费者，尤其是在一些经济发展相对

绮绱抵押车交易网 2024-12-27

难辨真假！研究人员使用ChatGPT生成数据集支持科学假说

推荐体验

相关资讯

研究显示ChatGPT对学术诚信造成威胁，为科学假说生成虚假数据集

研究显示 ChatGPT 可为科学假说生成虚假数据集，对学术诚信造成威胁

新研究：ChatGPT可伪造看似合理“支持”科学假说的试验数据

研究报告：ChatGPT可伪造看似合理“支持”科学假说的试验数据

（科技）新研究：ChatGPT可伪造看似合理“支持”科学假说的试验数据

近期资讯

S32760（一种超级双相不锈钢）综合性能优良

冲头崩裂用8566模具钢，新旧社会两重天，别等撞了南墙才醒悟。第535篇

企业选用客服系统，优势尽显领跑行业

【喷雾除尘设备价格】-山东艾蓝设施-设备厂家

高中政治选择题满分技巧（可打印）

N06625（一种镍基高温合金）具有良好的热加工、冷加工和机械加工性能

彰显企业风采，专业为您呈现——中科致研企业简介PPT设计，让品牌形象熠熠生辉！

05Cr17Ni4Cu4Nb（一种沉淀硬化型马氏体不锈钢）主要合金元素

轩展科技 | 无人机风机叶片检测，SONY ILX-LR1全画幅相机的适配优势

新疆可以买抵押车吗

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响