笑死，ChatGPT竟然出现在论文共同作者栏：我研究我自己，怎么啦？

作者：新智元发布时间：2023-01-13

ChatGPT

ChatGPT竟然成论文的共同作者了？

在去年12月发表的一篇预印本论文中，我们惊讶地发现，作者一栏中赫然惊现了ChatGPT！

论文地址：https://www.medrxiv.org/content/10.1101/2022.12.19.22283643v1.full

ChatGPT这是成精了？

虽然大家都知道，ChatGPT拥有超强的写作能力，但是，它已经能和人类合作，写出一篇研究自己的论文了吗？

（没准还真行）

带着一百个问号，小编点开这篇论文开始仔细研究，不过读完之后，一百个问号变成了一千个。

就是说，并没有看出哪句话是ChatGPT写的。只能说，ChatGPT的确在研究中扮演了十分重要的角色。

然而，这就更加让人困惑了：一个生物学实验中有了小白鼠参与，小白鼠就可以出现在作者栏里吗？（恒河猴、羊驼、兔子、果蝇纷纷表示不服

）

对此，网友也看懵了：也不知道是他们强迫ChatGPT去参加USMLE考试更有趣，还是让人工智能成为论文作者更有趣。

被迫参加考试，还成了论文作者

所以，在这篇论文中，ChatGPT究竟是扮演了怎样的角色呢？

让咱们来捋一捋。

文章标题是《ChatGPT在USMLE上的表现：使用大型语言模型进行AI辅助医学教育的潜力》。

总的来说，就是研究人员让ChatGPT参加了一个美国的医学执照考试。

为什么选择这个考试呢？

这是因为，这个考试的难度很高，问题非常复杂（无论是语言上，还是概念上），同时呢，又有着高度标准化的规范。

巧了不是，这些恰恰都是AI的强项。

没有经过专门的训练或强化，ChatGPT在三项考试中几乎都及格了，或是接近及格。并且，在ChatGPT的答卷，给了研究者很大的惊喜。

下面咱们来具体说说。

USMILE有多难

美国的医学执照考试USMILE，涵盖了基础科学、临床推理、医疗管理和生物伦理学。

它的问题在文本和概念上都很密集。

试题的小插图中，包含大量多模态的临床数据（包括病史、体格检查、实验室值和研究结果），而参加考试的学生，需要做出诊断，鉴别出许多模棱两可的情景。

论LLM与USMILE的适配性

研究者为什么看上了ChatGPT作为「小白鼠」呢？

以往的AI模型，主要是深度学习 (DL) 模型，用于学习和识别数据中的模式。

而ChatGPT属于通用大规模语言模型（LLM）。基于新型AI算法，经过训练的LLM可以根据前面单词的上下文，预测一个给定的单词序列的可能性。

因此，如果能够在足够大的文本数据上进行训练，那么LLM便可以生成从未观察到的新词序列，而这些语句，都是基于自然人类语言的合理序列。

不许刷题，ChatGPT零准备上考场

ChatGPT之所以强大，是因为它站在GPT3.5的肩膀上。而GPT3.5是在OpenAI 175B参数基础模型上训练出来的，另外，它还通过强化和监督学习方法，从网络上获取了大量的文本数据。

但是这次，ChatGPT是完全的「裸考」了。

这次的试题，是研究者在2022年6月，从USMILE的官方样题中抽取的376道公开试题。

并且，研究者进行了随机抽查，确保这些题在2022年1月1日以前并没有相关内容被收录进谷歌索引。

要知道，ChatGPT的训练数据集就截止在这个时间之前。也就是说，ChatGPT事先并没有见过这些题。

实验方法概述

结果，ChatGPT在考试中越战越勇，准确性不断提高，这说明，它在不断学习，不断完善自己。

到最后，它逐渐逼近甚至超过了USMILE的及格线。

ChatGPT在USMLE中的表现相当优异

另外，在考试中，ChatGPT还会针对问题产生新的见解，这就可以帮助人类更好地理解问题。

在实验中，研究者引入了一个量化AI生成的解释中包含的洞察力密度（DOI）。可以观察到，ChatGPT的DOI在回答准确的问题中，明显比不准确的问题要高。

这些数据表明，人类学习者如果回答不正确，可以从ChatGPT的输出中获得新见解，来进行补救。

就是说，ChatGP不光自己会在全新的试题中自学成学霸，还能用来帮助人类学渣。

总之，最后研究者得出结论：大型语言模型在医学教育和临床决策上，都有巨大的应用潜力。

嗯，道理咱都懂，可是论文读到最后都没搞明白，ChatGPT怎么就成共同作者了呢？

莫非是研究者觉得，ChatGPT参加了考试，作了答，所以「对本文亦有贡献」？

在医学界，ChatGPT「高产似母猪」

你有没有发现，医学领域的研究人员对「GPT」可谓是达到了痴迷的程度。

不仅仅是我们这次的主角，文章最开始提到的那篇也是出自一个「神经科学和生理学研究所」。

而ChatGPT的名字，自去年12月起，更是频繁地出现在该领域一些经过同行评审的论文当中：

论文地址：https://www.oncoscience.us/article/571/text/

不过，在这篇论文中，ChatGPT是正经写了内容的，咱们一眼就能看出来。

另外，还有下面这篇论文，ChatGPT在作者栏中，也占了二分之一的名额。

论文地址：https://www.sciencedirect.com/science/article/abs/pii/S1471595322002517

怎样才能算是论文作者？

一篇论文怎么署名，是一件大事。

作者署名赋予了作者名誉，也有重要的学术、社会和经济意义。

ChatGPT何德何能，和专家们一同登上作者栏呢？

对此，我们问了问ChatGPT是怎么看的：

其实，关于作者的职责，只需随手一搜就能找到很多详细的讲解。

既然都是医学领域的论文，不如我们就来看看ICMJE（国际医学期刊编辑委员会）都有哪些建议。

简单来说，可以概括为以下四点：

1. 对研究的思路或设计有重要贡献，或者为研究获取、分析或解释数据；

2. 起草研究论文或者在重要的智力性内容上对论文进行修改；

3. 对将要发表的版本作最终定稿；

4. 同意对研究工作的各个方面承担责任以确保与论文任何部分的准确性或诚信有关的质疑得到恰当的调查和解决。

所有被指定为作者的人都应该满足作者署名的4条标准，而所有满足以上4条标准者也都应该被确定为作者。未满足全部4条标准者应该出现在致谢部分。

现在问题来了，ChatGPT符合几条呢？

参考资料：

https://www.medrxiv.org/content/10.1101/2022.12.19.22283643v1.full

https://www.icmje.org/recommendations/translations/chinese2018.pdf

本文来自微信公众号“新智元”（ID：AI_era），作者：新智元，36氪经授权发布。

近期资讯

CPO薪资倒挂CEO，创业公司薪酬情况大起底

在创业公司的世界里，薪酬结构总是充满惊喜。你知道吗？有时候，CEO的薪酬可能并不是公司里最高的。本文深入探讨了初创公司中不同职位的薪酬情况，特别是首席产品官（CPO）的薪资如何可能超过CEO。

量子位 2024-12-28

你可能需要避免的5个react的ref错误用法

前言 react是一个优秀的框架，提供了我们很多的便利，但是在使用的过程中，我们也会遇到很多的问题，其中一个就是ref的使用，以下是我列出的5个使用ref的错误用法，并提供了正确的用法。错误1: 当

夕水 2024-12-28

重磅：DeepSeek V3问世，MoE架构引领大模型性价比革命

DeepSeek-AI 在2024年年末给 AI 世界送上了一份重磅惊喜，发布了全新一代大语言模型 DeepSeek V3。

几米哥 2024-12-28

平台与商家，携手穿越周期

在数字化时代，平台经济的健康发展对商家和消费者都至关重要。本文深入探讨了2024年平台经济的分水岭，分析了政策支持、公司盈利能力提升以及平台与商家如何共同穿越经济周期的复杂关系。

光子星球 2024-12-28

听筒Tech 2024-12-28

即时零售行业复盘：2024年10大关键词！

2024年即将远去，尽管全球经济增速放缓，行业竞争加剧，但即时零售行业却依然保持着高速增长。对于这一年，即时零售从业者由于经历不同，角度不同，评价也千差万别。作为即时零售领域的资深研究人员，刘老实总结提炼了以下十个关键词，与大家分享。

即时刘说 2024-12-28

领导：按规范提交代码conventionalcommit

https://www.conventionalcommits.org/en/v1.0.0/ 规范的使用和理解

吴敬悦 2024-12-28

笑死，ChatGPT竟然出现在论文共同作者栏：我研究我自己，怎么啦？

被迫参加考试，还成了论文作者

USMILE有多难

论LLM与USMILE的适配性

不许刷题，ChatGPT零准备上考场

在医学界，ChatGPT「高产似母猪」

怎样才能算是论文作者？

推荐体验

相关资讯

我用 ChatGPT 来润色我的论文，现在我吓坏了

ChatGPT没出现在中国是因为差钱？

【AI绘画】出现在舞台的女仆

为什么Sora没有出现在中国？

低空经济概念“起飞啦”！指数冲高回落，这是怎么啦？

近期资讯

CPO薪资倒挂CEO，创业公司薪酬情况大起底

你可能需要避免的5个react的ref错误用法

重磅：DeepSeek V3问世，MoE架构引领大模型性价比革命

平台与商家，携手穿越周期

胖东来应该大胆做电商生意

从大模型到自动驾驶，李想的21个最新思考

怎么通过抖音和小红书获客？做同城生意老板必看

妈妈们的钱包，被巨贵的广播剧掏空了

即时零售行业复盘：2024年10大关键词！

领导：按规范提交代码conventionalcommit

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响