JAMA：ChatGPT展示了AI在诊断复杂医疗问题的巨大潜力

作者：生物世界发布时间：2023-06-18

JAMA：ChatGPT展示了AI在诊断复杂医疗问题的巨大潜力

撰文丨王聪

编辑丨王多鱼

排版丨水成文

ChatGPT，是由人工智能研究实验室 OpenAI 于2022年11月30日发布的全新聊天机器人模型——人工智能技术驱动的自然语言处理工具。ChatGPT能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，还能完成撰写邮件、视频脚本、文案、翻译、代码等任务。自推出以来，ChatGPT强大的能力备受关注。

2023年3月14日，OpenAI发布升级版的GPT-4，其回答准确性大幅提升，还具备更高水平的识图能力。

2023年6月15日，哈佛医学院贝斯以色列女执事医疗中心的研究人员在国际四大医学期刊之一的《美国医学会杂志》（JAMA）上发表了题为：Accuracy of a Generative Artificial Intelligence Model in a Complex Diagnostic Challenge 的论文。

研究团队测试了GPT-4在具有挑战性的医疗病历中的做出准确诊断的能力，测试结果显示，生成式人工智能GPT-4在近40%的时间里选择了正确的诊断作为其首要诊断，并在三分之二的具有挑战性的病例中提供了正确的潜在诊断。

生成式人工智能（Generative AI）指的是一种人工智能，它使用经过训练的模式和信息来创建新内容，而不是简单地处理和分析现有数据。生成式人工智能的最著名的例子就是火遍全球的聊天机器人ChatGPT，它使用人工智能的一个分支——自然语言处理（NLP），使计算机能够理解、解释并生成类似人类的语言。

基于生成式人工智能的聊天机器人是一种强大的工具，有望彻底改变创意产业、教育、客户服务等领域。然而，人们对它们在临床环境中的潜在表现知之甚少，比如复杂的诊断推理。

该论文的通讯作者、哈佛医学院的 Adam Rodman 博士认为，人工智能的最新进展为我们带来了生成式人工智能模型，这些模型能够基于文本的详细反应，在标准化的医学检查中取得高分。我们想知道这样一个生成式人工智能模型是否能像医生一样“思考”，所以我们要求一个模型来解决用于教育目的的标准化复杂诊断案例。而结果显示，它做得非常非常好。

为了评估聊天机器人GPT-4的医疗诊断技能，研究团队使用了临床病理病例会议（CPC）发布的一系列复杂且具有挑战性的患者病例，包括相关的临床和实验室数据、成像研究和组织病理学发现。

在评估70例CPC病例时，GPT-4的诊断结果中有27例（39%）与CPC诊断完全匹配。在64%的病例中，CPC诊断包括在了GPT-4的诊断列表中，这写诊断列表包含了可能的疾病类型，可以解释患者的症状、病史、临床表现和实验室或成像结果。

GPT-4的诊断得分，5分代表诊断完全准确，4分代表诊断中包含一些非常接近但不准确的结果，3分代表诊断中包括一些密切相关的可能有帮助的结果，2分代表诊断中包括一些相关内容但不太可能有帮助，0分代表没有接近目标的诊断结果。

论文第一作者、哈佛医学院医学助理教授 Zahir Kanjee 表示，虽然聊天机器人还不能取代训练有素的医疗专业人员的专业知识，但生成式人工智能是人类诊断认知的一个很有前途的潜在辅助工具。它有可能帮助医生理解复杂的医疗数据，拓宽或改进我们的诊断思维。我们需要对这项技术的最佳用途、益处和局限性进行更多的研究，还有很多隐私问题需要解决，但这对未来的诊断和病人护理来说，都是令人兴奋的发现。

这项研究进一步证明了人工智能技术在医疗诊断领域的应用前景，进一步的调查将有助于我们更好地了解这些新型人工智能模型如何改变医疗保健服务。

论文链接：

https://jamanetwork.com/journals/jama/article-abstract/2806457