ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病

作者：丁香园发布时间：2023-02-15

ChatGPT

背景

最近，一个名叫 ChatGPT聊天机器人程序引发热潮。这个 AI 程序能够通过学习，理解人的语言互动，自然、准确地与人对话。

在 ChatGPT 问世后一个月内，它就考过了美国医师执照考试，还以一作身份发表了一篇肿瘤学论文。

未来 ChatGPT 会取代医生吗？它能够看病问诊、开处方写病历吗？为明确这一问题，我们特开展《关于 ChatGPT 与专业医生在线问诊能力的比较研究》。

方法

我们选取了来自丁香医生在线问诊平台的 6 个公开真实问诊案例，测试 ChatGPT 能否顺利回答来自病人的问题。

这些案例覆盖神经内科、心内科、普外科等不同科室，主诉为临床上常见如头晕、胸痛等症状。其中，每位患者可以根据实际情况对医生进行 1～3 次追问。为保护患者隐私，涉及个人信息、影响学结果、症状图片等未公布。

结果评估方法：我们将 ChatGPT 回答与丁香医生在线问诊平台认证医生的回答进行对比，医生职称从主治到主任医师不等。

此外，我们引入丁香医生在线问诊平台审核团队，对 ChatGPT 回答的医学专业性与服务性进行评估。

医学专业性审核说明：隐去医生和患者姓名等信息后，平台邀请 2 位及以上临床一线专家进行交叉审核，最终综合所有专家意见得出结果。

服务性审核说明：隐去医生和患者姓名等信息后，由具有医学背景的平台工作人员对回复的合规性、完整性和文字表达进行评估。

专业医生问诊结果作为平台公开内容，此前已通过上述两项审核，结果均为良好-优秀，因此文中不再做单独说明，仅展示对 ChatGPT 回答的审核结果。

结果

01. 神经内科案例，主诉头晕

问诊医生：浙江大学医学院附属第二医院神经科董毅副主任医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

缺少必要的追问：应进一步追问患者相关症状，以进行头晕的定位定性诊断。

专业性解释错误、治疗方案错误：耳石症是一种遗传性疾病，有可能与脑动血管供血不足有关，这个说法是错误的，服用抗炎药物的依据不足。

服务性审核结果：不完善。

缺少追问环节，三次诊断不一致，用药建议不具体。

02. 心内科案例，主诉胸痛

问诊医生：武汉大学人民医院心血管内科吕永楠副主任医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问：针对左侧胸痛、心率增快，需要进一步追问，疼痛的性质、持续时间、伴随症状、既往病史等，需要排查心血管、内分泌、神经痛等器质性病变。

诊疗建议不妥：您的症状可能是由于心脏功能不足造成的，判断依据不足。

服务性审核结果：良好。

缺少追问环节；存在生活建议，但部分不够具体。

03. 内分泌科案例，主诉糖尿病

问诊医生：中日友好医院内分泌科洪靖主任医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问：首先患者基本信息未确认，相关疾病史收集不全面。

诊疗建议不全：需根据患者的基本情况，目前的血糖情况，调整降糖方案。糖尿病患者教育内容不全：包括血糖控制的目标值（糖化血红蛋白<7%）、血糖的检测等都有缺失。对于生活饮食建议缺少针对性。

服务性审核结果：不完善。

缺少追问环节；用药建议不具体；存在生活建议，但部分不够具体。

04. 普外科案例，主诉痔疮

问诊医生：首都医科大学附属北京朝阳医院普外科胡子龙主治医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

关于肛周异物：需要进行追问，尤其是图片等明确诊断，明确为痔疮还是其他的疾病，尤其是需要排除肛周脓肿，同时针对评估的情况，明确严重程度，是手术治疗还是药物治疗，整个回答不具有个体化的执行性，达不到问诊预期；关于膏药经期是否能够使用：缺少必要的追问、诊断、判断，而直接建议专科咨询，不具有个体化的执行性，达不到问诊预期。

服务性审核结果：良好。

缺少追问环节；给出了多种治疗方案；三次回复未贯通。

05. 乳腺外科案例，主诉乳房硬块

问诊医生：广东省人民医院乳腺外科肖伟锴主治医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

由于检查结果没有上传，无法评估当地医院建议手术的正确性。

服务性审核结果：良好。

缺少追问环节。

06. 甲状腺外科案例，主诉甲状腺结节

问诊医生：华中科技大学同济医学院附属协和医院甲状腺外科谭捷主治医师

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台审核结果

专业性审核结果：不通过。

针对甲状腺结节的情况没有看到前后报告的对比，无法给出针对性的个体化可执行的建议；

关于医院的结果，由于没有报告，无法评估本地医院诊疗建议是否合理。这个回答不具有针对性，无法达到患者的预期。

服务性审核结果：良好。

缺少追问环节；存在生活建议，但不够具体。

讨论

在 6 次问诊测试中，ChatGPT 能够对于患者提出的问题进行回答，对相关医学名词作出解释，并给出部分医学相关建议：包括临床用药、生活方式等。

在医学专业性审核中，ChatGPT 均未通过。与专业医生回答情况对比，主要差异在于：缺少对于患者病史有针对性的追问、对专业医学名词解释错误、诊疗方案不全面或有误、对患者的建议不够具体。

在服务性审核结果中，ChatGPT 共 4 次评估为良好，2 次为不完善。与专业医生回答情况对比，主要差异在于：缺少对于患者病史有针对性的追问、对患者的建议不够具体、几次回复结果不贯通。

局限性：为保护用户隐私，症状图片或影像学检查结果没有公布，导致 ChatGPT 或丁香医生问诊专业评审团队均无法基于相关结果进行评估。此外，由于对患者的后续追问主要是由原案例医生引导进行，可能导致 ChatGPT 理解存在差异。

策划：gyouza｜技术支持：丁香医生问诊团队

题图来源：丁香医生设计+自己 P 的

丁香园是面向医疗从业者的专业平台，以「助力中国医生」为己任。下载「丁香园 App」可以和同行讨论病例，在线学习公开课，使用用药助手等临床决策工具，在丁香人才找可靠医疗岗位。

↓↓↓ 35% 论坛站友认为医生会被 ChatGPT 取代，点击阅读原文参与热议

ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病

推荐体验

相关资讯

ChatGPT 能让医生失业？他们直接请了 70 多个病人来 PK

ChatGPT爆火！AI或替代医生？医生是否会失业？

医生用 ChatGPT 帮你看病，越来越有必要

ChatGPT能代替医生看病吗？浙一专家这套考题，结果令人意外

ChatGPT能看病吗？医生出了一百道单选题，它没及格

近期资讯

凭高颜值大火，“年轻人第一辆车”，上市即遭退订潮？有门店一半订单被退，品牌方发声：遭到恶意攻击

贡献2亿收入，游戏化小程序助力布鲁可成“谷子第一股”

会说话的汤姆猫被AI"变活"了，AI玩具成了下一个超级风口？

“总有人想掌控我的手机”

“消失”在公众视野9个月后，李想“回归”，解释了为什么他要买一辆法拉利

聊天机器人陷阱：人工智能需要新的UI

保质期半年的“预制饭”，加了多少防腐剂？

只有46人的藻油DHA企业纽曼思要IPO了

日本人决定自己拯救日产车

大模型的2024年：我们对AI的发展脱敏了

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响