火出天际的Chatgpt，这次几乎通过了美国执业医师执照考试！

作者：社工师罗先生发布时间：2023-02-11

ChatGPT 编程

来源：世界风情画（ID：finkeeper）

作者：妤妤姐

超越抖音，在3个月内实现1亿注册用户，能够答问题、写论文、编代码的巨型语言模型AI，ChatGPT如今又创造新的奇迹了！

（杂杂妹：看看朕的情报总监，今天又发现啥趣闻了？）

参加美国执业医师考试，并拿到几乎75%的高分！

（杂杂妹：哇，不得了，这种“天下第一考”都能拿到如此高分，真是医生都有些坐不住了！）

其实人工智能在医学中的应用已经非常广泛了。

比如在医学影像、健康管理、疾病风险预测、虚拟助理、药物设计、临床诊疗、精神疾病、病理学和营养学等领域，都可以看到人工智能的影子。

目前，医疗活动中比较成功的AI应用包括影像AI、药物研发AI、医疗机器人和IBM Waston等。

特别是在医学影像中。AI取得了较好的应用成效，如基于钼靶影像的乳腺病变检测、基于皮肤照片的皮肤癌分类诊断、基于数字病理切片的乳腺癌淋巴结转移检测、基于眼底照片的糖尿病视网膜病变检测、基于胸部X线片的肺部炎性疾病。借助深度学习，药物研发AI在心血管药、抗肿瘤药和常见传染病治疗药等领域取得新突破，缩短了药物研发时间、提高了研发效率且控制了研发成本。

在外科领域，医疗机器人中的达·芬奇机器人早已在各大医院推广应用，其他类型的机器人也随着AI的发展逐步进入医疗市场。

而Chatgpt作为大型语言模型参与医学考试，也是精彩的最新“成功跨界”。

因为这意味着，以后问诊工作也可以由人工智能助上病患一臂之力。

而这次，OPENAI的科技人员在2023年2月，组织了一次由Chatgpt参与的美国执业医师资格证考试。

严格来说，这场“考试”共有三次，目的是检测面对不同题型时，Chatgpt“知识点”的牢固程度。

而美国执业医师考试要求是学习了5年医学院以上课程的医学生，还要大约花费300到400小时准备才能完成的考试，它涵盖了从基础科学概念到生物伦理学的所有内容。“在没有任何专门训练或强化的情况下，ChatGPT在所有三项考试中的表现都达到或接近及格线，”研究人员在他们的发表的论文中表示，"此外，ChatGPT在其解释中表现出高度的一致性和洞察力."

Ansible Health初创公司的研究人员使用USMLE（美国执业医师考试）的样本问题对其进行了测试，他们检查了搜索引擎上没有的答案，因此他们知道ChatGPT将根据它接受训练的数据生成新的响应。

在测试中，ChatGPT在三次考试中的得分在52.4%到75%之间(及格分数通常在60%左右)。在其88.9%的回答中，它产生了至少一个重要的见解——被研究人员描述为“新的、非显而易见的、临床有效的”东西。

“在这种众所周知的困难的专家考试中达到及格分数，并且在没有任何人类强化的情况下做到这一点，标志着临床人工智能成熟的一个显著里程碑，”该研究的作者在一份新闻声明中说。

ChatGPT的回答也令人印象深刻地一致，甚至能够提供每个回答背后的推理。它还击败了专门训练医学文献的机器人PubMedGPT 50.3%的准确率。

值得记住的是，ChatGPT接受培训的信息会包含不准确的内容:如果你问问机器人本身它将承认需要做更多的工作来提高LLMs的可靠性。在可预见的未来，它不会取代医疗专业人员。

然而，解析在线知识的潜力显然是巨大的，特别是随着这些人工智能机器人在未来几年继续变得更好。他们可能会成为医生的重要助手，而不是取代医生。

“这些结果表明，大型语言模型可能有助于医学教育，并可能有助于临床决策。”研究人员在论文中写道。