来源:世界风情画(ID:finkeeper)
作者:妤妤姐
超越抖音,在3个月内实现1亿注册用户,能够答问题、写论文、编代码的巨型语言模型AI,ChatGPT如今又创造新的奇迹了!
(杂杂妹:看看朕的情报总监,今天又发现啥趣闻了?)
参加美国执业医师考试,并拿到几乎75%的高分!
(杂杂妹:哇,不得了,这种“天下第一考”都能拿到如此高分,真是医生都有些坐不住了!)
其实人工智能在医学中的应用已经非常广泛了。
比如在医学影像、健康管理、疾病风险预测、虚拟助理、药物设计、临床诊疗、精神疾病、病理学和营养学等领域,都可以看到人工智能的影子。
目前,医疗活动中比较成功的AI应用包括影像AI、药物研发AI、医疗机器人和IBM Waston等。
特别是在医学影像中。AI取得了较好的应用成效,如基于钼靶影像的乳腺病变检测、基于皮肤照片的皮肤癌分类诊断、基于数字病理切片的乳腺癌淋巴结转移检测、基于眼底照片的糖尿病视网膜病变检测、基于胸部X线片的肺部炎性疾病。 借助深度学习,药物研发AI在心血管药、抗肿瘤药和常见传染病治疗药等领域取得新突破,缩短了药物研发时间、提高了研发效率且控制了研发成本。
在外科领域,医疗机器人中的达·芬奇机器人早已在各大医院推广应用,其他类型的机器人也随着AI的发展逐步进入医疗市场。
而Chatgpt作为大型语言模型参与医学考试,也是精彩的最新“成功跨界”。
因为这意味着,以后问诊工作也可以由人工智能助上病患一臂之力。
而这次,OPENAI的科技人员在2023年2月,组织了一次由Chatgpt参与的美国执业医师资格证考试。
严格来说,这场“考试”共有三次,目的是检测面对不同题型时,Chatgpt“知识点”的牢固程度。
而美国执业医师考试要求是学习了5年医学院以上课程的医学生,还要大约花费300到400小时准备才能完成的考试,它涵盖了从基础科学概念到生物伦理学的所有内容。“在没有任何专门训练或强化的情况下,ChatGPT在所有三项考试中的表现都达到或接近及格线,”研究人员在他们的发表的论文中表示,"此外,ChatGPT在其解释中表现出高度的一致性和洞察力."
Ansible Health初创公司的研究人员使用USMLE(美国执业医师考试)的样本问题对其进行了测试,他们检查了搜索引擎上没有的答案,因此他们知道ChatGPT将根据它接受训练的数据生成新的响应。
在测试中,ChatGPT在三次考试中的得分在52.4%到75%之间(及格分数通常在60%左右)。在其88.9%的回答中,它产生了至少一个重要的见解——被研究人员描述为“新的、非显而易见的、临床有效的”东西。
“在这种众所周知的困难的专家考试中达到及格分数,并且在没有任何人类强化的情况下做到这一点,标志着临床人工智能成熟的一个显著里程碑,”该研究的作者在一份新闻声明中说。
ChatGPT的回答也令人印象深刻地一致,甚至能够提供每个回答背后的推理。它还击败了专门训练医学文献的机器人PubMedGPT 50.3%的准确率。
值得记住的是,ChatGPT接受培训的信息会包含不准确的内容:如果你问问机器人本身它将承认需要做更多的工作来提高LLMs的可靠性。在可预见的未来,它不会取代医疗专业人员。
然而,解析在线知识的潜力显然是巨大的,特别是随着这些人工智能机器人在未来几年继续变得更好。他们可能会成为医生的重要助手,而不是取代医生。
“这些结果表明,大型语言模型可能有助于医学教育,并可能有助于临床决策。”研究人员在论文中写道。
1、DAVID NIELD:ChatGPT Can Almost Pass The US Medical Licensing Exam(Science Alert)