谷歌医疗版ChatGPT已在诊所实测！可生成诊断做总结，多个指标和真人医生相当

作者：量子位发布时间：2023-07-10

谷歌医疗 ChatGPT 华尔街

明敏发自凹非寺

量子位 | 公众号 QbitAI

谷歌对外发布才2个月的医疗大模型 Med-PaLM 2，已经“偷偷”在医疗诊所实习很久了。

《华尔街日报》爆料，早在今年4月（也就是对外发布前），Med-PaLM 2就开始在多家诊所内测试。

负责的工作包括回答医疗问题、总结文件或处理医疗大数据等。

基于谷歌当下最先进的大语言模型PaLM 2以及大量医疗数据训练，Med-PaLM 2是第一个在MedQA测试集中达到“ 专家”水平的AI大模型。

谷歌曾经表示，在医疗领域，Med-PaLM 2的效果优于Bard、Bing、ChatGPT等通用大模型。

实际上，谷歌最新被曝光的这一动作，也被视为和微软竞争的一个方面。

毕竟ChatGPT爆火引发了医疗系统对于AI提升工作效率的新一轮思考，而基于GPT-4能力的AI工具，被曝已经为130个诊所、600名以上医疗工作者提供服务。

所以，谷歌在AI医疗的新一轮发力，进展如何？

Med-PaLM 2能力如何？

Med-PaLM 2基于谷歌当下最先进的大语言模型PaLM2，PaLM 2具备 3400亿参数、3.6万亿tokens。

它的前身Med-PaLM是首个在美国医疗执照考试（USMLE）中取得“及格”以上分数的AI模型，在MedQA数据集上的得分为67.2。

Med-PaLM 2将这一分数提升了19%，达到 86.5。

并且在MedMACQA、PubMedQA和MMLU几个临床方面的数据集上性能 接近或超过SOTA。

在1000多个实际医疗场景问答中，Med-PaLM 2在9项基准测试中，有8项表现良好， 相较于人类医生回答更受认可。

和普通医生的回答相比，Med-PaLM 2有 72.9%的回答被认为是和医生回答相对一致的。

但这些数据距离Med-PaLM 2能被完全投入到实际医疗场景中应用，还有一段距离。

参与Med-PaLM 2研发的谷歌技术高管格雷格•科拉多(Greg Corrado)也表示，目前这一技术的应用仍处于早期阶段。

它还没有到达能让人放心使用的程度。

最明显的就是Med PaLM 2在回答问题的准确性和稳定性上，表现依旧不是很好。

比如上面的测试中Med PaLM 2唯一一项没有被认可的基准测试，就是“信息准确性/相关性”。

今年世卫组织也对LLM回答的不稳定性表示担忧。

除此之外，AI在医疗领域的应用上，数据问题非常关键，这涉及到患者的个人隐私。此前DeepMind开发的医疗软件就被发现，违法使用了160万份患者诊断记录。

在这方面，谷歌声明所有数据将由医疗机构负责保管，谷歌是无法拿到的。

尽管在实际应用落地中存在诸多困难，但不可否认，AI医疗领域现在已成为科技巨头们紧盯的一块重要阵地。

科技巨头一直紧盯医疗领域

正如谷歌曝光邮件中所写的那样，Med-PaLM 2等医疗大模型的应用，能够给医疗资源紧张地区提供很大帮助。

近年来，如微软、谷歌、IBM等科技大厂也在持续关注AI医疗方面的应用落地。在这轮大模型浪潮之前，AI检测心电图、X光片已在一些医院中投入应用。

而ChatGPT一来，AI医疗有了更多实质性进展。

比如微软和医疗软件公司Epic合作，开发了一种基于ChatGPT的工具，可以向患者自动发送信息。

还有Carbon Health也基于GPT-4推出了一种AI工具，可以根据医生病人之间的对话，自动生成诊断记录。

据介绍，这个工具可以在4分钟内完成咨询的总结，比医生自己操作快12分钟。

目前这个AI工具已经被130+家诊所、超过600名医疗人员使用，旧金山的一家诊所表示在使用了这个工具后来就诊的病人数量增加了30%。

以及国内也有这方面进展。

MedGPT——基于Transformer的1000亿参数大模型，目前共接诊120多名患者，从问诊、检查到诊疗方案全流程覆盖。

但在大厂们热烈推进AI医疗应用的另一边，不少人对于这种应用还表示比较担忧，毕竟医疗行业是非常严肃的一个领域。

有人就表示，LLM产生的“幻觉”非常多，他不相信LLM能帮他完成研究。

还有数据隐私方面的担忧，更是老生常谈了。

不过如果仅仅是让AI帮助医生完成一些重复性的基础性工作，有人觉得这还是值得提倡的。

即使LLM有幻觉，但是在生成笔记上还是非常成熟的。

你怎么看？

— 完—

「AIGC+垂直领域社群」

招募中！

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群，一起学习、探索、创新AIGC！

请备注您想加入的垂直领域「教育」或「电商零售」，加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

如何关闭苹果手机闪信功能，提升使用体验与专注度

无论是用来沟通、工作，还是娱乐，苹果手机凭借其独特的设计和流畅的系统，赢得了很多用户的喜爱。那么，如何关闭苹果手机的闪信功能呢？

新报观察 2024-12-30

世界首片下线！

29日，世界首片8.6代OLED玻璃基板产品在安徽蚌埠下线。据了解，该产品由中建材玻璃新材料研究院集团有限公司与蚌埠中光电科技有限公司的项目团队自主研发。在“OLED显示玻璃材料关键技术开发”项目支持下，该项目团队开展了OLED显示玻璃材料结构与性能设计、关键热工过程计算模拟等基础研究，并自主开发出成套关键技术装备。

光明网 2024-12-30

六个机械振荡器实现集体量子态

钛媒体快报 2024-12-30

在这些年度报告里回忆你的2024年

朋友们，又到了 12 月底，新年氛围年终报告它来了！每年一到这个时候，编辑部群里就是各种回顾过去一年的自己：这一年你听了 34121 分钟的歌，最晚的一天是凌晨

2024-12-30

国泰君安：我国智算中心相关领域投资有望加速

国泰君安研报称，上海印发《关于人工智能“模塑申城”的实施方案》，计划2025年底全市智能算力规模突破100EFLOPS，字节跳动、小米等互联网和制造业龙头公司纷纷加码算力资本开支。下游应用端突破倒闭算力需求提升，叠加“人工智能+”行动和各级产业规划密集落地，我国智算中心相关领域投资有望加速。

每日经济新闻 2024-12-30

itch 一周游戏汇：12月16日-12月22日（下）

《itch游戏汇》，对itch.io平台免费、可通过Web直接试玩的游戏逐周汇编。所有内容系人工整理，偶有疏漏。如果同期还有更多令您眼前一亮的作品，欢迎将它们分享在评论区。游戏简介：作为一位疯狂的科学家，你打造了一支机器人军队，准备征服世界。然而，意想不到的事情发生了：机器人叛乱了！现在，你必须从它们手中逃脱，并解决这一切混乱。

indienova 2024-12-30

DeepSeek上线V3版本，可灵AI推出可图1.5支持一键生成AI模特 | 蓝媒GPT

12月26日晚间，杭州深度求索人工智能基础技术研究有限公司（以下简称“深度求索”）宣布，全新系列模型DeepSeek-V3首个版本上线并同步开源。

蓝媒汇 2024-12-30

药明生物与中国生物制药就“First-in-Class”单抗达成研究服务合作

12月30日，药明生物宣布与中国生物制药达成研究服务合作协议，以支持其发现一款靶点未披露的“First-in-Class”单克隆抗体。根据协议，药明生物将通过抗体发现技术平台（如单B细胞技术平台）提供一体化研究服务，根据中国生物制药指定的靶点生成抗体，并进行先导抗体发现、优化以及可开发性评估等，筛选出处于临床前开发阶段的最佳候选单抗。

金融界 2024-12-30

知名医学专家“被带货”，经济日报：重视防范AI造假风险

作为一种颠覆性技术的新生事物，生成式人工智能在给经济社会发展带来巨大利好和无限可能的同时，也在法律规范、伦理道德、社会安全、公共治理等方面带来冲击。而且，生成式人工智能训练依赖于大规模数据，容易造成对个人数据和公共数据的过度搜集，进而引发侵权等问题。

极目新闻 2024-12-30

雷军：小米SU7不只扛住百万网友的严选在三大方面行业领先

快科技12月30日消息，雷军晒出了小米SU7的评测成绩单，在安全、续航、智驾等方面行业领先。他表示，一份耕耘，一份收获。小米SU7扛住了百万网友的严选，也扛住权威评测机构和媒体的测试！根

随心 2024-12-30

谷歌医疗版ChatGPT已在诊所实测！可生成诊断做总结，多个指标和真人医生相当

推荐体验

相关资讯