3类严重程度，6级不确定性，德州大学等首创全新胸部X光数据集，登IEEE TMI

作者：新智元发布时间：2024-09-18

【导读】研究人员提出了一个新的胸部X光图像数据集，该数据集包含临床不确定性和严重性感知的标签，并通过多关系图学习方法进行分析，以提高疾病分类的准确性，扩展了现有的疾病标签信息。

相比于普通图像分类，医学诊断具有两点特殊的性质：1.不确定性；2.病情发展程度。

正如图1报告所示，医生的描述中往往会涉及到相关症状的严重程度和可能性。然而现有的医学数据库往往直接模仿自然图像，仅仅提供有无的Binary或者疾病的分类的Multiple Label，严重忽略了具有重要临床意义的因素。

图1 放射学报告中关于疾病不确定性和严重程度的描述（疾病用红色字体标出，严重程度用绿色高亮，不确定性用蓝色高亮）

基于胸部X光（CXR）检查这种广泛应用于筛查和诊断多种疾病的临床成像方法，德州大学阿灵顿分校、NIH、理化学研究所、东京大学以及日本国立癌症研究中心的研究人员首次提出了提出了一个包含了疾病的严重程度和不确定性的全新的数据集。

论文链接：https://ieeexplore.ieee.org/abstract/document/10632161

数据集下载：https://github.com/MengRes/Uncertain-Label.git

数据集Physionet：https://physionet.org/content/cad-chest/1.0/

此外，他们还提出了一种解剖结构感知的多关系图学习方法，用于改进CXR疾病分类。

论文已经被IEEE Transactions on Medical Imaging（TMI）接收。

文章的主要贡献包括：

1. 提出一个包含疾病严重程度和不确定性的数据集。

2. 提出了一种使用医学知识的多关系图学习方法用于CXR疾病分类。

数据集

诊断疾病的严重程度在临床诊断中至关重要，超越了疾病类别存在或不存在的二元分类。

在MIMIC-CXR数据集中（最大的胸片数据集之一）以及随附的放射学报告，疾病严重程度的描述（例如图1中的「small pleural effusion」或「mild cardiomegaly」）很常见。据了解，之前没有研究解决报告的疾病严重程度的问题。

其次，由于胸片的基本复杂性和难度，对医生的疾病不确定性进行建模非常重要。放射科医生经常在临床记录中使用「可能」、「不排除」和「也许」等术语在临床记录中表明不同程度的不确定性。大多数先前的研究将这种不确定性视为负面类别，这可能会误导临床决策。

团队使用了基于规则的提取方法从放射学报告中提取疾病的名称，严重程度和不确定性信息。

对于疾病名称，列出每一种疾病可能使用的表述，对于疾病严重程度，列出了表示严重程度的词语，并将严重程度量化为轻度（mild）,中度（moderate）和严重（sever）三个等级，如表1所示。

对于疾病的不确定性，团队与医生合作，制定了不同的不确定性词语与标签值的映射，将不同的严重程度对应于不同的标签值，对疾病的描述越肯定，标签值越高，如表2所示。

表1 表示疾病严重程度的词语

表2 表示疾病不确定性的词语

团队邀请经验丰富的医生来评估被提取的标签的准确性，并向医生提供了500份随机选择的放射学报告及其相应提取的疾病，严重程度和不确定性标签。根据医生的反馈统计了标签的准确性，如表3所示。

表3 提取的标签的准确性评估

方法

团队在上述提取的标签上使用图网络对疾病分类。根据医生提供的医学知识，构建了三种图网络关系，分别为spatial graph（表示解剖学结构之间的关系），semantic graph（疾病之间的关系）和implicit graph（表示潜在的关系）。

在spatial graph中，每个解剖学结构作为一个节点，通过根据解剖学结之间的空间关系决定其之间边的连接。

在semantic graph中，边的连接则基于疾病之间的关系（如图2所示）。团队利用基于图的Grad-CAM方法来获取最后一层类别的特定权重。

使用上述权重，为每个节点计算每个异常类型的热图值。热图是表示节点特征对特定类别预测贡献的二维表示。对每个节点，根据热图值进行排序，并选择最高值（top-1）和次高值（top-2）。

这些值对应于可能在该节点发生的异常。如果节点i和节点j的top-1标签在知识图中是相连的，则在两个节点之间建立边，Ase1(i, j) = 1，否则Ase1(i, j) = 0。同样的方法用于构建Ase2矩阵，表示节点的top-2标签之间的语义关系。

在implicit graph中，解剖学结构之间互相连接。模型的结构如图2所示，具体介绍见论文。

图2 疾病之间的关系：心脏肥大会损害心脏有效泵血的能力，这种损害会进一步加剧因肺充血而引起的肺水肿，然后充血会将液体推入胸膜腔，而这种液体的积聚会导致胸腔积液

图3 方法的网络结构

实验

团队在提取的标签上进行实验并和其他方法比较，结果如表4所示。

模型通过二元标签和不确定标签进行训练，记为Ours（0-1）和Ours（Uncertain）。

为了更深入地研究方法的性能，团队进行了消融研究。每个实验都针对具有二元标签和不确定标签的spatial graph、semantic graph和implicit graph进行单独训练。

表4 与其他方法的比较结果

将疾病感兴趣区域与在ResNet-50模型上使用Grad-CAM生成结果进行比较。从报告中提取异常区域如下图所示。

可以发现，放射学报告显示双侧下肺（左下肺和右下肺）出现混浊。

此外，右肺的混浊可能代表肺炎。ResNet-50模型在不透明和肺炎的情况下重点关注右下肺、右中肺和心脏区域。

从报告中可以发现心脏区域没有异常，而左下肺的疾病被遗漏，使得Grad-CAM结果不太准确。新模型同时关注左下肺和右下肺，并且比ResNet-50 方法表现更好。

图4 报告中的异常描述以红色突出显示，从文本中提取的异常和位置在报告下方提供

其中，（a）和（c）是ResNet-50模型中Grad-CAM获得的异常感兴趣区域；（b）和（d）是通过新方法获得的感兴趣的节点。

在结果中，每个边界框对应一个解剖区域的节点，红色边界框是关注度最高的节点，黄色边界框对应与红色边界框密切相关的节点。绿色箭头表示节点之间的连接。

结论

在本研究中，作者探讨了在临床环境中，CXR疾病诊断中涉及的疾病严重性和不确定性问题。

为了解决这一问题，他们采用基于规则的方法，从放射学报告中提取反映疾病严重程度和不确定性的标签。

在此基础上，利用融合医学知识的图神经网络对疾病的严重程度和不确定性进行预测。

参考资料：

https://ieeexplore.ieee.org/abstract/document/10632161

本文来自微信公众号“新智元”，，36氪经授权发布。

近期资讯

趣画古今：印度神谱-01

算是一部似是而非的*印度神谱，真的只是半随机地从很多很多互相矛盾的来源里选取了一小部分关系的样本作者：Korwin Briggs，2017年8月25日上午8：13我要说，这不是一份全面的印度神谱——一点都不全。里面至少一部分还是错的，虽然大家对此的意见不会一致。我试着不去care，因为这也不全都是我的错。印度教是6000年宗教观念矛盾和结合的产物，时间是周期性的，世界是一种错觉，每个人或多或少都是一个化身，轮回，前化身，法相或其他人的分身。其中最大的一部分，印度教众神没有一贯的、普遍接受的关系，甚至最流行

k煎蛋k 2024-09-14

PCB板上电容开裂短路，咋搞的？

对电子工程师来说，PCB板上的元件稳定性很重要，尤其是电容这些储能元件，其性能直接影响到整个电路的稳定销售和可靠性，然而在使用过程中可能会遇见电容开裂短路问题，如何分析原因，并给出解决方法？ [图片] 1、电容为什么会开裂短路？ ①外部机械力影响：PCB板在运输、安装或使用过程中受到外部机械力（如振动、撞击）可能导致电容开裂，进而引发短路。 ②应力电压过高：如果电容承受的电压超过其额定电压范围，特别是瞬态过电压或脉冲电压，可能导致电容内部损坏，出现开裂短路现象。 ③封装尺寸与余量不足：电容封装尺寸过小或设

凡亿教育 2024-09-15

录用啦！发了PNAS~华算算的好，完美契合实验

?来自客户的喜悦分享 ?文章发了PNAS！ ?连夸华算算的好 ✅完美契合实验? ⭕做计算找华算，咱专业！靠谱！计算结果有保障！ [图片] 我们的理论计算服务，累计助力5️⃣0️⃣0️⃣0️⃣0️⃣➕篇科研成果，计算数据已发表在Nature & Science正刊及大子刊、JACS、Angew、PNAS、AM系列等国际顶刊。 ??? ❤➕⭐ 预祝大家好运连连发刊不断呦~ [图片]

计算材料学与机器学习 2024-09-15

德军档案：1941年的苏军可能有多少辆坦克？

简介：作为一支规模空前的军队，苏德战争刚爆发时的苏军就拥有着数量惊人的装甲车辆，而倚重装甲作战的德军自然也是格外关注对手装甲力量的实际规模。1941年7月，德军依据已有的情报和一定的推测，对当时苏军装甲车辆的保有量进行了大致估算，给出了这份报告（下附有本人中文翻译）。文中，德军估计苏军拥有的作战车辆在14000辆左右。（资料来源：www.bundesarchiv.de）原文大意：（本人翻译，限于个人德语水平，如有错漏之处还望批评指正）对于红军装甲部队实力的估算以下兵力作为基础数据列出：坦克旅 150辆

DASTIGER 2024-09-15

江淮1卡从四方面深度布局新能源实现快速增长

据终端上牌销量数据，2024年1-7月，新能源轻卡市场销量激增至4.27万辆，同比累计增长158%。在众多轻卡企业中，江淮1卡上半年的新能源产品累计销量实现了同比增长达75%，创造同比增幅历史新高。这一成绩的背后，还蕴含着诸多关键因素。运输人网分析江淮1卡主要是从技术研发、产品布局、售后服务、优惠政策四方面进行了深度布局，形成了持续抢占市场的竞争力。值得一提的是，从1-8月的运输人品牌指数榜来看，江淮1卡的关注指数为5579，始终名列前茅，多款产品常居运输人口碑最热产品排行榜，备受运输人青睐。技术为先打

运输人网 2024-09-15

叩开上帝的门【第2届寻翊奖】尾羽奖

本篇为大家讲讲一个很有意思的科学发现“光电效应”。关于这个内容最有意思的事情是：爱因斯坦获得诺贝尔奖不是因为他提出了相对论，而是因为他最终完善了光电效应理论。“两朵乌云”旋即扩散，经典物理的大厦轰然倒塌。在很远的过去，人们相信一切世间的东西都是物质的，那么我们看见的光自然也有某种物质载体。但是光的衍射性质否定了这个观点，因为衍射现象只可能用波，也就是震动来解释。在当时看来，因为光是一种波，它就如同弹簧的震动一般，并不是弹簧本身。可就像弹簧总有一段钢丝，水波总出现在水面，光的介质是什么呢？ 1887年，

非村科普墙 2024-09-15

印度教众神第一期罗摩(Rama)毗湿奴的第七个化身，也是最古老的、时间最久的、人类史上最棒的故事《罗摩衍那》里的英雄。这个故事就像是，又有宗教经文，又有星球大战，又有狮子王，还有指环王，□□部分还有数千只魔法猴攻击恶魔的海岛堡垒。这里我来做个超短总结，但讲真，这个故事真的值得一读：简介：有个魔王叫罗波那(Ravana)，他搞了一些事情，让自己不会被众神伤害。所以为了打败他，众神化自身为人形：毗湿奴化作4位王子、摩诃室利化作一位公主，大多数其他神明就化作了魔法猴。毗湿奴的主要化身——罗摩，迎娶了摩诃室利的化

k煎蛋k 2024-09-15

宋金和议后，金朝让赵构跪接诏书，南宋如何应对？

1137年，南宋官员王伦奉命出使金朝，提出议和的请求。此时金朝国内的政局已经发生了变化，主张对宋议和的一派占据上风。于是在第二年，金朝派乌陵思谋出使南宋，商量议和之事。与此同时，主和派的秦桧第二次拜相。虽然双方很快达成了一致，但问题又来了，金朝要求赵构跪接诏书。那么，南宋方面是如何应对的？ [图片] 一、天眷和议 1135年，金太宗完颜吴乞买病死，他的侄孙完颜合剌继位，即金熙宗。此时的金熙宗年纪还不大，所以朝政被他的叔父们把持。可是，朝中的重臣们却分成两派，经过激烈地斗争，以完颜宗磐、完颜昌、完颜宗隽为首

纵横五千年 2024-09-15

3类严重程度，6级不确定性，德州大学等首创全新胸部X光数据集，登IEEE TMI

数据集

方法

实验

结论

推荐体验

相关资讯

办公软件卷入混战大模型选择加大不确定性

ChatGPT的技术“涌现”“不确定性”也成为“可确定”？ | 这可怎么说

FCIS 2023丨机遇与不确定性 AI大模型重构安全

浪潮信息竞价跌停，AIGC商业订单落地存在不确定性

面对2024年车市的不确定性，干就对了！

近期资讯

趣画古今：印度神谱-01

PCB板上电容开裂短路，咋搞的？

录用啦！发了PNAS~华算算的好，完美契合实验

德军档案：1941年的苏军可能有多少辆坦克？

江淮1卡从四方面深度布局新能源实现快速增长

叩开上帝的门【第2届寻翊奖】尾羽奖

课本知识点总结-元素化学【第二期】

今晚开课！《研究计划写作八讲》助力学生录取牛津/剑桥/芝大等博士、奖学金项目

趣画古今：印度神谱-02

宋金和议后，金朝让赵构跪接诏书，南宋如何应对？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响