【学术分享第1期】肿瘤学中多模态数据集成的人工智能

作者：知见生命发布时间：2024-01-22

研究背景

近年来，随着人工智能的快速发展，它在医学领域的应用也日益受到关注。在肿瘤学中，多模态数据融合成为了人工智能的一个重要方向。一篇名为《Artificial Intelligence for Multimodal Data Integration in Oncology》的研究论文，由Lipkova等人在Cancer Cell杂志上发表，深入探讨了肿瘤学中多模态数据融合的人工智能方法及其应用前景。

肿瘤学中的数据来源包括放射学、组织学、基因组学以及电子健康记录等多个模态。然而，目前的人工智能模型往往只针对单一模态的数据进行分析和应用，忽视了临床背景中更广泛的信息，从而限制了其潜力，而多模态数据融合的方法能够将不同模态的数据整合起来，提高诊断和预后模型的稳健性和准确性，使人工智能更贴近临床实践。此外，将AI模型应用于多模态数据还有助于发现模态内部与模态之间的关系，在增加可解释性方面亦可起到重要作用。

肿瘤学中的人工智能算法框架

在肿瘤学中，人工智能方法主要分为有监督、弱监督和无监督学习。为了突出每个类别的特定概念，作者提出了计算机视觉框架中的所有方法，应用于数字病理学。

有监督学习使用带注释的数据点将输入数据映射到预定义的标签，例如带有注释的病理切片或具有患者结果的放射图像。弱监督学习则通过对大规模数据进行批量注释，避免了完全手动注释数据的需要。无监督学习则是在没有任何标签的情况下探索数据中的结构、模态和子集。

有监督学习人工智能方法中，手工设计和表征学习是常见的方法。手工设计方法通过使用预定义特征如形状大小等进行训练，但限制了模型对人类未知特征的学习和鲁棒性。而表征学习方法例如深度学习，则能够直接从原始数据中学习丰富的特征表示，具有更好的模型性能。

弱监督人工智能方法中，图卷积网络（GCN）、多实例学习（MIL）和视觉转换器（VIT）是常见的方法。图卷积网络GCN可用于捕获数据之间的结构，并对对象之间的关系进行编码。对病理影像结构学习很适用，可以考虑更广泛的上下文关系。但由于无法独立处理节点，GCN中节点的相互依赖性带来了较高的训练成本和内存需求；多示例学习MIL将带有标签信息的数据称为包，每个包下有多个实例，监督信号一般在包级。在大规模医学数据集中，精细注释通常不可用，这使得MIL成为训练深度模型的理想方法；视觉转换器VIT算法本身要求将图像切分为若干patch。与MIL相比，ViT并不假设patch之间相互独立，而是同时引入了它们之间的空间信息。ViT能够在学习过程中考虑到patch之间的相关性与整张原图的上下文信息。

无监督人工智能方法主要包括自监督学习和完全无监督特征分析。自监督学习通过将学习问题作为一项任务来从数据中学习丰富的特征表示。编码器通常用于获得复杂高维数据集的高质量低维嵌入，以使下游任务在数据和训练效率方面更高效。无监督特征分析最常见的包括聚类和降维。聚类可以揭示不同的癌症亚型或患者亚组。降维的目的是获得低维表示，以捕获数据中的主要特征和相关性。

多模态数据融合思路

在多模态数据融合中，常用的方法包括早期融合、晚期融合和中间融合。早期融合指在数据输入阶段就将不同模态的数据进行融合，晚期融合则是在各模态数据分别处理后再进行融合，而中间融合则是在处理过程中逐步融合不同模态的数据。这些方法各有优劣，具体应用要根据具体情况进行选择。

多模态数据分析面临的挑战

模态数据融合在临床应用中仍面临一些挑战。首先，人工智能在临床转化过程中仍然存在一定的瓶颈。需要进行更多的研究和验证，以确保多模态数据融合方法的准确性和可靠性。其次，隐私和安全问题也是需要重视的。在整合多个数据模态时，必须确保患者数据的隐私和安全不受侵犯。此外，多模态数据融合的应用还需要得到医生和患者的接受，推动其在临床实践中的广泛应用。