当前位置:首页|资讯

临床一线没空?5种机器学习+ SEER数据库+甲基化评分,拿捏牛刊!

作者:科研显微镜发布时间:2024-09-19


哈喽啊各位亲爱的小伙伴们!最近,小薇收到许多小伙伴们的抱怨,每天上班就是手术,根本没空搞晋升课题,怎样才能平衡科研和临床啊?不慌,看完今天的多组学+机器学习+SEER思路分享,定能为您省下诸多构思时间!

来自日本的大牛团队于《British Journal of Cancer》期刊上发表了题目为《Molecular classification of ovarian high-grade serous/ endometrioid carcinomas through multi-omics analysis: JGOG3025-TR2 study》的文章,小薇仔细阅读发现,文章内的多组学思路的可复性很不错!小薇这就给大家简要分析下本文主要亮点!

1、多组学+卵巢癌队列+甲基化评分!作者团队首先纳入了JGOG3025研究中的710 例上皮性卵巢癌中 51 个基因的临床信息和靶向 DNA 测序数据作为研究原始数据。随后,为了评估细胞的甲基化状态,作者开发出甲基化评分来评估子宫内膜(EM)和输卵管(FT)之间的细胞分化差异。

2、TCGA-OV/TCGA-UCEC数据分析+机器学习构建亚型+SEER数据库分析!作者团队基于TCGA-OV队列,再利用k-最近邻、随机森林、多层感知算法、XGBoost等机器学习算法构建出了肿瘤亚型模型,最后再利用SEER数据库中的队列来验证结果,进一步提升了文章结果的可信度!对机器学习感兴趣的朋友可以留意作者团队所使用到的“套路”!PS:想像作者一样发Q1机器学习文章?找不到合适的选题?扫码联系小薇!小薇这里有大量生信思路供您挑选!另外,小薇这里还有科研交流群,想入群的滴滴我吧~



l题目:通过多组学分析对卵巢高级别浆液性/子宫内膜样癌进行分子分类:JGOG3025-TR2 研究

l杂志:British Journal of Cancer

l影响因子:6.4

l发表时间:2024年8月

公众号回复“123”领取原文PDF,文献编号:20240912

研究背景

卵巢癌是妇科恶性肿瘤中死亡率最高的,其中高级别浆液性癌(HGSC)和高级别子宫内膜样癌(HGEC)是两种主要的组织学类型。由于它们在组织病理学上的相似性,导致诊断时存在相当大的观察者间变异性。虽然已知同源重组缺陷(HRD)与HGSC的药物敏感性相关,但HGEC的分子特征尚不清楚。

数据来源



研究思路


主要结果

1、基于 CNV 特征鉴定四种肿瘤亚型

首先,基于 48 个CNV 特征的无监督分层聚类分析一共确定了四个具有不同基因组特征的不同聚类(图1A)。其中,C1 簇显示出高 CCNE1 扩增率、BRCA1/2 的突变频率较低 (BRCA1/2 突变伴基因座特异性 LOH 和 BRCA1 甲基化沉默)。C2 (n = 160) 和 C3 (n = 59) 簇均显示出较高的 BRCA1/2 突变率 。此外,C4 集群 (n = 22) 表现出显著特征,包括诊断为 HGEC 的病例频率显著升高。总的来说,C4 肿瘤亚型被认为是分子确定的“HGEC 型”肿瘤。    


图1 JGOG3025-TR2 队列中基于 CNV 特征的四种肿瘤亚型

2、与子宫内膜和输卵管细胞分化相关的全基因组 DNA 甲基化分析

为了研究与子宫内膜 (EM) 和输卵管 (FT) 之间细胞分化相关的全基因组 DNA 甲基化,利用先前研究的全基因组亚硫酸氢盐测序数据来分析 EM 和 FT 之间的差异甲基化区。结果显示,在正常 EM (n = 13) 和 FT (n = 11) 样本 (GSE155760) 的 DNA 甲基化阵列数据集中,EM 中的 EM/FT 甲基化评分显著高于 FT(图2)。而在 JGOG-TR2 队列中,CPR 诊断的 HGEC 的 EM/FT 甲基化评分显着升高,但 C4 肿瘤与其他肿瘤之间的差异更为显著(图2B)。在卵巢癌的另一个 DNA 甲基化阵列数据集 (GSE226823)中,子宫内膜样癌的 EM/FT 甲基化评分显著高于 HGSC(图2C)。    


图2 与子宫内膜和输卵管细胞分化相关的全基因组 DNA 甲基化分析

3、TCGA-OV 数据集分析

为了研究 TCGA-OV 病例是否包括 HGEC 型肿瘤,建立了一个机器学习模型,根据 CNV 特征将肿瘤分为上述四种亚型。采用了五种不同的分类算法,即 k 最近邻、支持向量机、随机森林、多层感知器和 XGBoost,它们在训练数据集中都显示出大约 95% 的高精度。结果显示,555 例病例中有 509 例 (92%) 亚型分型成功,其中 102 例预测为 C1 (pC1) ,237 例为 pC2,158 例为 pC3 型,13 例为 pC4/HGEC 型肿瘤。pC4 显示出与 JGOG-TR2 中的 C4 相似的基因组谱,包括较低的 TP53 突变率。生存分析显示,pC4 病例往往具有更好的 OS 和 PFS (图3B-C)。


图3 TCGA-OV 数据集中的分析    

4、TCGA-UCEC 数据集分析

与卵巢癌类似,子宫内膜癌包括 3 级子宫内膜样癌 (UHGEC) 和浆液性癌 (USEC) 组织学。相同的预测方法应用于 TCGA-UCEC 队列中诊断为 UHGEC 和 USEC 的肿瘤。在总共 287 例病例中,251 例 (87%) 成功确定了肿瘤亚型,包括 183 例 UHGEC 和 104 例 USEC 病例。作者发现,预测为 C4的 TCGA-UCEC 样本与 TCGA-OV 的 pC4 具有相似的 CNV 特征特征(图4A)。此外,预测亚型的基因组谱与 JGOG-TR2 和 TCGA-OV 队列中的基因组谱相似(图4B)。


图4 TCGA-UCEC 中的分析

文章小结

JGOG3025-TR2 是一个独特的多组学数据集,包括卵巢的 HGSCs 和 HGECs。在本研究中,作者团队全面分析了这个数据集,重点关注代表肿瘤染色体不稳定性的 CNV 特征,并确定了一组具有与以前已知的 HGSCs 不同的特征分子谱的肿瘤。最后,作者将其定义为“HGEC 型”肿瘤。而HGEC 型肿瘤在形态学诊断为 HGSC 的肿瘤亚群中发现,表明全面的分子分析可能会改善 HGEC/HGSC 之间的鉴别诊断。PS:生信思路枯竭,不知道什么课题香、什么方法好做?扫码联系小薇!小薇来帮您!无论是课题设计、生信分析,还是实验设计,小薇样样在行!服务到位,包您满意!





Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1