当前位置:首页|资讯

甲基化和机器学习这对CP必须磕!9+干湿结合好文还不快码住!

作者:科研显微镜发布时间:2024-10-13

当当当,一日一次的好文分享时刻到啦。今天小薇师姐先问小伙伴们一句话,有没有去了解国自然热点是什么呢?知己知彼,才能百战百胜。近年来,国自然基金甲基化资助项目数量那是相当可观啊!因此,今天带来的就是一篇9分甲基化文章,那么各位科研天命人速集合,打怪升级的时候到了!

在这个研究,作者以驱动基因阴性肺腺癌(LUAD)作为研究对象,聚焦于DNA甲基化,整合某三甲医院患者病理特征后,采用机器学习构建了包含四个CpG位点的TLA甲基化标记,为后续治疗方案开发提供了理论依据。本文亮点一是着眼于“甲基化”这个国自然大热点,直接在定位上就占领了优势;接着作者通过清晰的生物学分析如GO功能富集和逐步Cox回归分析和多变量LASSO Cox回归模型分析构建了基于4个CpG的预后风险模型(TLA特征);最后作者通过NOMOGRAM模型和细胞模型验证了TLA的稳定性!层层递进,严谨的让人想要报警!(ps:如果你也有想利用生信方法发表高分文章的想法,但苦于没有好想法和好思路,快来扫码联系小薇师姐吧!助你拿下高分SCI!)

l题目:驱动基因阴性肺腺癌预后预测的DNA甲基组特征鉴定

l杂志:Cancer Letters

l影响因子:IF=9.1

l发表时间:2024年3月

公众号后台回复“123”,即可领取原文,文献编号:20241008

研究背景    

在过去的二十年中,特异性酪氨酸激酶抑制剂(TKIs)的出现使驱动基因阳性肺腺癌(LUAD)患者的生存率得到了前所未有的提高,但接近大约25-40%的LUAD患者却并不适用这种方法。最近有研究报道表观遗传基因沉默有助于LUAD的发生和发展,其中DNA甲基化是最常见的表观遗传沉默方法,在调控基因表达中起着关键作用,探索驱动基因阴性LUAD的甲基化表达谱将为尚未发现的治疗靶点提供新的前景。因此,在这个研究中,作者根据NCCN指南将具有野生型的EGFR、ALK、KRAS、BRAF、HER2、ROS1、MET、NTRK和RET突变的LUAD被定义为驱动基因阴性LUAD,并基于此构建了包含四个CpG位点的TLA甲基化标记,为后续治疗方案开发提供理论依据。

研究思路

首先,作者整合了某三甲医院的LUAD患者临床病理特征,接着进行了甲基化微阵列分析表征驱动基因阴性LUAD的特定甲基化谱,在去除了EGFR突变阳性LUAD和驱动基因阴性LUAD中共存的CpG位点后,对剩余的DMCs进行了GO功能富集和逐步Cox回归分析和多变量LASSO Cox回归模型分析,最后构建基于4个CpG的预后风险模型(TLA特征)。随后作者对基于四个CpG的TLA特征模型的预后和分层效应进行了评估。最后作者为了进一步研究TAC1、LHX9和ALX1在驱动基因阴性LUAD细胞中的生物学功能,构建了基因敲除或过表达细胞模型。    

图1 技术路线

主要结果

1.受试者临床病理特征分析

作者整合了从2016年至2019年中山大学第一附属医院和广东省人民医院的305例LUAD患者临床病理特征(表1)。其中驱动基因阴性LUAD患者的中位随访时间训练组为56个月,内部验证组为53个月,外部验证组为68个月。在整个队列中,1年、3年和5年的OS率分别为82.2%、62.6%和54.8%。晚期LUAD患者术后接受常规铂类化疗,其中训练组82例患者中有45例(54.9%),SYSUFAH内部验证组78例患者中有53例(67.9%),GPPH组110例患者中有53例(48.2%)。    

表1 受试者临床病理特征分析

2.基于CpG的TLA特征模型构建

为了表征驱动基因阴性LUAD的特定甲基化谱,作者进行了甲基化微阵列分析,其中有2788个差异甲基化的CpG位点(DMCs)被鉴定为绝对值大于0.20(图2A)。为了进一步提高驱动基因阴性LUAD中DMCs的特异性,作者去除了EGFR突变阳性LUAD和驱动基因阴性LUAD中共存的CpG位点,将剩余的1387个DMCs进行GO功能富集和逐步Cox回归分析。结果表明DMCs的生物学功能与转录因子(TF)复合物的失调有关,而且筛选出7个基因对应的13个候选CpGs与较短OS的显著关联(图2B-C)。随后作者通过焦磷酸测序量化训练队列中上述13个CpG位点的甲基化水平,并使用多变量LASSO Cox回归模型进一步筛选。最后共鉴定出4个CpGs (cg16353006、cg11873482、cg17437939和cg25800765)分别对应于TAC1、LHX9和ALX1基因区域(图2D和E),最终构建基于4个CpG的预后风险模型(TLA特征)。    

图2 基于CpG的TLA特征模型构建

3.TLA特征模型构建效应分析

接着作者对基于四个CpG的TLA特征模型进行了评估。其中TLA的风险评分分布表明,风险评分较高的患者通常比评分较低的患者生存期更差(图3A)。使用X-tile图生成风险评分临界值将患者划分为高低危组进行生存分析,结果表明低危组患者的OS通常长于高危组。此外在训练队列中,1年和5年OS生存率的AUC分别为0.842和0.798,再次证实了TLA特征的预后价值。为了验证TLA特征的可重复性,作者在SYSUFAH的一个内部集和广东省人民医院的一个外部集中进行了进一步的验证分析。同样的,风险评分较低的患者在内部和外部验证集中比风险评分较高的患者表现出更好的生存率(图3B-C)。此外与单个DMC的甲基化水平或其他临床预后因素相比,TLA特征表现出更好的性能。    

图3 TLA特征模型构建效应分析

4.TLA分类及NOMOGRAM模型分析

为了研究TLA特征的独立性,根据临床变量(性别、年龄、肿瘤大小、分化程度、吸烟状况和TNM分期)将整个队列分为不同的亚组,然后对每个亚组进行生存分析(图4),TLA特征在所有亚群中仍然表现出稳定而强的分类能力。根据对培训队列OS的多变量分析,作者还整合了TLA特征和TNM分期,以生成预后预测NOMOGRAM模型(图5),而受试者工作特征(ROC)分析进一步表明NOMOGRAM模型在预测1年和5年OS方面比目前可用的TNM分期系统具有更高的准确性和特异性。DCA曲线也显示NOMOGRAM模型和TLA特征比TNM分期系统具有更好的临床价值。    

   

图4 TLA分类效应分析    

图5 NOMOGRAM模型分析

5.CpGs对应基因的X-tile图和网络分析

为了进一步评估个体CpG甲基化及其相应基因mRNA表达的预测价值,作者首先将两个已发表的驱动基因阴性LUAD队列作为个体验证集,然后根据甲基化或mRNA水平对它们进行分类(图6A-J),结果表明基于这一分类原则使患者预后分层更加精确。接着作者使用了TAC1、LHX9和ALX1构建PPI网络。研究结果显示ALX1与转录因子(TBX15和ETS1)相互作用,它可能还参与调控神经内分泌系统中与信号转导相关的NCDN、NPBWR1和TSHR的表达(图6K)。最后作者为了进一步研究TAC1、LHX9和ALX1在驱动基因阴性LUAD细胞中的生物学功能,构建了基因敲除或过表达细胞模型。CCK8和集落形成实验结果表明,与对照组相比,敲低上述基因的表达有效促进了H2085和H2126细胞的迁移和侵袭,但均不影响细胞增殖能力。上述结果表明TAC1、LHX9或ALX1在驱动基因阴性的LUAD细胞的迁移和侵袭过程中发挥重要作用。    

文章小结

在这个研究,作者以驱动基因阴性LUAD患者和DNA甲基化作为切入点,采用机器学习构建了LUAD患者TLA甲基化标记,并且通过细胞模型验证了TLA甲基化标记的可靠性,为后续治疗方案开发提供了理论依据。本文贡献在于是第一个评估甲基化谱在驱动基因阴性LUAD中作为风险分层因素作用的研究,并且基于四个CpG甲基化位点成功构建TLA特征模型,证实了基于此来识别不良OS的个体成为可能。更多精彩而创新性满满的研究敬请扫码联系小薇师姐获取!无论是研究方向的确定、实验设计的优化,还是生物信息学的深入分析,小薇师姐已经准备好助你一臂之力!    



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1