只涉及一个热点的文章不好发?那就来两个!只会简单的构造预后模型?不怕!多种机器学习算法强烈来袭!感觉这样还不够?那再加上单细胞分析呢?是不是瞬间血量拉满!最近小云在看文献时,发现一篇双热点联合机器学习与单细胞测序的文章让我眼前一亮,瞬间想分享给小伙伴们!小云细细读了这篇文章,发现能拿到7分+绝对是名副其实!首先,这篇文章是紧跟生信文章的最新思路,选择了双热点这个生信方向,本文是双硫死亡联合铁死亡进行分析。小云从pubmed上发现,不管是双硫死亡还是铁死亡,近三年发文数量直线上升,而且中标国自然的比例也越来越大。有小伙伴可能也会说,每年发文量越来越大,我怎么创新呢?这不就来了,本文把这两个热点联合起来,创新性瞬间拉满!这里小云也要细细的提醒一下大家哦!不是随随便便两个热点就能结合分析,它们之间还要有一定的关联呦!其次,本文在研究方法上也是极具创新性!本文是联合机器学习与单细胞分析两种研究方法,数据量大,分析的程度深,大大地提升了文章的质量。而且,本文的数据集也是大大滴,用ICGC 与GEO肝癌外部队列验证TCGA-LIHC队列构造的模型,大量提升了模型的准确性。最后,又通过体外实验验证关键基因的生物学功能,干湿结合,瞬间提升文章的质量。小云想说,本文是创新内容加上创新方法,不想发SCI也难!(ps:不知道怎么创新的小伙伴可以来找小云!这里有新鲜出炉的生信热点方向,还有一大波的可复现的创新思路,感兴趣的直接扫码联系我吧!)。
题目:基于机器学习的肝癌双硫死亡相关铁死亡评分的开发和实验验证
杂志:Apoptosis
影响因子:IF=7.2
发表时间:2023年10月
公众号回复“123”获取文献,文献编号:231117
研究背景
双硫死亡和铁死亡是两种不同的程序性细胞死亡途径。双硫死亡是由细胞内过量胱氨酸积累引起的二硫化物应激的快速死亡方式。铁死亡是一种铁离子依赖的过量脂质过氧化积累导致的细胞功能异常及最终完成破裂的死亡方式。由于它们作为治疗靶点的潜力,已经引起了相当大的关注,但与双硫死亡相关的铁死亡基因在肝细胞癌(HCC)中的作用仍不清楚。
数据来源
研究思路
基于TCGA-LIHC队列,本研究采用Pearson相关性分析来检验双硫死亡相关基因与铁死亡相关基因之间的相关性。使用“limma”包分析肝癌和正常组织中与双硫死亡相关的铁死亡基因的差异表达。采用单因素Cox回归分析,确定与预后相关的候选基因。使用了两种不同的机器学习算法(lasso-cox回归算法和ranger算法)构建预后模型。对交集的4个关键基因进行基于bootstrap的多元Cox回归分析。通过ICGC与GEO外部肝癌队列对预后模型进行验证。使用“clusterProfiler”和“ReactomePA”包进行基因集富集分析(GSEA)。通过6种免疫浸润算法(CIBERSORT、EPIC、MCPCounter、quanTIseq、TIMER、xCell),评估TCGA数据库中HCC患者的免疫浸润程度。利用TIDE算法预测免疫治疗的反应性。使用“oncopdict”包计算来自GDSC数据库的药物估算敏感性评分。通过“Seurat”包分析scRNA-seq数据集,采用KNN算法进行细胞聚类。此外,使用“irGSEA”和“UCell”包对不同细胞类型相关的通路进行富集分析。最后,进行体外实验来验证KIF20A的功能。
主要结果
1. 肝癌中与双硫死亡基因相关的铁死亡基因评分的鉴定与构建
本研究利用Pearson相关性分析鉴定出180个与双硫死亡相关的铁死亡差异表达基因,对这180个基因进行单因素Cox回归分析,得到105个显著基因,图1A显示了前20个与双硫死亡相关的预后显著的铁死亡基因。为了识别与双硫死亡相关的核心铁死亡基因,本研究使用了两种不同的机器学习算法,lasso-cox回归算法和ranger算法。通过lasso-cox算法,105个基因中有12个被鉴定出来(图1B, C)。SWSFS算法鉴定出7个最重要的基因(图1D)。把lasso和ranger算法滤出基因进行交叉,确定四个候选基因作为与双硫死亡基因相关的铁死亡基因,并来构建与双硫死亡基因相关的铁死亡基因(DRF)评分(图1E)。基于bootstrap的多变量Cox回归建立模型,评估生存分析的准确性和稳健性(图1F)。
图1 核心双硫死亡相关铁死亡基因的鉴定和DRF评分的构建
2. 验证DRF评分的预后价值
接下来本研究对DRF评分进行了评估和验证。生存曲线结果发现,DRF评分较高的患者总生存期(OS)较短,死亡率较高(图2A)。为了证明DRF评分的稳定性和可靠性,使用ICGC-LIRI-JP和GSE14520队列作为外部验证队列。同样,DRF评分高的患者生存率低于DRF评分低的患者(图2B, C)。本研究使用其他三个预后指标(DSS、PFI、DFI)来评估DRF评分对HCC的预后价值。结果显示,高评分组预后较低评分组差(图2D-F)。此外,应用ROC曲线来评估DRF评分的准确性。对于TCGA-LIHC队列,1年、2年、3年和4年生存率的AUC值分别为0.804、0.714、0.700和0.688(图2G)。ICGC-LIRI-JP和GSE14520验证队列的ROC曲线也显示了DRF评分的预测性能(所有AUC > 0.600,图2H, 1)。
图2 在内部和外部队列中验证DRF评分的生存率
3. 生物学功能及途径分析
为了探索不同群体中潜在的分子特征,本研究通过GSEA评估其潜在的生物学功能。GSEA结果显示,GO主要富集在细胞生长、增殖和发育调控途径中(图3A)。KEGG通路在细胞周期、DNA复制、错配修复等过程中富集(图3B)。基于Reactome数据集的结果与上述结果一致(图3C)。本研究还在高和低评分组之间进行了GSVA功能富集分析,以进一步确定显著富集的激活途径。KEGG通路、Reactome通路和50个标志基因集的GSVA结果也表明,细胞生长、增殖和发育调控通路,在高评分组中富集(图3D, E)。这些结果提示,DRF评分可能与细胞增殖和分裂有关,并可能通过影响肿瘤细胞的细胞周期来影响细胞的存活。
图3 生物学功能及途径分析
4. 不同组肿瘤免疫微环境景观
为了确定DRF评分与免疫应答之间的关联,本研究共使用了6种算法(CIBERSORT、EPIC、MCPCOUNTER、QUANTISEQ、TIMER、XCELL)计算了DRF评分、KIF20A、G6PD、SLC7A11、SLC2A1与不同免疫细胞的相关性,明确了DRF评分与免疫细胞的相关性(图4A)。结果显示,DRF评分、KIF20A、G6PD、SLC7A11与大部分免疫抑制细胞呈正相关,与部分免疫活化细胞呈负相关。此外,进一步使用6种免疫浸润算法计算高分组和低分组之间免疫细胞的差异(图4B)。同样,得分越高,免疫抑制细胞的比例越高(图4C, D)。这些结果表明,得分高的组可能与促进肿瘤存活的免疫微环境有关。
图4 不同组肿瘤免疫微环境景观
5. DRF评分与免疫检查点和突变负荷的关系
本研究接下来探索了DRF评分与许多免疫检查点之间的联系。结果显示DRF评分与各种免疫检查点基因呈正相关(图5B)。进一步分析了这些免疫检查点基因在低和高评分组中的分布。发现大多数免疫检查点在两个不同DRF评分组中具有统计学差异(图5A)。本研究使用了TIDE算法评估免疫治疗在低评分组和高评分组的潜在临床效果,结果显示,低评分组患者对免疫治疗的应答率较高,DRF评分与TIDE评分呈正相关 (图5C-E)。此外,高评分组T细胞排斥评分较高,表明高评分组细胞毒性T淋巴细胞浸润较少(图5F)。接下来,分析了高分组和低分组的突变情况,TP53、DNAH10、MCTP2、DIP2C、NLRP2和RB1在高评分组的突变率远高于低评分组(图5I)。这些发现强烈表明,DRF评分与TME细胞浸润和体细胞突变有关。
图5 DRF评分与免疫检查点和突变负荷的关系
6. DRF评分在预测TACE和药物治疗反应方面的表现
TACE是肝癌中期患者的一线治疗方案。本研究发现,对TACE有反应的患者的DRF评分值显著低于无反应的患者(图6A, B)。此外,DRF评分预测HCC患者对TACE无反应的AUC值为0.756(图6C)。为了评估DRF评分对肝癌药物治疗的预测作用,使用R软件包“oncoPredict”在多个数据集中比较了高危组和低危组的药物IC50分布。结果显示,高危组对多西他赛、紫杉醇等常用化疗药物和阿法替尼、依鲁替尼等分子靶向药物更为敏感(图6D-O)。这些结果表明,DRF评分可以预测TACE、化疗和靶向治疗的疗效。
图6 DRF评分在预测TACE和药物治疗反应方面的表现
7.单细胞测序数据中细胞定位和通路富集分析
为了研究模型中四个基因在不同细胞类型中的表达和DRF评分,本研究进行了单细胞测序分析。首先,利用KNN算法将所有细胞分成32个簇,根据不同细胞类型表面标记物的表达情况,鉴定出7种不同的细胞类型(图7A)。接下来,特征图结果显示,KIF20A、G6PD、SLC7A11、SLC2A1主要在肿瘤细胞中表达(图7B-E)。此外,不仅肿瘤细胞有较高的DRF评分,巨噬细胞和T细胞也有较高的DRF评分(图7F)。单细胞数据的通路富集分析显示,DNA修复、E2F检查点和P53通路主要在肿瘤细胞中上调(图7G - I)。这一结果进一步表明,DRF评分可能通过改变参与细胞周期进程的基因的表达来影响肿瘤的生长。
图7 在单细胞测序数据中检测细胞分布和富集通路
8. 核心基因功能的体外实验验证
本研究选择KIF20A作为代表基因,在体外实验验证DRF评分的影响。使用HPA和CPTAC数据库对KIF20A的蛋白表达水平进行分析,结果显示KIF20A在肿瘤组织中的表达明显高于正常组织(图8A, B)。本研究敲除KIF20A以确定KIF20A对细胞周期进程和细胞生长的影响。通过CCK-8实验发现,下调的KIF20A显著抑制HCC细胞的生长(图8C)。流式细胞术细胞周期分析显示,KIF20A敲低导致G2/M停滞(图8D)。为了进一步研究KIF20A的恶性生物学行为,采用基于CFSE的方法直接评估KIF20A对细胞增殖的影响。结果显示,KIF20A敲低显著降低了HCC细胞的增殖 (图8E, F)。综上所述,KIF20A在HCC组织中表达升高,KIF20A敲低导致G2/M阻滞和增殖阻断。
图8 核心基因功能的体外实验验证
文章小结
这篇文章可谓是紧跟当前研究潮流,选择了双硫死亡与铁死亡这两个热点话题,直接吸人眼球!同时又使用了机器学习和单细胞测序这两种当红的研究方法。最后还在体外进行关键基因的生物学功能验证,干湿结合,瞬间提升文章质量!创新内容加创新方法,让这篇文章轻松拿下7分+。想蹭热点话题的小伙伴们,不要错过这个好思路,还可以拓展做国自然课题,一举两得~ 想复现的小伙伴们快快扫码联系小云吧!