详情请点击右方:医院回顾性数据分析与临床预测模型一对一高级学习班,郑老师团队指导
胃癌是造成全球癌症死亡率增加的主要原因之一,据报道, IB期胃癌患者术后五年复发的概率为围为7.5%至21.3%, 其中一些甚至在术后很快复发。
因此,对于一些IB期GC高危患者,需要进一步的术后辅助化疗,以最大限度地降低术后复发的风险。在先前的研究中,由于缺乏直接的证据,目前尚未有研究能证实辅助化疗对IB期患者有益。
近期,中国学者在医学顶级期刊Lancet子刊《The Lancet Regional Health Western Pacific》(医学一区top,IF=7.6)发表了一篇题为:“Association of survival with adjuvant chemotherapy in patients with stage IB gastric cancer: a multicentre, observational, cohort study”的研究论文,旨在探究术后辅助化疗是否可以降低IB期胃癌复发的风险。
如果你需要全文,请关注“医学论文与统计分析”公众号后台回复关键词“pdf”。如果您对真实世界研究感兴趣的话,来看看我们的真实世界研究与预测模型课程吧!详情可咨询助教,微信号:aq566665
研究设计类型—回顾性队列研究
在该项研究中,研究团队回顾性地从前瞻性MAGIS数据库中提取2009年1月-2018年12月期间接受胃根治性切除术的胃癌患者的数据。
MAGIS数据库总共来自中国的15家医院。为了减少回顾性研究的固有偏倚,只有8家大型三级医院对所有行切除手术的胃癌患者进行前瞻性随访,随访患者的生存状态,符合本研究的来源。
研究截止日期为2022年6月30日,即MAGIS数据库在随访时间的最后一次更新日期。
经过纳排,研究团队最终连续纳入了2110例胃癌患者。
根据患者和内科肿瘤医生的决定,1344例患者接受了辅助化疗,有效的化疗被定义为接受至少一个周期的辅助化疗;其余766例患者接受术后观察。
分类变量采用卡方检验或Fisher精确概率法(小样本);连续变量采用t检验或K-W H检验(不满足正态)进行双变量分析。
缺失数据处理
对于缺失数据,研究团队使用随机森林插补(missForest package version 1.5)来处理,所有数据缺失的变量均被纳入其预测因子。
肿瘤大小(2.2%)、分化程度(1.1%)、LVI(3.3%)、BMI(15.3%)、CEA 237(11.2%)、CA19-9 279(13.2%)、神经侵犯224(10.6%)、淋巴结检出数目14(0.7%)等变量的缺失率范围为0% ~ 15%。
缺失值插补后,研究团队使用完整的数据进行以下的分析。
Cox比例风险模型分析主要结局
为了探讨辅助化疗状态与胃癌临床结局的关系,研究团队基于Cox比例风险模型进行单变量和多变量分析。
采用三种Cox比例风险分析模型来确定临床结局的风险比(HR):
(i)非调整模型;
(ii)调整年龄的模型I;
(iii)模型II调整了年龄、阳性淋巴结数、胃切除术类型、原发肿瘤位置和TNM分期。
在原始(不匹配的)数据中,模型II结果显示,与术后观察组相比,辅助化疗与总生存期(HR=0.83,p=0.21)和无病生存期(HR=1.05,p=0.76)无关。
辅助化疗不是死亡率的独立预测因子。
倾向性得分匹配控制混杂因素
该研究中,辅助化疗组(1344例患者)和术后观察组(766例患者)基线并不均衡。
因此,在敏感性分析中,研究者为了评估HR估计的稳健性,应用了两种方法。其中,使用R包“MatchIt”版本4.5.5来执行倾向得分匹配(PSM)以控制潜在的混杂因素。
将基线组间差异显著的变量作为匹配变量,构建logistic回归来估计倾向评分。采用贪婪匹配算法对辅助化疗组与非辅助化疗组进行1:1倾向性得分匹配,卡钳值为PSM logit标准差的0.01。
PSM产生了637对匹配的配对,这些配对在基线临床病理特征上平衡良好。
结果显示,在PSM后的数据集中,与术后观察组相比,辅助化疗与总生存期(HR=0.72,p=0.052)和无病生存期(HR=0.91,p=0.601)无关。结果是稳健的。
在匹配后数据中进行亚组分析
研究者在匹配后的数据中进行亚组分析,寻找潜在的异质性来源。亚组包括年龄、性别、CEA、CA19-9、淋巴结采集、LVI、神经侵袭、分化、手术、淋巴结切除程度、TNM分期和查尔森评分
并通过调整倾向评分的Cox回归模型进行乘法交互作用检验。计算相互作用的相对超额风险(RERI)以反映加性相互作用。
有趣的是,研究团队发现,血清CA19-9≥37 U/ml、LVI阳性或转移性淋巴结阳性的患者显示辅助化疗后胃癌患者的总生存期死亡率显著降低。
加性相互作用的结果与乘性相互作用的结果一致。
开发用于指导化疗决策的预测模型
为了便于应用,研究者开发了简单易行的预测列线图,用于预测临床实践中辅助化疗的个体化获益程度。
研究团队分别对仅接受手术和辅助化疗的患者进行多变量Cox回归分析,使用来自Cox多变量模型的β系数构建两个预测列线图。
研究结果表明,该模型的具备良好的校准度和区分度,模型的C指数分别是0.74和0.70。
治疗效果的预测
研究团队在IB期GC患者中使用该模型对辅助化疗的疗效进行预测,结果发现:
仅24.3%(513/2110)的患者通过辅助化疗预测5年OS增加> 5%;
38.3%(808/2110)的患者预测5年OS增加在0和5%之间;
37.4%(789/2110)的患者预测治疗效果有利于术后观察。
闲来郑语
在真实世界研究中,我们经常会遇到数据缺失的问题。数据缺失就像是真实世界对人类研究的盖章一样,没有缺失反而让人觉得不真实。
在这篇文章中,研究者团队使用了机器学习随机森林插补法来填补缺失数据 ,使用倾向性得分匹配来控制混杂因素,不过,对于大部分学者来说,机器学习可能稍微有点难了。
老郑倒是觉得用多重插补和倾向性得分加权来开展分析也很不错!不会机器学习的朋友可以用此替代。
关于缺失数据如何处理,郑老师曾经开过系列的公益直播,可以在“医学论文与统计分析”视频号找到直播回放。先前还发表了10篇系列推文,感兴趣的朋友可以看看。
缺失数据填补系列10篇推文全部完结,另外有视频,有兴趣可以收藏学习。
希望今天的分享对大家有点帮助。
关注“医学论文与统计分析”公众号后台回复关键词“pdf”,即可获取原文!更多关于真实世界研究与临床预测模型统计服务,请联系郑老师团队,助教微信:aq566665。
详情请点击右方:零基础两天学会R语言构建临床预测模型