详情请点击右方:欢迎报名,孟德尔随机化1对1答疑指导学习班!
编者
今天给诸位分享一篇JAMA子刊文章,研究团队将26个社会风险因素进行潜剖面分析,最终转换成了一个综合的分类变量:社会风险概况,然后将其作为暴露因素开展分析。
简单讲,潜剖面分析就是将多个连续变量简化为一个分类变量的方法,希望下次诸位有这个需求的话,可以想到这种方法。
常有粉丝问我,“郑老师,我想研究的变量由好多个定量变量综合而成,我只能想到加和进行转换,但又觉得不太合适,还有什么其他的转换方法吗?”
当然了,方法有很多,潜在剖面就不错。
说白了,潜在剖面分析就是通过算法将多个连续变量转换成一个分类变量,与我们常见的聚类分析、因子分析相似,但属于不同的体系。唯一需要注意的是,用于潜剖面分析的数据类型必须是可连续观测的定量数据。
接下来让我们先简单看一下这篇文章。
2024年8月29日,顶刊《JAMA》子刊JAMA Network Open(医学一区top,IF=10.5)在线发表了一篇题为:“Social Risk and Clinical Outcomes Among Adults With Type 2 Diabetes”的研究论文,研究团队旨在使用潜剖面分析对26个社会风险因素变量转换为社会风险概况,以探究社会风险及其潜在特征对成人糖尿病患者临床结局的关联。
如果你需要原文,请关注“医学论文与统计分析”公众号回复关键词“pdf”, 可自动获取。潜剖面模型在重复测量数据中同样适用,如果您有需要,欢迎联系我们,微信号:aq566665
该项研究最终纳入615名符合条件的2型糖尿病患者,平均年龄61.3岁,61.6%为男性,近一半的参与者(41.6%)的年收入低于2万美元。
研究团队收集了社会风险、心理风险以及行为风险量表,并纳入了参与者近期的血糖控制(HbA1c)和血压测量值,通过潜剖面分析将26项社会风险因素(定量,包括19项社会风险因素,5项心理风险因素和2项行为风险因素)转换为5种社会风险概况(分类)。
观测指标为2型糖尿病患者的临床结局,包括三个结局指标,血糖、血压和生活质量。
研究团队将社会风险划分为5个潜在剖面,以下是主要结果:
第一组为最低风险组,心理健康相关生活质量显著高于社会风险较高的组(β,1.11; 95%CI,0.67至1.55)。
第二组经济风险低,但社会风险高,作为参考组。
第三组有较高的经济和社会风险,与参考组相比,血压显著升高(β,8.08; 95%CI,2.16 - 14.01)。
第四组的心理和行为风险较高,但社会经济和社会风险较低。与参考组相比,该组的HbA 1c显著更高(β,0.47; 95%CI,0.01至0.92),而心理健康相关的生活质量较低(β,−1.83; 95%CI,−2.41至−1.24)。
第五组为最高风险组,所有领域都处于高风险,结果显示该组具有显著较高的HbA 1c(β,1.07; 95%CI,0.50至1.63),与参考相比,心理健康相关的生活质量较低(β,-2.15; 95%CI,-2.87至-1.42)。
综上所述,研究结果表明成人糖尿病患者的健康状况可以根据社会、心理和行为等风险因素构成的社会风险概况进行判断,同时这些风险因素也可以作为未来干预和治疗计划的目标,以改善患者的健康。
不管是潜类别还是潜剖面分析,本质都是化繁为简,让我们能更好地理解和解释数据的分布和特征。
想要了解如何选择潜类别和潜剖面模型,可以先看一下这篇推文:
本文用于开展潜剖面分析的数据如下表所示,共26个定量变量。一般情况下在建立模型之前,需要先对数据中的缺失值和异常值进行处理。
接着是建立潜剖面模型,使用三步潜在剖面分析来识别数据集中的社会风险亚组,用 AIC 和 BIC 值评估每一个模型,评分越低意味着模型拟合越好。
结果表明,5个剖面的分析是最佳选择。
最后,为了验证所选的5个剖面的分类方案,对血糖控制、血压和生活质量(身体和精神成分)的结果进行了测试。
4个连续变量结局(血糖控制、血压和生活质量—身体和精神成分)均采用线性回归,其中5个类别被视为主要的分类自变量。
今天这篇文章就分享到这里,想要获取用于复现潜剖面文章的R语言代码可查看这篇推文:
关注“医学论文与统计分析”公众号回复关键词“pdf”,即可获取原文!如果你相尝试潜剖面分析,需要进一步的指导,郑老师的统计团队可以帮上忙!添加微信:zz566665,我们可以提供专业帮助!