详情请点击右方:欢迎报名,GBD公共数据库挖掘1对1指导高级班,快速发表SCI论文!
在回归模型中引入连续型变量时,除了以原始形式纳入模型外,有时还需要考虑到实际的分析需求,对数据进行转换处理。并且连续型变量,本身就自带七十二变的属性,因此今天就为大家详细的介绍不同转换形式的应用及超快速实现方式!
关于连续变量的神奇七十二变,大致可以分为两大类:
按照一定的分组切点转换为分类变量
通过等比例缩放或计算,转换为新连续变量
第一种 按照一定的分组切点转换为分类变量,常见的有二分类分组、等分位分组、临床界值分组、自定义分组。这些分类转换形式都是大家熟悉并且很好理解的。
因此今天着重为大家介绍:将原变量通过等比例缩放或计算,转换为新连续变量进入模型的几种方式:
常见的有正态转换、每变化固定增量(0.1U,10U)、每变化1个标准差(per SD increase)......
①正态转换:当数据分布呈现非正态时,我们可以将原始数据通过函数转换,使偏态资料正态化,从而满足t检验或其他统计分析方法对资料的要求。
正态转换方式:常见的有log转换,倒数转换等,更详细的选择可以查阅这篇《正态转换的多种方法》文章!
②每变化固态增量:在研究中,我们可能遇到这样的情况:连续自变量的数值变化范围跨度非常大或非常小,此时,自变量每变化1个单位,回归模型的OR/HR/β值可能就会很小,无法体现实际的临床意义。
因此,实际研究中研究人员会使用每变化固定增量的形式进行数据转换,像下面这张表格中,ModelⅠ的TyG-BMI,每增加10 Units时,研究人群的死亡风险会增加6.7%(HR=1.067,95% CI:1.049-1.086),如果是以传统1个单位衡量,HR值会更小。
固态增量转换方式:其实很简单,100 units,只需要将原始变量除以100代入模型即可;同样,如果是0.1 units(变化幅度缩小10倍),只需要将该原始变量乘以10即可。
③每变化1个标准差(per SD increase):其应用场景主要对于罕见的非常规新指标,在每增加1个单位的临床意义不是很明确的情况下,可以将其转换为每增加1个SD的形式纳入回归模型中,由此可以指导患者根据自身实际的测量结果,看看自己是处于人群分布水平的几个标准差范围内,进而来评估其对应的风险会改变多少。
标准化转换方式:实现这种形式的转换也非常简单,可以通过以下两种方式:
将原始的连续型变量进行标准化处理后再带入到回归模型中(更常用)。
直接把原始变量带入到模型中,得出未标化的回归系数,然后再乘以该自变量的标准差,此时即为自变量每增加1个SD时对因变量的影响。
这个统计工具是由浙江中医药大学郑卫军老师研发的,以R语言为基础的风暴统计平台,操作便捷简单,无需代码基础,统计小白也可轻松上手完成多种分析,如倾向性得分匹配、预测模型、趋势性分析,绘制亚组森林图、KM曲线、RCS曲线等,全部免费使用!
https://www..medsta.cn/software
首先,点击下方链接,来到平台操作界面,根据图片提示,完成数据的导入。
https://www.zstats.cn/software2/log2/
接着来到"数据整理"模块,开始我们的连续变量转换处理!
1.按照一定的分组切点转换为分类变量
选入我们的目标连续变量后,平台会自动提供描述性结果,包括中位数,标准差,最大值,最小值,中位数,四分位数,四分位数间距,标准误等,为数据转换提供节点依据。
①自定义分组:例如说这里我想把BMI按照评价标准按照18.5,24,28的界值分为4组。
输入分组临界值,中间使用英文逗号隔开!最后点击"开始分组"。
这里需要说明的是,平台的分组方式是左闭右开,如这里BMI分组是(-∞,18.5),[18.5,24),[24,28),(28,+∞)。
②四分位数分组/中位数分组:只需要勾选相应选项,点击"开始分组"即可。
操作完成后,右侧结果框就会自动成新的变量,同一个变量可以处理多次,很适合在数据探索阶段进行尝试,选择最佳的分类结果。
2.通过等比例缩放或计算,转换为新连续变量
①正态化转化:以log转换为例,只需要填写"新增变量名"、"新增变量的值",点击确认即可。
②每变化固定增量(0.1U,10U):操作步骤相同,不过需要注意的是平台的数据计算与R语言一样,乘号使用*,除号使用/。
③每变化1个标准差(per SD increase):这个数据转换单独部署在趋势性分析模块,常常结合趋势性分析一起使用。来到操作界面后,步骤也很简单,选入变量→点击数据标准化→开始处理。
https://www.zstats.cn/software2/trend1/
(标准化处理网址)
标准化处理后的新变量是以scale为后缀的,不需要任何公式基础,简单操作就完成了计算!
以上便是我们连续数据转换的全部内容啦~此外,平台还有许多其他常见规范表格的绘制:三大回归影响分析、预测模型、倾向性得分匹配、趋势性分析......欢迎大家试用哦!
如果您在使用过程中出现报错,可以参考下方推文,排查一下问题所在哦!