转自个人微信公众号【Memo_Cleon】的统计学习笔记:混杂因素控制:病例对照匹配(CCM)。 在利用SPSS进行倾向性得分匹配的时候(Data>>Propensity Score Matching),你会发现在「数据」的菜单下还有另外一个类似的过程:病例对照匹配(Case Control Matching),两个操作界面内容也神似。 匹配其实算不上是一种分析方法,而是一种数据的处理方式。简单说匹配就是“找对象”的过程,为病例组的每位研究对象在对照组中寻找门当户对的对象的过程。怎么样就算门当户对呢(匹配条件是什么)?就是研究对象的某些特征相同。你可以把这些特征通过logistic或Probit模型转换成一个倾向性得分作为匹配条件,也可以直接对每个特征进行绝对匹配,比如处理组里面有一个25岁的吸烟男性患者,那么对照组你就需要找一位不患该病的25岁上下吸烟的男性来与之匹配。一般来说分类变量要求相同,连续变量则可以设定一个范围(匹配容差)。范围越窄,匹配的病例越精确但匹配成功的病例会越少,范围越宽能匹配的病例越多但可能达不到控制混杂的效果。
匹配容差结果见下表,首先进行精确匹配,匹配1611845次,0.003%匹配成功。在精确匹配成功的前提下,再进行mmarried的匹配,匹配容差为0,匹配1611796次,(100-59.749)%匹配成功。在精确匹配和mmarried匹配成功前提下,在进行alcohol的匹配……。 通过上述CCM过程,我们就有了两个数据集。一个是原始数据,增加了EC、matchG及matchid字段,对应的是与病例组匹配的对照组病例个数、匹配组变量和id,我们可以据此获得匹配成功的病例组。另外一个是新生成的对照组,其中全是满足匹配条件的对照组的病例信息,以及被匹配的病例组matchG及matchid。 原数据Data>>Select Cases…
在新生成的CCM数据集中导入对照组病例: 新生成的CCM数据集Data>>Merge Files>>Add Cases…
至此病例对照匹配已经完成,需要注意的是在新的数据集CCM中,新增加的字段在病例组和对照组中表示的含义是不一样的,前面已经有提及。接下来需要验证一下匹配病例是否满足组间均衡,如果满足组间均衡条件就可以对两组进行分析,如果仍然不满足则需要对容差做适当调整。本例容差设置相对比较严格,一次成功,但我们也损失了大量的样本,原始样本4642例(吸烟:不吸烟=864:3778)例,经设定条件的病例对照匹配后,只剩1040例(520:520)。当然你可以再把容差设置的相对宽松一下重新进行匹配,笔记只演示过程,就不再重复进行了。 转自个人微信公众号【Memo_Cleon】的统计学习笔记:混杂因素控制:病例对照匹配(CCM)。 END |
|
来自: Memo_Cleon > 《待分类》