1.随机试验(Randomized Controlled Trial)
实验设计中,控制混杂因素最主要方法是随机试验。只有在完全随机的情况下,才能保证混杂因素在自变量与因变量之间影响完全相同,这是一种理想化假设。然而,随机试验在实际运用中有很多限制,例如,高昂的研究费用、实际操作的困难性、不适用于发生率很低的试验等。
2.分层分析(Stratified Analysis)
分层分析是一种常用的控制混杂因素的方法,它是将数据资料按照某个需要控制的混杂因素进行分层,然后再估计暴露/处理因素与研究结局之间的关联性。
3.多因素调整分析法(Multivariable risk adjustment)
多因素调整分析法适用于研究中存在较多的混杂因素,且混杂因素较为复杂(例如混杂因素为多分类变量或连续变量),克服了分层分析仅仅适用于混杂因素较少,且多为分类变量的缺点。在观察性研究中,我们通常可以构建一个多因素调整的回归方程,来探讨对结局有独立作用的影响因素。其中方程的因变量为结局事件,而自变量既包括研究者关注的暴露/处理因素(如药物、手术等),也包括其他可以影响结局的混杂因素(如年龄、性别、疾病严重程度等)。在多因素调整分析方法中,根据因变量的类型不同,我们最常应用到的三种回归模型即:多重线性回归、logistic回归及Cox回归。
4.工具变量分析(Instrumental Variable Analysis, IVA)
工具变量分析是一种用来控制测量误差和未知混杂因素引起的偏倚的估计方法,其基本思想为通过选择有效的工具变量,采用二阶段回归分析来消除未知混杂因素与暴露/处理因素之间的关系,使得混杂因素在暴露/处理组与对照组之间的分布是均衡的,从而获取暴露/处理因素对结局变量无偏的效应估计值。缺点是工具变量选取难度大,且易引起选择偏倚。
5.倾向得分匹配法(Propensity Score Matched)
采用多个配对变量跟分组变量建立回归方程,根据方程每个研究对象算出一个值作为得分(score),评分相近的研究对象匹配。可用于观察性研究:队列研究设计,分组变量是暴露因素X;病例对照研究设计,分组变量是结局指标Y。PSM优点:提高论文证据力度,控制混杂、防止偏性。缺点:需要样本量大,匹配后引起的样本量损失不容忽视,甚至引起原有研究样本代表性的问题。