标准化回归系数 那该如何对标准化回归系数进行解释呢? 咱们分两步来阐明: 第一步:为你打开标准化回归系数计算的“黑匣子”,弄懂统计软件计算标准化回归系数的具体思路; 第二歩:介绍标准化系数的实际意义及其应该场景。 第一步 标准化回归系数的‘黑匣子’ 在多元线性回归中,通常各自变量取值的单位及其离散程度是不同的,所以量纲不同的各回归系数之间不能直接比较大小。 为此,可先对所有的自变量和因变量进行标准化转换,即将变量减去其均值后再除以标准差。随后,以标准化变换后的因变量为因变量,以标准化后的各自变量为自变量,重新建立回归方程,得到的回归系数即标准化回归系数。这就是SPSS、SAS等统计软件计算标准化回归系数的“黑匣子”。 平常我们在SPSS中进行一般的多元线性回归操作,都会得出如下的输出结果: 现在,我们按照标准化回归系数的生成思路,一步步生成标准化回归系数,看与上面结果是否一致: 步骤一、对所有的自变量和因变量进行标准化转换,即将变量减去其均值,之后再除以标准差。 SPSS操作步骤如下: 由上图可以看出,已生成标准化变量。 步骤二、以标准化变换后的因变量为因变量,以标准化后的各自变量为自变量,重新建立回归方程,得到的回归系数即标准化回归系数。 由上图与开篇的第一张图比较可以看出,蓝色框中的非标准化回归系数与一般线性回归操作的标准化回归系数一致。 其实,从上图中就可以看出:变量标准化后的回归分析中,得到的非标准化回归系数即标准化回归系数(蓝色框与红色框结果一致)。 至此,第一步验证成功! 第二歩 标准化系数的实际应用 由于因变量与自变量的标准化转换后,标准化变量均是服从均值为0,标准差为1 的标准正态分布,且十分重要的一点是,所有的标准化变量均没有了量纲,且离散程度相同(标准差均为1)。 所以,计算出的标准化回归系数不受变量的量纲影响。进而,各自变量的标准化回归系数之间是可以直接比较大小的。 标准化的变量是以一个变量自身的标准差为单位的。标准化回归系数也就是其他自变量保持不变的情况下,该自变量变化一个单位(也就是一个标准差),因变量变化多少个单位的标准差。 各自变量的标准化回归系数的比较反映各自变量对因变量的贡献谁大谁小。 在实际应用中,遇到“各自变量对因变量的作用大小比较”的问题。在排除了强影响点和多重共线性的前提下,应看各自变量的标准化回归系数。因为标准化回归系数消除了自变量单位的影响,具有可比性。 下面,将开篇的案例结果进行解释: 根据上表结果可以看出,对肺活量的贡献大小,从高到低依次为身高、体重、胸围。在这三个自变量中,身高对肺活量的影响作用最大。 总结 标准化回归系数是指数据标准化以后算出来的回归系数,非标准化回归系数就是用原来的数据算出来的回归系数。 如果是要写出回归方程的话,就要用非标准化回归系数。 如果是要比较各自变量对因变量的贡献大小,就要用标准化回归系数来比较。 ps:另外,路径分析中的路径参数就是标准化回归系数。标准化回归系数还可以用于进一步的路径分析中。统计分析方法学到最后你会发现很多相互连通的地方,很有意思。 松哥说:多元线性回归中不可避免会碰到非标准化回归系数和标准化回归系数的结果解释。跟着本期一起,自己动手验证一下标准化回归系数的计算思路,加深印象,懂了思路才会应用哦!一句话:用标准化回归系数来比较各自变量对因变量的贡献大小,其他的应用(如路径分析等)后续有机会再聊。一起加油吧! |
|