如果线性回归的自变量是分类的,对于SPSS用户来说是无感的,直接按数值变量拟合直线,因为SPSS线性回归菜单没有内置分类自变量做哑变量的过程。但是R不同,用lm()函数拟合线性时,如果自变量是分类的,那么模型会自动将其做哑变量处理,显然是更符合线性回归的条件要求。考察不同“职位等级”对“薪金”的影响。其中“职位等级”为三水平分类变量,1代表基层,2代表中层,3代表高层。fit <- lm(salary~jobcat,data = employee) 自动给出两个哑变量对应的回归系数,jobcat2的estimate表示与1水平相比2水平多出多少薪金,即1水平基层作为参照。自动以低水平作为参照形成哑变量拟合线性结果,这是R默认的设置。以高层职位等级为例通俗解读一下,与基层职位相比,如果是高层管理人员的级别,那么可以多赚36139美元。下面给出SPSS的结果,当然两个对比一下结果完全一致。
|