分享

统计学学习之路——因子分析学习分享

 东西二王 2019-05-16

因子分析(降维)

1.、为什么做因子分析:实际门店问题中,往往我们会选择潜力最大的门店作为领航店,以此为样板,实现业绩和利润的突破及未来新店的标杆。那么,选择领航店过程中我们要注重很多因素,比如所在小区的房价,总面积,户主年龄分布、小区户数、门店面积,2公里范围内竞争门店数量等。收集到所有的这些数据虽然能够全面、精准的确定领航店的入选标准,但实际建模时这些变量未必能够发挥出预期的作用。主要体现两方面:计算量的问题;变量间的相关性问题。

2、解决方法:最简单直接的方案就是削减变量个数,确定主要变量,但这会导致信息不全面的问题,因子分析以最少的信息丢失为前提,将众多的原有变量综合成少数的综合指标,名为因子。

3、因子分析特点:因子个数远小于变量个数;能够反应原变量的绝大数信息;因子之间的线性关系不显著;因子具有命名解释性

4、因子分析步骤:一、原有变量是否能够进行因子分析;二、提取因子;三、因子的命名解释;四、计算因子得分;五、综合评价

5、因子分析的数学模型:

X1=A11F1 A12F2 A13F3 --- A1kFk

X2=A21F1 A22F2 A23F3 --- A2kFk

-

-

-

Xp=Ap1F1 Ap2F2 Ap3F3 --- ApkFk

6、应用举例:

收集到18年全国31个省市自治区各类经济单位,包括国有经济单位、集体经济单位,联营经济单位、股份制经济单位和其他经济单位的人均年收入数据,现对全国各地区人均年收入的差异性和相似性进行研究。

一、考察原有变量是否适合进行因子分析。

检验收集到的变量是否存在线性关系,应用方法:相关系数矩阵、巴特利特球度检验和KMO检验。

原有变量的相关系数矩阵:

统计学学习之路——因子分析学习分享

统计学学习之路——因子分析学习分享

巴特利特球度检验和KMO检验

KMO值为0.882,接近1,说明变量相关性很强(越接近1越强)

从巴特利特球度检验看,假设相关系数矩阵与单位阵无显著差异。P值接近0,若显著性水平为0.05,P<0,则拒绝原假设,认为相关系数矩阵与单位阵有显著差异。

经检测原有变量间有相关性关系,可以进行因子分析。

二、提取因子

根据原有变量的相关系数矩阵,采用主 成分分析法提取因子并选取大于1的特征值(某一因子载荷的平方和及因子的方差)。

统计学学习之路——因子分析学习分享

因子分析变量的共同度(载荷矩阵中i行元素的平方和)

有三个经济单位变量的信息缺失较为严重(金40%)。

重新指定提取标准,提取2个因子。

统计学学习之路——因子分析学习分享

由上图可知,所有变量的共同度均较高,因子提取的效果较理想。

统计学学习之路——因子分析学习分享

因子解释原有变量总方差的情况

统计学学习之路——因子分析学习分享

因子载荷矩阵

单位1=0.955F1-0.095F2

单位2=0.923FI 0.057F2

三、因子的命名解释

对因子载荷矩阵实行正交旋转(载荷矩阵*正交向量),使因子具有命名解释性。

统计学学习之路——因子分析学习分享

第一个因子主要解释内部投资经济单位

第二个因子主要解释外来投资经济单位

四、计算因子得分

采用回归估计法估计因子得分系数

统计学学习之路——因子分析学习分享

F1=0.223 国有 0.196集体 0.656联营 0.331股份-0.062外商 0.020港澳台-0.519其他

F2=-0.002国有 ------

计算两个因子得分时,联营经济单位和其他经济单位的权重较高,方向相反,与因子的实际意义相吻合。另外、因子得分的均值为0。正值表示高于平均水平,负值表示低于平均水平。

五、综合评价

统计学学习之路——因子分析学习分享

得出结论1:北京第2因子得分最高,表示外来投资经济单位人均收入远高于其他省份,第1因子得分在平均值附近,表明内部投资经济单位的人均年收入与其他地区的差异不大,处于平均水平。

其次,对各地区人均年收入进行综合评价。以两个因子的方差贡献率为权数。

F=0.45/(0.45 0.39)*F1 0.39/(0.45 0.39)F2

得出结论2:人均收入较高的省份是北京、上海、广东等,多属经济文化中心或东南沿海地区。人均收入较低的省区有内蒙古。山西。青海等,多数内陆或西北边远地区。

职场小白,学习分享,如有问题,欢迎指正!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多