分享

科研助力 | 因子分析及其相关论文推荐

 Greatguy瑞 2019-03-17

因子分析(Factor Analysis)是一种非常有用的多变量分析技术。

要想学好多变量分析技术,一是要理解多元回归分析,二是要理解因子分析;这是多变量分析技术的两个出发点。

▷ 为什么这么说呢?因子分析真的有这么重要吗?

多元回归分析是掌握有因变量影响关系的重点,无论什么分析,只要研究的变量有Y,也就是因变量,一般都是回归思想,无非就是Y的测量尺度不同,选择不同的变形方法。而因子分析则是研究没有因变量和自变量之分的一组变量X1 X2 X3 ... Xn之间的关系。

在市场研究中,我们经常要测量消费者的消费行为、态度、信仰和价值观,当然最重要的是测量消费者的消费行为和态度!我们往往采用一组态度量表进行测量,用1-5打分或1-9打分,经常提到的李克特量表。 

上面的数据是我们为了测量消费者的生活方式或者价值观什么的,选择了24个语句,让消费者进行评估,同意还是不同意,像我还是不像,赞成还是不赞成等等,用1-9打分;

因子分析有探索性因子分析和证实性因子分析之分,这里我们主要讨论探索性因子分析。证实性因子分析主要采用SEM结构方程式来解决。从探索性因子分析角度看:

  1. 一种非常实用的多元统计分析方法;

  2. 一种探索性变量分析技术;

  3. 分析多变量相互依赖关系的方法;

  4. 数据和变量的消减技术;

  5. 其它细分技术的预处理过程;

▷ 我们为什么要用因子分析呢?
    

首先,24个可测量的观测变量之间的存在相互依赖关系,并且我们确信某些观测变量指示了潜在的结构-因子,也就是存在潜在的因子;而潜在的因子是不可观测的,例如:真实的满意度水平,购买的倾向性、收获、态度、经济地位、忠诚度、促销、广告效果、品牌形象等,所以,我们必须从多个角度或维度去测量,比如多维度测量购买产品的动机、消费习惯、生活态度和方式等;
    

这样,一组量表,有太多的变量,我们希望能够消减变量,用一个新的、更小的由原始变量集组合成的新变量集作进一步分析。这就是因子分析的本质,所以在SPSS软件中,因子分析方法归类在消减变量菜单下。新的变量集能够更好的说明问题,利于简化和解释问题。
    

当然,因子分析也往往是预处理技术,例如,在市场研究中我们要进行市场细分研究,往往采用一组量表测量消费者,首先,通过因子分析得到消减变量后的正交的因子(概念),然后利用因子进行聚类分析,而不再用原来的测量变量了!我想这是市场研究中因子分析的主要应用!  

其实,你可以想象,例如在多元回归分析中,如果多个自变量存在相关性,如果可以用因子分析,得到几个不相关的变量(因子),再进行回归,就解决了自变量共线性问题。(理论上是这样的,但市场研究很少这么操作!)


下面是要理解的因子分析的基本概念:

  1. 一种简化数据的技术。

  2. 探索性因子分析和证实性因子分析

  3. 因子分析就是要找到具有本质意义的少量因子。

  4. 用一定的结构/模型,去表达或解释大量可观测的变量。

  5. 用相对少量的几个因子解释原来许多相互关联的变量之间的关系。

  6. 描述的变量是可观测的——显在变量。

  7. 相关性较高,联系比较紧密的变量放在一类。

  8. 每一类变量隐含一个因子——潜在变量。

  9. 不同类的变量之间相关性较弱。

  10. 各个因子之间不相关。

⇲ 下面我们通过PASW Statistics软件来进行操作!

在进行因子分析前,大家务必明确你的数据集中24个变量是否存在缺失值问题!默认情况下系统采用Lisewase,也即是只要24个变量有一个缺失,该记录删除,也就是说如果你的样本存在大量缺失,可能造成因子分析的样本量大量收缩!


我们将24个变量选择后,选择描述对话框,可以选择KMO和Bartlett的球形度检验!这个指标主要从统计角度给出24个变量是否存在内在结构,也就是潜在因子结构,说白了,就是不适合因子分析!极端可能就是所有24个变量都测量的是一个维度的因子概念,另一个极端就是24个变量全部是正交不相关的,根本不存在因子,不适合因子分析!


⇲ 接下来我们要选择抽取因子的方法:

在方法上,我们如果不是非常理解或有特殊要求,就选择主成份方法;这也是为什么在SPSS软件中没有独立的主成份分析,其实是包容在因子分析中了!记住一点:如果24个变量存在因子结构,用什么方法得当的结果基本相同!况且,市场研究采用量表24个变量的测量尺度都是一致的!如果你没有特殊要求,默然选择抽取特征值大于1的因子!选择碎石图——也是表达因子选择的图示方式!因为是研究结构,所以从相关矩阵出发,实际上就是标准化后的方差矩阵,没有了量纲!

⇲ 接下来,我们选择因子旋转方法!

因子旋转是因子分析的核心技巧,也是我们期望得到的结果。旋转的概念就是坐标变换,不过旋转有正交和斜交旋转差别罢了!从解释因子结构的角度正交旋转是最容易解释的,得到的因子也是不相关的;斜交则得到的因子具有相关性,但更符合或能捕捉数据的维度!所以,有一种说法,如果是接下来要进行市场细分,最好采用斜交更好!当然,我们最常用的,一般采用最大方差旋转!

⇲ 最后,有一个选择要完成,就是选项对话框!


我们要选择按大小排序,并且将因子负荷小于0.4的都不显示,这样我们看的更清楚!


为什么选择0.4呢?这主要依赖样本量和绝对误差的考虑!

从样本量角度看因子负荷,大部分市场研究样本量都在200以上!记住:如果你不能精细考虑,就选0.4吧!

⇲ 下面我们就可以执行了!我们看看结果:

从结果可以看出,Bartlett球检验是显著的,说明存在因子结构,另外KMO=0.764,较适宜因子分析!,一般KMO=0.8就是Excellent了!


⇲ 接下来看因子方差解释

总的方差解释是63.448%,总共存在7个公因子,说明如果将来不用24个变量,而改用这7个因子可以说明原来24个变量的63.4%的变差。(如果你确认了这样的结果,可以选择把7个因子得分保存为变量了)


如果我们只是看非旋转的话,就是主成份分析部分了,我们来看旋转后的结果:


我们可以看到因子排列非常恰当和明显,这都是因为我们在选项中选择了排序和压缩了小于0.4的负荷值!


你可以看到F1_6变量在3和4因子上都有负荷,这就产生了双负荷!如果存在大量的双负荷,我们就要考虑是否要斜交旋转了!


⇲ 最后,我们要完成因子命名

如果不能给出好的因子命名,我们放弃24个变量用7个因子变量都不知道意义,如何分析呢!当然如何命名因子是个艺术活了!

我一般的思考方式是:

  1. 先看意义,哪些变量负荷在一个因子上,是否能解释这些因子;

  2. 如果可以,选择因子名称;

  3. 如果不能给出恰当名字,就选择负荷变量的简称综合在一起,先代表着;

  4. 随着后续的分析,因子慢慢确定;


到这里因子分析就完成了。

推荐阅读

♚朱正才. 语言测试的能力结构与因子分析法[J]. 外语教学, 2014, (5):50-54.

本文首先探讨了语言测试效度研究中的一个关键问题——语言能力是什么?可分不可分、如何分?接着还探讨了三种因子分析方法在分析一份语言测试试卷的能力结构时的运用情况,并提出尝试用语言能力聚合度,辨别度和拟合度来共同描述一份试卷的语言能力结构特征.实证研究部分表明,这三个指标确实能很好地刻画大学英语四级考卷的语言能力结构特征.

♚华维芬. 试论外语学习动机与学习者自主[J]. 外语研究, 2009, (1):57-62.

国内外学者对外语学习动机和自主学习两个课题都有较为广泛、深入的研究,但对两者之间的关系鲜有论述。本文在回顾了外语教学研究领域中几种主要动机理论模式的基础上,采用问卷调查的方法考察了学习动机与自主学习的关系。受试对象为某大学109名英语专业本科生。文章用SPSS统计软件对收集的数据进行了因子分析,并预设了5个公因子,分别是:内在动机、外在动机、教师角色、学习成败的归因和自主学习方法。研究结果表明自主学习和各因素之间存在不同程度的相关性。文章最后提出了激发学生学习动机、培养学生自主学习能力的几点思考

♚冯欣. 聚焦思辨能力的英语课堂教学生成影响因子分析[J]. 西安外国语大学学报, 2015, (2):83-86.

英语教学中对思辨能力的培养已获广泛认同。影响英语课堂教学生成思辨能力的因素很多,具体影响程度却不同。通过因子分析,以选取的20个影响因素作为观测变量进行降维,最终提取7个潜在影响因子进行重新命名。依据因子主成分贡献率确定因子对聚焦思辨能力的英语课堂教学生成影响程度,影响最大的是课堂教学方法,其后依次为教学实践经验、教学信念、学情评估、情感、动机以及课堂氛围等。

♚李清华, 孔文. 中国英语专业学生写作能力构念研究:专家和评分员的视角[J]. 外语教学, 2010, (5):76-80.

为了设计TEM4写作测试新的分项式评分标准,我们根据文本特征模式获得的文本特征来界定TEM4写作能力的构念。问卷调查获得的数据和因子分析得到的结果表明,基于写作能力理论的中国英语专业学生EFL写作能力的构念主要包括思想表达、组织结构、语言的准确性、丰富性、得体性以及写作规范等表面特征。本研究的结果为TEM4写作测试分项式评分标准的制定提供了依据。

♚吴红云, 包桂英. 英语专业硕士研究生专业学习动机与自我认同关系的实证研究[J]. 外语教学, 2013, (2):52-55.

本研究采用问卷调查方式,探究了151名英语专业硕士研究生的专业学习动机和自我认同状况及两者之间的关系。我们对问卷数据进行了因子分析和方差分析,结果表明:1)英语专业硕士研究生的专业学习动机包括'自我实现型'、'社会需求型'、'专业认可型'三种类型;2)专业学习动机的三种类型均与自我认同之间存在显著正相关;3)学习者个人背景因素对他们的学习动机和自我认同状况影响不明显;4)专业学习动机水平的高下对学习者的自我认同状况有一定的预测性。 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多