关键词:SPSS、主成分分析 主成分分析(principal components analysis),是将多个数值变量或指标简化为少数几个相互独立的综合变量或指标的过程,整个过程是一个降维的过程。医学研究中,常用主成分分析对有多个观察指标或多个影响因素的数据进行指标整合,来降低分析工作的难度和工作量。 本期,我们就来介绍主成分分析的基本原理、适用范围及其在SPSS中的具体操作。 下方为视频版和音频版,含软件操作步骤 对于主成分分析,我们主要应掌握以下几点: (1)主成分的贡献率和累积贡献率 主成分分析把m个原始指标的总方差分解为m个互不相关的综合指标的方差之和,使第一主成分的方差达到最大,最大方差为。表明了第一主成分的方差在全部方差中所占的比值,即第一主成分的贡献率,贡献率的值越大,表明这个指标综合原始指标的能力越强。主成分是按特征值的大小顺序排列的。 则第i主成分的贡献率表示为: 则前k个主成分的累计贡献率表示为: (2)主成分个数的选取 一般来说,主成分的保留按以下原则来确定: ①当前k个主成分的累计贡献率达到60%以上时,则保留前k个主成分; ②若主成分的特征值,则保留,否则就去掉该主成分; ③若碎石图的拐点位置出现在第k个主成分点,就尝试保留前k个主成分。 (3)因子载荷 因子载荷是第i主成分与第j原始指标之间的相关系数,反映了主成分与原始指标之间联系的密切程度与作用方向,第i主成分的特征值的平方根与第j原始指标的系数的乘积,因子载荷的表示为: 一般来说,主成分分析用于多个连续数值型的变量。 现收集了一份慢性阻塞性肺疾病的焦虑量表的评分数据,为了更进一步的综合考察这批患者的焦虑状况,欲采用主成分分析查找出少数几个相互独立的主成分,以便综合评价患者焦虑状况。在SPSS中,主成分分析是因子分析的一部分,具体操作如下: (1)在SPSS中的具体操作 ①依次点击“分析——降维——因子”。 (点击图片查看大图) ②出现“因子分析”分析窗口。 (点击图片查看大图) ③将所有变量项选入“变量”框中,点击“描述”,勾选“KMO和巴特利特球形检验”。 (点击图片查看大图) ④点击“提取”,出现“因子分析:提取”对话框,勾选“碎石图”,提取方式为“基于特征值:特征值大于1”。 (点击图片查看大图) ⑤点击“旋转”,出现“因子分析:旋转”对话框,勾选“最大方差法”。 (点击图片查看大图) ⑥点击“得分”,出现“因子分析:因子得分”对话框,勾选“保存为变量”和“显示因子得分系数矩阵”。 (点击图片查看大图) ⑦点击“继续”、“确定”,得到分析结果。 (2)结果解读 ①首先,查看“KMO和巴特利特检验”表,表中,KMO值=0.934>0.7,且巴特利球形检验显著性P=0.000<0.05,提示量表通过了KMO和巴特利特球形检验,量表非常适合做因子分析。 ②其次,查看“总方差解释”表,可以看到,本次提取的主成分有三个主成分特征值大于1,且前三个主成分的累计方差贡献率为73.762%;而第四主成分的特征值=0.946<1,第五主成分的特征值=0.893<1。 (点击图片查看大图) ③然后,查看碎石图,可以看到,图中拐点明显出现在第5主成分位置处,结合“总方差解释”表中主成分特征值的大小情况,尝试提取5个主成分。 (点击图片查看大图) ④重复上述主成分分析操作,在“因子分析”窗口,点击“提取”,在出现的“因子分析:提取”窗口中,选择“提取:因子的固定数目:要提取的因子数=5”,并点击“继续”、“确定”。 (点击图片查看大图) ⑤此时,“总方差解释”表的结果发生了变化,可以看到,提取了5个主成分,前5主成分的方差贡献率为82.957%大于之前的73.762%,提取的主成分对原指标的解释能力为82.957%,有所提高。由此,本例通过主成分分析,将原始共20个变量归类为5个综合性的主成分。 (点击图片查看大图) ⑥查看“旋转后的成分矩阵”表,可以看到各题项在5个主成分的得分情况,题项A1-A4在第3主成分上的得分要高于其在其他主成分上的得分,可以理解为第3主成分对题项A1-A4有更强的解释力。通过“旋转后的成分矩阵”表,我们可以根据各题项所属主成分,结合专业知识,对主成分进行命名,从而达到将20个变量归类为5个综合变量,以方便研究的目标。 |
|