分享

SPSS分析技术:列联表分析;男生肺活量一定比女生大吗?

 蓝不浅 2018-01-30

基础准备

之前介绍的参数估计和参数检验面向的都是定距或定比数据总体,也就是我们最常面对的数据类型,例如,温度,湿度,金钱,身高和体重等等,这些数据可以计算总体均值和标准差,以表示数据总体的集中趋势和离散程度。


对于定类数据和定序数据这类数据总体,因为计算均值和方差是没有意义的,所以应该用非参数检验对它们进行分析,而列联表分析就非参数检验中的一种,特别适用于定类数据的分析。例如,在学校里会将学生按照考试成绩分为优、良、中、差等类别并计算属于每种类别的学生个数,学生个数数据就是定类数据;在医疗领域,疼痛是很难被量化和分析的,因此,对于疼痛的分级成为主流量化方式,疼痛级别的数据也属于定类数据;在社会化调查中,调查人们对于某个事件或问题的态度会用到量表对态度进行分级,这些分级数据也属于定类数据。


列联表分析基础

列联表指一个频率(频数)对应两个变量的表,其中一个变量用于对行进行分类,另一个变量用于对列进行分类。在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析被称为列联表分析。列联表分析经常用来分析问卷调查的数据,可以比较好地反映出两个因素之间有无关联性,两个因素与现象之间的相关关系。


根据收集的样本数据,产生二维或多维交叉列联表。列联表是两个或两个以上的变量交叉分组后形成的频数分布。它由表头、行、列、排序、计算和求百分比等部分构成。SPSS列联表分析程序能对两个或多个分类变量进行联合描述,可生产二维甚至n维的列联表,并计算相应的行、列合计百分比和行、列汇总指标。


在交叉列联表的基础上,对两两变量间是否存在关联性进行检验。列联表的频率分析结果不能直接用来确定行变量和列变量之间的关系及关系的强弱。要获得变量之间的关联性信息,不仅靠描述统计的数据,还需借助一些变量间相关程度的统计量和一些非参数检验方法。SPSS提供了多种适用于不同类型数据的相关系数的表达式。这些相关性检验的零假设都是:行和列变量之间相互独立,不存在显著的相关关系。根据SPSS检验后得出的相伴概率判断是否存在相关关系,如果相伴概率值P≤0.05,那么拒绝零假设,行列变量之间彼此相关;如果相伴概率值P>0.05,那么接受原假设,行列变量之间彼此独立。


相关性检验的方法

1、卡方检验

常用于检验行和列变量之间是否相关的检验方法是卡方检验。卡方检验首先假设行和列变量之间是相互独立的,并得到期望频数,通过比较所有期望频数和实际观测频数的差异来构造一个卡方统计量,如果卡方统计量大于临界值,则说明差异过大,因而假设不成立,行变量和列变量不相互独立;反之,则认为行和列变量相互独立。卡方统计量的计算公式为:

卡方统计量综合了所有实际频数与期望频数的差异,因此卡方统计量的大小可以反映行和列变量的独立性。卡方统计量越大,说明实际频数与期望频数的差异越大,此时行和列变量的独立性越弱。卡方统计量近似服从自由度为(r-1)×(c-1)的卡方分布。SPSS在进行运算之后,会给出相应的相伴概率P值,如果P小于给定的显著性水平,则拒绝原假设,认为行和列变量之间是不独立;反之,则认为行和列变量之间是独立的。


2、列联系数

相关系数的范围在0到1之间,其中0表示行变量和列变量之间不相关,而接近1的值表示行变量和列变量之间的相关度很高。相关系数的计算方法有很多种,其中最常用的是相关系数有皮尔森相关系数和斯皮尔曼相关系数,不同的相关系数适用于不同的数据类型。


案例分析

某中学组织初中和高中学生进行体检,测量了他们的身高,体重,血压,肺活量和心率等指标。参与体检的学生人数为451,肺活量的最大值和最小值为1360和5620。用列联表分析性别变量和肺活量变量是否有相关性。体检数据如下表:

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)


分析思路:需要分析的是性别变量和肺活量变量是否有相关性,其中,性别变量为定类变量,而肺活量变量为定距变量,所以需要先将肺活量变量转换为定类变量,然后再利用列联表进行分析。


分析步骤

1、将肺活量的定距变量转换成定类变量,选择【转换】-【重新编码为不同变量】。如下图所示,将肺活量从1200到5700分成9个等级,每个等级之间的距离为500。


2、列联表分析;选择【分析】-【描述统计】-【交叉表格】,在跳出的对话框中进行如下操作,在行变量中选择性别,在列变量中选择肺活量的定类变量。点击【统计】按钮,将卡方和相关性选中,其它保持系统默认。


结果输出

1、描述性统计结果;

从个案处理摘要表可知,本次列联表分析的有效数据为449人,其中2人数据缺失。由交叉列联表可以看出不同肺活量水平上的男生和女生的人数分布。


2、卡方检验结果;

从卡方检验结果表格可知,卡方检验的相伴概率p值为0.000,小于0.05,说明行变量和列变量不是相互独立的,即肺活量和性别之间不是独立的,而是存在相关性。


3、相关性分析结果

皮尔森相关系数r等于-0.344,相伴概率p为0.000,说明两个性别变量和肺活量变量存在一定的负相关性,即男生的平均肺活量比女生的大。斯皮尔曼相关系数给出了同样的结果。

从条形图看出男女生的肺活量分布明显不同,说明肺活量的大小和性别有一定的相关性。


所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多