在医学统计中,最多用到的就是差异分析。不同的变量类型,使用不同的统计学方法来进行统计分析,SPSS中的操作方法也不同。本期我们来详细教大家如何在SPSS中对数据进行差异分析。本期课程分为四个部分:比较均值、T检验、独立样本T检验、配对原本T检验! 进行差异分析,首先要确定研究变量也就是因变量的数据类型。通常会分类两大类:一类是连续数值型变量,也叫做连续变量,例如身高、年龄等;另一类为分类变量,例如性别、血型、学历等。对于连续变量的差异性分析,首先,我们要检验连续变量是否符合正态分布。对于符合正态性分布的变量,要采用参数类的统计分析方法;对于不符合正态性分布的,要采用非参数检验方法。本期教程中所讲解4个方法的均为参数类检验方法,关于非参数类检验方法,会在以后的课程中详细讲解,敬请关注! 我们将会在我们的订阅号【杏花开生物医药统计】中,每天更新更多的SPSS使用技巧和案例教程,请大家关注哦! 我们搜集了31例患者的相关数据,要计算出不同性别的骨头高度的均值(图1),这里已经检验过骨头高度是服从正态性分布的,关于如何检验正态性分布,在我们的订阅号【杏花开生物医药统计】有详细的讲解,如果有还没学到的朋友,可以去查阅哦。 
这里值得注意的是,在之前的课程中,我们曾讲到过在“分析”--“描述性分析”(图2)中同样可以计算均值,与下面要讲解的参数类分析中的比较平均值有何不同呢?他们的区别在于:前者只能分析整个变量的均值,而后者(图3)可以按不同分组分类来计算每一个分组或分类的均值。 

下面就来具体讲解如何分析不同性别的患者的骨头高度的均值: SPSS中的操作步骤 ①点击“分析”--“比较平均值”--“平均值”(图4) 
②将“骨头高度”选入因变量列表,将“性别”选入自变量列表,也叫分组变量列表(图5) 
③点击右侧“选项”,勾选“最小值”、“最大值”、两个指标,并勾选下方的“Anova表”,线性相关度检验(图6)后,点击继续--确定。 
④结果分析 
由上表(图7)可以看出:男性的骨头高度均值为49.2813,女性的为45.5257,可以看出男性略微高出女性,但差异是否有统计学意义,还需要进一步看下面的结果: 
由上表(图8)可以看出:ANOVA表中显著性水平为0.141>0.05说明男性和女性的骨头高度的差异不具有统计学意义。且Eta系数为0.27,Eta方0.073均为很小,进一步说明性别与骨头高度相关性不显著。 我们搜集了31例患者的相关数据,要计算出全部样本的骨头高度均值与既定检验值40mm之间是否存在显著的差异(图1) 
单样本T检验在SPSS中的操作步骤: ①点击“分析”--“比较平均值”--“单样本t检验”(图2) 
②将“骨头高度”选入右侧“检验变量”框内(图3) 
③在下方“检验值”内填入我们的既定比较标准,也就是检验值“40mm”(图4),点击确定 
④结果分析 
由上表(图5)看出:31个样本的骨头高度均值为46.49mm,标准差为6.18mm,这些均为一般描述性结果。 
由上表(图6)可以看出:本次的31个样本的骨头密度的均值与检验值40mm之间的t检验值为5.851,显著性水平P<0.05,那么单样本t检验的原假设H0:“即本次检验的31个样本的骨头密度的均值与40mm之间不存在显著差异”发生的概率为0%,因此我们需要拒绝原假设H0,接受备选假设H1:“31个样本的骨头密度的均值与40mm之间存在显著差异”。
值得注意的是:这里的骨头高度数据同样需要服从正态性分布,关于如何进行检验正态性,大家可以查阅我们的订阅号【杏花开生物医药统计】中的相关课程。 当我们要进行2类样本或者2组样本的比较的时候,就需要用到独立样本 T检验。 但是需要注意的是,这里需要这两类样本之间相互独立,而不能是相互相关,比如男性和女性,相互独立的。下面我们通过实际案例数据来详细讲解独立样本T检验的操作步骤及结果解读。 我们搜集了31例患者的相关数据,我们要比较不同性别分组的身高的差异(图1) 
SPSS进行独立样本T检验操作步骤: ①点击“分析”--“比较平均值”--“独立样本t检验”(图2) 
②将身高选入右侧检验变量,将性别选入分组变量(图3) 
③点击“定义组”,设置性别的分组编码(图4),然后点击确定进行运算。 
④结果分析 
由上表(图5)看出:一般描述统计表给出男性8个,女性22个,平均身高分别为167.88和163.36。而这两者之间是否存在显著的差异还要进一步看下面的结果: 
关于独立样本T检验,和单样本T检验的输出结果不同,独立样本T检验基于2种不同的假设会有2种结果。 基于来莱文方差等同性检验,如果方差齐,就选择第一行的T检验结果,如果方差不齐则接受第二行的T检验结果。这里判定方差齐性的标准为莱文方差等同性检验的显著性,基于本例为0.005<0.05,意味着原假设方差齐不成立,接受备选假设方差不齐。因此这里的T检验结果为:T=2.662,P=0.026<0.05。 基于以上分析得出:不同性别的身高均值存在显著的差异,结合均值得出,男性身高均值显著高于女性。 需要注意的是,这里的被检验变量年龄同样需要服从正态分布,关于如何检验正态性,可以查阅我们的订阅号【杏花开生物医药统计】中的相关教程。 实际研究中,有时候会遇到存在相互有关联的两组样本:例如某个指标干预前和干预后的两组值,此类样本属于自身配对样本;又例如2只特性完全一样的小鼠(性别,体重,身长等都一致),然后对其进行某种干预后,测得的不同数据配对,此类样本属于同源配对样本。 下面就通过实际案例来讲解配对样本T检验中的自身配对: 我们搜集了31例样本分别在T10时点和T20时点的数据,想比较他们之间是否存在显著的差异(图1) 
SPSS配对样本T检验步骤 ①点击“分析”--“比较平均值”--“成对样本T检验”(图2) 
②分别将T10和T20选入右侧的配对变量框内(图3),然后点击确定,进行计算: 
③SPSS输出结果分析 
由上表(图4)看出:T10时点和T20时点的均值分别为24.6084和17.1139,此为描述性分析,不做过多赘述。 
由上表(图5)可以看出:本次配对t检验的T值为16.963,P<0.05。而原假设H0为H10和H20之间不存在显著的差异,基于原假设H0发生的概率P=0.00,因此我们要拒绝原假设,接受备选假设H1,T10和T20之间存在显著的差异。 再结合图4中的均值,可以得出结论T10显著大于T20。 
由上表(图6)看出:注意!这张表的结果十分重要,相当于配对T检验的假定前提条件。由于我们做的是配对样本,2组样本是成对出现,也就是说他们之间理应存在着显著的相关关系。基于这样一个前提,才适用于配对样本T检验,如果2组样本之间的相关关系不显著,那么则不适用于配对样本T检验,则必须使用独立样本T检验。 基于本例,我们得到的结果为相关关系显著,P<0.05。从而得出本例适用于配对样本T检验。 本期课程就到这里,我们将每周推出更多、更实用的医学统计教程,提供医学统计相关服务。涵盖SPSS、Meta、GraphPad、SAS、R等,欢迎大家关注!感谢大家的观看,下期再见!
杏花开医学统计客服 QQ(微信同号) 3301888200
|