第2讲 实验性研究定量数据统计策略(3): 两样本秩和检验 之前文章已经介绍过,非参数检验是参数检验重要的补充。秩和检验是非参数检验的重要方法。两组定量数据的比较,主要的方法有两种。一种是t检验,一种是属于非参数检验的秩和检验(wilcoxon 秩和检验)。 一般来说两样本秩和检验是t检验的补充,如果t检验不能做,就会考虑用两样本秩和检验。当t检验条件不符合,特别是达不到正态或者近似正态分布的条件时,可考虑过两样本秩和检验。 何为秩和检验 何为非参数检验? 假设检验分为两种,一种称之为参数检验(parameter test),另外一种是非参数检验(Non-parameter test)。 参数检验:以特定的总体分布(如正态分布)作为前提,对其总体参数作假设检验。 如: t 检验、z检验和 F 检验。 非参数检验:对总体分布不作严格假定,又称任意分布检验,它直接对总体分布作假设检验,可能是分布轮廓,也可能是分布位置。非参数检验在我们课程中提到的主要是两类,一类是秩和检验,还有一类是卡方检验。它不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否以知,因而实用性较强 。 何为秩和检验? 秩和检验为非参数检验方法中的一类,包括用于配对设计研究的符合秩和检验,用于两组独立样本的两样本秩和检验,用于多个样本的多样本秩和检验。主要主要以秩次为基础的研究。秩次(rank)指的是将数值变量值或等级变量值按一定顺序(一般是从小到大)所排列的序号,通俗理解也就是排名。秩和(rank sum)的意思是秩次之和。因此秩和检验就是比较两组数据的排名有没差别。 两样本秩和检验,又称成组2样本秩和检验或者两独立样本秩和检验,英文为Wilcoxon Mann-Whitney 检验,是Wilcoxon Mann Whitney 三人证明,可简写为Wilcoxon检验或者W M-W检验。 形象来区分两样本t检验和秩和检验 举例:若比较医学统计学班级男生成绩好还是女生好。此时,有两种方法,一种是分别计算男生的平均值和女生的平均值,那么这就是t检验;另外一种将所有人成绩从高到底进行排名,求出男生排名的总和和女生排名的总和,再除以各自人数得到平均排名,最后是平均排名越小,说明成绩越好,这便是秩和检验。 实例分析 某研究者将小鼠随机分为两组,观察局部加热治疗小鼠移植肿瘤的疗效,以生存时间(日)作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别?详见rat.sav 局部加热组:10,12,15, 15, 15,16,20,23 30,40 空白对照组:2,3, 3, 3,4, 4, 4,6,9,11,12,14 思考 对此案例的统计需要思考: -这是何种研究设计类型? -研究的结局变量是什么? -结局变量属于什么类型的变量? -如果是定量变量数据,是偏态还是正态分布? -研究目的是比较,那比较的组数是多少? 案情分析 本案例属于随机对照的实验性研究。主要研究的结局指标是生存时间,为定量变量数据;比较的组数是两组(局部加热组和空白对照组)。本案例目的是比较两组总体生存时间分布有无统计学差异。 统计分析策略 两组定量数据的比较,主要的方法有两种。一种是成组两样本t检验,一种是非参数秩和检验(wilcoxon 两样本秩和检验)。一般来说,秩和检验是t检验的补充,如果t检验不适合,就会考虑秩和检验。所以统计分析时,要考虑t检验是否合适?条件是否满足? t检验要求的两组、定量、独立、方差齐、正态的数据比较。前面4个要求与wilcoxon 两样本秩和检验相同,差别在于t检验要求数据符合正态性。若不满足,应该考虑秩和检验。 总结来说: 两组的直方图分布如下: SPSS 操作 两样本秩和检验SPSS操作界面: 分析—比较均值—非参数检验--旧对话框--2个独立样本 两样本秩和检验具体参数设置 “检验变量”放入生存日期(time),“分组变量”放入分组(group),同时进行“定义组”。 ①检验类型:曼-惠特尼(Man-whttey),即为最常见的wilcoxon Man-whttey两样本秩和检验 ②检验变量:即放入结局指标,本例为生存日期(time) ③分组变量:放入group。这里“定义组”需要进一步明确,见下图: 定义组:即指定比较哪两组。在本例,我们比较高蛋白和低蛋白组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。因此提醒诸位:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。 ④选项:可以对总体数据进行基本的统计描述 两样本秩和检验分析结果及解释 表3:秩和检验分析结果 结果的规范表达 规范的统计表(其中一种形式)为: ①此处提供的为中位数和上下四分位数:M(P25,P75),也可以采用中位数(四分位数间距):M(IQR)来表达。 两样本检验的实际应用 ①非正态定量数据比较 ②两组小样本分布不明的定量数据 ③两组一端或二端存在着不确定数值的数据 ④两组有序分类资料(等级资料) 值得注意的是,两样本秩和检验主要探讨的总体分布位置,而不是总体均数。 以下本人的分析习惯,仅供参考:
SPSS 课程视频和操作录屏 SPSS课程视频 https://evod./resource.html?stationID=1&resourceid=414&isprivate=false&cateid=102 SPSS课程录屏 -本讲结束-,敬请阅读同期R语言教程推文- |
|