分享

SAS系列22:定性数据假设检验

 松哥精鼎统计 2020-10-23

导读

系列17-21我们已经介绍了单变量定量数据的假设检验方法及其SAS实现,今天开始介绍定性数据的假设检验方法及其SAS实现。

二、单变量数据的假设检验

图9-56 定性数据假设检验方法选择

(二)定性数据的假设检验      定性数据最常用的是χ2检验,是利用χ2分布的原理进行两个或多个样本率间的比较。χ2分布是一种连续型分布,其参数只一个,即自由度υ。χ2分布的形状依赖于自由度υ的大小,当自由度υ≤2时,曲线呈L形;随着υ的增加,曲线逐渐趋于对称;当自由度υ趋近于无穷大,χ2分布趋近正态分布,χ2分布具有可加性的特性。可以用来处理单变量定性数据的常用SAS过程有PROC FREQ过程步。PROC FREQ过程步可实现χ2检验,关联性测量和检验,针对四格的危险度以及危险度差别、比值比、相对危险度的计算,趋势检验,一致性检验和测量,分层分析等。PROC FREQ语法如下:

1.样本率与总体率的比较       样本率与总体率作比较的目的是推断样本率所代表的总体率p与某已知总体率p0是否相等。应根据资料的不同情况,采用不同的假设检验方法:(1)若总体率p0很小,可用Poisson分布原理作检验;(2)若总体率p0不太靠近0或1时,可用二项分布原理作检验。当样本含量n足够大时,二项分布逼近正态分布,或np0≥5且n(1-p0)≥5,这种近似是满意的,可用u检验或χ2检验。应用SAS实现时可以直接调用SAS的正态分布函数、卡方分布函数来计算相关的统计量和P值。       例题:据临床经验认为,一般的胃溃疡患者有20%会出现胃出血症状。某医院观察了304例65岁以上的胃溃疡病患者,其中96例发生胃出血,占31.58%,问老年患者是否较一般患者容易出血?

*===样本率与总体率的比较:u检验的SAS实现;DATA RATE; INPUT PAI PAI0 N; U=ABS(PAI-PAI0)/SQRT(PAI*(1-PAI)/N); P=2*(1-PROBNORM(U)); DATALINES;0.2 0.3158 304;PROC PRINT; VAR PAI PAI0 N U P;RUN;

图9-57 样本率与总体率比较u检验结果

*===样本率与总体率的比较:χ2检验的SAS实现;DATA RATE; INPUT A1 A0 N PAI0; T1=N*PAI0; T0=N-T1; CHI=(A1-T1)**2/T1+(A0-T0)**2/T0; P=1-PROBCHI(CHI,1); DATALINES;96 208 304 0.2;PROC PRINT; VAR PAI0 CHI P;RUN;

图9-58 样本率与总体率比较χ2检验结结果

图9-57和图58的结果一致,还不能认为样本所来自的总体率与已知总体率相同。

2.四格表资料的假设检验

2.1一般四格表资料的假设检验

*===四格表资料卡方检验;DATA F; DO R=1 TO 2; DO C=1 TO 2; INPUT FREQ @@; OUTPUT; END; END; DATALINES;52 19 39 3;PROC FREQ DATA=F; TABLE R*C/CHISQ; WEIGHT FREQ;RUN;

图9-59 一般四格表资料统计描述结果

图9-60 一般四格表资料χ2检验结果

图9-61 一般四格表资料Fisher确切概率法结果       图9-59是创建的二维表格,每个单元格中包括频数、点总数的百分比、占行合计的百分比以及占列合计的百分比。本资料的N>40,且T>5(结果中未提示T<5),图9-60是χ2检验结果显示χ2=6.4777,P=0109,按检验水准α=0.05,还不能认为两组大白鼠感染率相同。 2.2配对四格表资料的假设检验      配对定性资料作比较的目的是通过单一样本数据推断两种处理的结果有无差别。常用于比较两种检验方法、两种提取方法、两种培养方法乖的差别。其特点是对同一样本的每一检品分别用两种方法处理,观察其阳性或阴性结果。

*===配对四格表资料卡方检验;DATA MC; DO R=1 TO 2; DO C=1 TO 2; INPUT FREQ @@; OUTPUT; END; END; DATALINES;36 34 0 135;PROC FREQ DATA=F; TABLE R*C/AGREE; WEIGHT FREQ;RUN;

图9-62 配对四格表资料统计描述结果

图9-63 配对四格表资料χ2检验结果

图9-63是创建的二维表格,内容同一般四格表的内容。本资料的b+c>40,图9-60是McNemarχ2检验结果显示:χ2=6.8966,P=0086,按检验水准α=0.05,还不能认为两种培养基的结果相同。 

整理不易,欢迎点亮再看哦!

参考文献:

[1] Marfio F. Triola. ElementaryStatistics[M]. New York: Christine Stavrou, 2010.

[2] 夏庄坤, 徐唯 , 潘红莲, 等. 深入解析SAS——数据处理、分析优化与商业应用[M]. 

[3] 高惠璇. SAS系统Base SAS软件使用手册[M]. 北京:中国统计出版社,1997.整理不易,欢迎点亮再看!【赠人玫瑰,手留余香】

----------------------------------------------

SAS系列21:SAS统计推断(六)

SAS系列20:SAS统计推断(五)

SAS系列19:SAS统计推断(四)

SAS系列18:SAS统计推断(三)

SAS系列17:SAS统计推断(二)

SAS系列16:SAS统计推断(一)

SAS系列15:SAS数据可视化结果输出

SAS系列14:SAS数据可视化(三)

SAS系列13:SAS数据可视化(二)

SAS系列12:SAS数据可视化(一)

SAS系列11:SAS基础统计过程(三)

SAS系列10:SAS基础统计过程(二)

SAS系列09:SAS 基础统计计算过程

SAS系列08:SAS函数

SAS系列07:SAS数据整理(三)

SAS系列06:SAS数据整理(二)

SAS系列05:SAS数据整理(一)

SAS系列04:SAS数据导入

SAS系列03:SAS入门(二)之SAS编程语言基础

SAS系列02:SAS入门(一)

SAS系列01:统计分析航空母舰-SAS简介

----------------------------------------------

精鼎特邀

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多