分享

总体率的95%置信区间估计基本方法和软件操作

 妙趣横生统计学 2020-05-19

本文来源:

郑卫军, 何凡. 总体率的95%置信区间估计基本方法和软件操作[J]. 预防医学, 2020, 32(5): 539-540.

第11讲 实验性研究分类数据统计策略(3):

率的95%置信区间估计

统计结果中,置信区间的地位不亚于假设检验的P值。诸多高水平医学杂志,普遍推荐使用总体参数的置信区间来表达统计分析结果。目前,常用的统计软件SPSS,可快速进行总体均数的置信区间估计。但如何估计总体率(包括单个率和率差)的置信区间,对于研究者而言仍然是个问题。无论是观察性研究还是实验性研究,根据定性变量计算总体率置信区间是统计分析不可或缺的部分。因此,本文拟通过简单文字来描述计算率的总体95%CI置信区间的主要方法,以及常用软件的操作(SPSSR语言)过程。

1.率的置信区间估计常用方法

单个率的置信区间估计方法超过7[1],率差总体置信区间估计方法则更多。《医学统计学》教材通常提供了两种方法:查表法和正态近似法。

1.1   查表法

当样本含量(n)较小,如n≤50,特别是样本率(p)接近01时,可以采用查表法获得单个率的总体95%99%可信区间。不过,现实统计分析,不可能依赖教材表格,必须借助软件。实际上,查表法源于总体率的基本统计学方法:Clopper& Pearson精确法[2]

1.2正态近似法

率作为统计描述指标,其分布(或者说计算率的分子)呈现二项式分布。n足够大,p1-p均不太小时(一般要求npn1-p)均大于5),样本率的抽样分布近似服从正态分布。因此,也可以用正态分布理论估计单个率的总体可信区间。该方法相应的公式如下:

1.3 率差的正态近似法

医学研究两组数据率差的总体95%CI置信区间估计,公式如下:

2.案例分析

2.1     案例
案例(一):用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率78.3%,试估计该仪器乳腺癌总体检出率的95%置信区间。

2.2      正态近似法公式计算总体率置信区间

本例中n=120p=0.783,代入公式计算得Sp=0.0376,因乳腺癌总体检出率的95%可信区间为0.783±1.96×0.0376,即(70.9%85.7%)。

2.3      应用SPSS软件计算总体率置信区间(精确法)

SPSS可进行精确法和正态法近似操作。正态法适合汇总数据(行列表格式,具体操作入口:SPSS中“描述”——“比率”),由于篇幅限制,不作介绍。本文介绍如何利用SPSS 25.0软件基于精确法进行置信区间估计。

1SPSS操作过程:

①选择“分析”--“非参数检验”--“单样本”

②字段:选择结局变量(乳腺癌检测结果)到右侧选框中;

③设置:选择“定制检验”“比较实测二元概率和假设二元概率”,点击“选项”;

④选项中选择“克洛珀-皮尔森”,即Clopper& Pearson精确检验:

2SPSS结果:
  结果界面:

②置信区间:双击结果界面,在左下方列表选择“置信区间汇总视图”,即得到结果。

2.4应用R语言进行率的置信区间估计

1)基于精确概率法计算计算单个率的总体95%置信区间
仍以案例(一)为例,进行总体率的95%置信区间估计。
R语言程序
binom.test(94,120,conf.level= 0.95)
②R语言分析结果。结果显示,检出率的95%CI置信区间为(69.9%,85.3%)

2)基于正态近似法计算两个率差值的95%置信区间
案例(二):某医院口腔科医生用某药物治疗牙本质过敏症,以双氟涂料作为对照,进行1年的跟踪观察后,所有结果如表2,试估计两总体有效率差值的95%置信区间。

R语言程序
prop.test(c(60,40),c(80,70),conf.level= 0.95,correct =F)
②R语言分析结果。结果显示,实验组和对照组有效率差值95%CI置信区间为(2.88 %,3.28%)。由于该区间下限值大于0,所以可以认为两总体有效率不同,可以认为该药物有效。

3.小结
总体率置信区间在统计报告中不可或缺,论文作者应加强对置信区间重要性的认识。率的置信区间方法很多,其中正态近似法简单易行,但可能会出现置信区间超过100%或者低于0%的情况,因此小样本或者p靠近0%或者100%推荐精确法。软件操作方面,R语言和SPSS都不难,容易操作。

参考文献:
1. Newcombe R.G. (1998).Two-Sided Confidence Intervals for the Single Proportion: Comparison of SevenMethods. Statistics in Medicine17, 857–872.
2.Clopper, C. J. &Pearson, E. S. (1934). The use of confidence or fiducial limits illustrated inthe case of the binomial. Biometrika26, 404–413.
3.方积乾主编.《卫生统计学》第七版,2012,人民卫生出版社,北京

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多