本文来源: 郑卫军, 何凡. 总体率的95%置信区间估计基本方法和软件操作[J]. 预防医学, 2020, 32(5): 539-540. 第11讲 实验性研究分类数据统计策略(3): 率的95%置信区间估计 统计结果中,置信区间的地位不亚于假设检验的P值。诸多高水平医学杂志,普遍推荐使用总体参数的置信区间来表达统计分析结果。目前,常用的统计软件SPSS,可快速进行总体均数的置信区间估计。但如何估计总体率(包括单个率和率差)的置信区间,对于研究者而言仍然是个问题。无论是观察性研究还是实验性研究,根据定性变量计算总体率置信区间是统计分析不可或缺的部分。因此,本文拟通过简单文字来描述计算率的总体95%CI置信区间的主要方法,以及常用软件的操作(SPSS和R语言)过程。 1.率的置信区间估计常用方法 单个率的置信区间估计方法超过7种[1],率差总体置信区间估计方法则更多。《医学统计学》教材通常提供了两种方法:查表法和正态近似法。 1.1 查表法 当样本含量(n)较小,如n≤50,特别是样本率(p)接近0或1时,可以采用查表法获得单个率的总体95%和99%可信区间。不过,现实统计分析,不可能依赖教材表格,必须借助软件。实际上,查表法源于总体率的基本统计学方法:Clopper& Pearson精确法[2]。 1.2正态近似法 率作为统计描述指标,其分布(或者说计算率的分子)呈现二项式分布。当n足够大,p和1-p均不太小时(一般要求np与n(1-p)均大于5),样本率的抽样分布近似服从正态分布。因此,也可以用正态分布理论估计单个率的总体可信区间。该方法相应的公式如下: 1.3 率差的正态近似法 医学研究两组数据率差的总体95%CI置信区间估计,公式如下: 2.案例分析 2.2 正态近似法公式计算总体率置信区间 本例中n=120,p=0.783,代入公式计算得Sp=0.0376,因乳腺癌总体检出率的95%可信区间为0.783±1.96×0.0376,即(70.9%,85.7%)。 2.3 应用SPSS软件计算总体率置信区间(精确法) SPSS可进行精确法和正态法近似操作。正态法适合汇总数据(行列表格式,具体操作入口:SPSS中“描述”——“比率”),由于篇幅限制,不作介绍。本文介绍如何利用SPSS 25.0软件基于精确法进行置信区间估计。 (1)SPSS操作过程: ①选择“分析”--“非参数检验”--“单样本” ②字段:选择结局变量(乳腺癌检测结果)到右侧选框中; ③设置:选择“定制检验”—“比较实测二元概率和假设二元概率”,点击“选项”; ④选项中选择“克洛珀-皮尔森”,即Clopper& Pearson精确检验: ②置信区间:双击结果界面,在左下方列表选择“置信区间汇总视图”,即得到结果。 |
|