【科研】如何确定临床实验设计中的样本量？

m175 2014-07-12

展开全文

　在临床实验研究中，无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来，并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多，可能会使试验研究成为不可能。而且，样本含量过大还会增加控制试验观测条件的难度，有可能引入非随机误差，给观测结果带来偏性(bias)。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高，因此多数情况下都是按各组样本含量相等来估计。但在个别情况下，也可能要求各组样本含量按一定比例来估计。

1 与样本含量估计有关的几个统计学参数

在估计样本含量之前，首先要对以下几个统计学参数加以确定或作出估计。

1.1 规定有专业意义的差值δ，即所比较的两总体参数值相差多大以上才有专业意义。δ是根据实验目的人为规定的，但必须有一定专业依据。习惯上把δ称为分辨力或区分度。δ值越小表示对二个总体参数差别的区分度越强，因而所需样本含量也越大。

1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概率α，即当对比的双方总体参数值没有差到δ。但根据抽样观测结果错误地得出二者有差别的推断结论的可能性，α确定的越小，所需样本含量越大。在确定α时还要注意明确是单侧检验的α，还是双侧检验的α。在同样大小的α条件下；双侧检验要比单侧检验需要更大的样本含量。

1.3 提出所期望的检验效能power，用1-β表示。β为允许犯Ⅱ类错误(“取伪”的错误)的概率。检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。即当对比双方总体参数值间差值确实达到δ以上时，根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1-β定为0.90或0.80。一般来说1-β不宜低于0.75，否则可能出现非真实的阴性推断结论。

1.4 给出总体标准差σ或总体率π的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据，可通过预实验取得样本的标准差s或样本率P分别作为σ和π的估计值。σ的估计值越大，π的估计值越接近0.5，所需样本含量越大。

在对以上统计学参数作出规定或估计的前提下，就可以根据不同的推断内容选用相应的公式计算出所需样本含量。由于在同样的要求和条件下完全随机设计(成组设计)所需样本含量最大，故一般都要按完全随机设计作出样本含量的估计。

2 常用的估计样本含量的方法

2.1 两样本均数比较时样本含量估计方法

(1)两样本例数要求相等时可按下列公式估算每组需观察的例数n。

n＝2*[(α+β)σ/δ]^2 (公式1)

式中δ为要求的区分度，σ为总体标准差或其估计值s，α、β分别是对应于α和β的u值，可由t界值表，自由度υ＝∞-行查出来，α有单侧、双侧之分，β只取单侧值。

例1：某医师研究一种降低高血脂患者胆固醇药物的临床疗效，以安慰剂作对照。事前规定试验组与对照组相比，平均多降低0.5 mmol/L以上，才有推广应用价值。而且由有关文献中查到高血脂患者胆固醇值的标准差为0.8 mmol/L，若要求犯Ⅰ类错误的的概率不超过5%，犯Ⅱ类错误的概率不超过10%，且要两组例数相等则每组各需观察多少例?

本例δ＝0.5 mmol/L，σ＝0.8mmol/L,α＝0.05，β＝0.10，1-β＝0.90，查t界值表自由度为∞一行得单侧t0.05＝1.645，t0.1＝1.282，代入公式(1)

n＝2*[(1.645+1.282)×0.8/0.5]^2＝44

故要达到上述要求，两组至少各需观察44例。

(2)两样本例数要求呈一定比例(n2/n1＝c)时，可按下列公式求出n1，再按比例求出n2＝c*n1。

　　n1＝[(α+β)σ/δ]^2*(1+C)/C (公式2)

例2：对例1资料如一切要求都维持不变，但要求试验组与对照组的例数呈2∶1比例(即C＝2)，问两组各需观察多少例?

n1＝[(1.645+1.282)×0.8/0.5]^2×(1+2)/2 ＝33(例)(对照组所需例数)

n2＝2×33＝66(例)(试验组所需例数。)

两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察的总例数2×44＝88。

2.2 配对设计计量资料样本含量(对子数)估计方法

配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照，均可按下列公式进行样本含量估计。

n＝[(α+β)σd/δ]^2 (公式3)

式中δ、α、β的含义同前，σd为每对差值的总体标准差或其估计值sd。

例3：某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量。事前规定服药后尿矽排出量平均增加35.6 mmol/L以上方能认为有效，根据预试验得到矽肺患者服药后尿矽排出量增加值的标准差 sd＝89.0 mmol/L，现在要求推断时犯Ⅰ类错误的概率控制在0.05以下(单侧)，犯Ⅱ类错误的概率控制在0.1以下，问需观察多少例矽肺病人?

本例δ＝35.6 mmol/L， sd＝89.0 mmol/L，α＝0.05，β＝0.10。1-β＝0.90，单侧t0.05＝1.645，t0.1＝1.282，代入公式(3)得到。

　　n＝[(1.645+1.282)×89/35.6]^2＝54(例)

故可认为如该药确实能达到平均增加尿矽排出量在35.6 mmol/L以上，则只需观察54例病人就能有90%的把握，按照α＝0.05的检验水准得出该药有增加矽肺病人尿矽作用的正确结论。

2.3 样本均数与总体均数比较时样本含量估计方法

可按下式估算所需样本含量n。

　　n＝[(α+β)σ/δ]^2 (公式4)

例4：已知血吸虫病人血红蛋白平均含量为90g/L，标准差为25g/L，现欲观察呋喃丙胺治疗后能否使血红蛋白增加，事先规定血红蛋白增加10g/L以上才能认为有效，推断结论犯Ⅰ类错误的概率α(双侧)不得超过0.05，犯Ⅱ类错误的概率β不得超过0.10，问需观察多少例病人?

本例δ＝10g/L，σ＝25g/L，0.05＝1.96(双侧)，0.10＝1.282代入公式(4)得：

　　n＝[(1.960+1.282)×25/10]^2＝66(例)

故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L以上，则只需观察66例就可以有90%的把握在α=0.05检验水准上得出有增加血吸虫病人血红蛋白平均含量的结论。

（摘自疑难病杂志网站）