多重比较！！！

hongliangguan 2011-07-31

展开全文

多重比较！！！

(2007-04-01 08:45:04)

分类：统计

多个均值之间的多重比较

在完成方差分微得知某因素对观测结果的影响显著时，仅表明该因素的各水平下的均数之间的差别总体上是显著的，并不知道任何２个均数之间的差别是否显著（此时，即使在多数场合下，可认为均数的最大值与最小值之间的差别显著，但却不知ｐ值的大小）。当实际工作者希望进一步知道更为详细的情况时，就需要在多个均数之间进行多重比较。然而，根据所控制误差的类型和大小不同，便产生了许许多多的多重比较法。

设某因素有10个水平，若采用通常的ｔ检验进行多重比较，共需比较的次数为∶C210=45次，即使每次比较时都把α控制在0.05水平上(即令CER=0.05)，但此时EER=1-(1-0.05)45=0.90,这表明作完45次多重比较后，所犯Ⅰ型错误的总概率可达到0.90，事实上，选用ｔ检验进行多重比较，仅仅控制了CER，却大大地增大了EER！

1.两两比较

(1)仅控制CER(比较误差率)的方法

①Ｔ法（即成组比较的ｔ检验法，但误差的均方不是由所比较的２组数据、而是由全部数据算得的）注意∶用此法所作比较的次数越多，其EER（试验误差率）就越大。
②LSD法:也叫最小显著差数法，只用于２组例数相等的场合LSD的值被称为Fisher的最小显著差.注意∶用此法所作比较的次数越多，其EER（试验误差率）就越大。

③DUNCAN法

(2)控制MEER（最大试验误差率）的方法

①BON法（即Bonferroni ｔ检验法）
它令CER=ε=α/C，这里C为比较的总次数，当因素有K个水平时，则C=K(K-1)/2，下同。

②SIDAK法（根据Sidak的不等式进行校正的ｔ检验法）

③SCHEFFE法
它是由Scheffe于1953和1959年提出的另一种控制MEER的法，　　　　　
　　Scheffe检验的结果与先作的方差分析的结果是相容的，即若ANOVA的结果是显著，用此法至少能发现一次比较的结果是显著的，反之，若ANOVA的结果为不显著，用此法也找不出任何２个均数之间有显著差别来（然而，大部分多重比较法则可能会发现有显著差别的对比组）。
　　如果比较的次数明显地大于均数的个数时，Scheffe法的检验功效可能高于BON法和SIDAK法。对于两两比较，一般来说，Sidak ｔ法的检验功效高。
④TUKEY法(也称为Tukey或Tukey-Kramer法)
　　Tukey（1952，1953）以学生化极差为理论根据，提出了专门用于两两比较的检验（有时也称为诚实（或最大）显著差检验）。当各组样本含量相等时，此检验控制MEER；当样本含量不等时，Tukey（1953）和Kramer（1956）分别独立地提出修正的方法。对Tukey-Kramer法控制MEER没有一般的证明，但Dunnett（1980）用蒙特卡洛法研究发现此法非常好。此法的检验功效高于BON法、SIDSAK法或SCHEFFE法。
⑤GT2法或SMM法
　　它是有Hochberg(1974)推导尝且与Tukey法像似的一种方法，它用学生化最大模数取代学生化极差，并运用Sidak（1976）的未校正的ｔ不等式。在样本含量相等时，已证明此法把MEER控制在不超过α的水平上。一般认为，此法的检验功效低于Tukey-Kramer法，并且，在样本含量相等时，此法的检验功效总低于Tukey检验。若式(2.5.5)成立，则宣称所比较的２均数之间的差别显著。

⑥GABRIEL法
　　它是由Gabriel(1978)提出的，用于样本含量不等时的一种多重比较法。此法建立于学生化最大模基础之上。

　　样本含量相等时，Gabriel检验与Hochberg检验是等阶的；样本含量不等时，Gabriel法比GT2法具有更高的检验功效，但当样本含量相差悬殊时，此法可能变得不精确。
⑦REGWQ法和REGWF法(详见“多级检验”)

2．多级检验(MSTs─Multiple-Stage Test)

使用多级检验可以获得同时检验的更高功效。MSTs分为步长增加法和步长减少法，步长减少法一直被用得较广泛，SAS/STAT中采用的也是此法。
　　设某显著因素有K个水平，即有K个均数需要比较，则步长减少的MSTs法的检验步骤为∶
　　第１步∶将均数由大到小排队,即X-1≥X-2≥…≥X-k;
　　第２步∶比较X-1与X-k。此时是跨度（即一般统计书中所说的处理数)为K级的2个均数之间的比较，若两者之间差别不显著，则意味着其他任何２个均数之间的差别也都不显著，应停止一切比较；反之，则进行下面的第３步；
　　第３步∶比较X-1与X-k-1、X-2与X-k。此时是跨度为K-1级的２个均数之间的比较，沿用第２步后面的思路，一直进行下去，如果每一步都有不满足停止比较的对比组，最后应达到跨度为２的所有需要比较的相邻２均数间都作完比较时为止。
　　MSTs法在作每一级比较时，通过控制γa的水平（a=K，K-1，…，2）来实现其最终要控制的某种误差率。γa在特定的中所起的作用相当于t和F分中的概率α，即γa也是一种显著性水平，它与对比的２个均数之间的跨度（即处理数a）有关。在MSTs中，最著名的２种方法分别是DUNCAN法和SNK法，这２种方法及其主要区别如下∶

(1)DUNCAN法(常称为新多极差检验法、SSR法)
　　此法控制的是Ⅰ型比较误差率CER=α(即每作1次比较所对应的犯Ⅰ型错误的概率为α),而不是试验误差率MEER。为实现此目标，它所对应的γa=1-(1-α)a-1。有些研究结果表明,
如果不考虑较高的Ⅰ型误差率，那么，此法优于Tukey法。在都是控制CER的３种法中，SAS宁愿推荐LSD法或T法,因为它们易于计算和解释。DUNCAN法的检验统计量为q，当式(2.5.7)成立时，则宣称所比较的2均数之间差别显著。
　　如果是用手工计算，需查DUNCAN检验用的q临界值表得到q的临界值。
(2)SNK法(称为多极差检验法或Student-Newman-Keuls法或q检验法)
　　此法控制的是EERC=α，为实现此目标，它所对应的γa=α。值得注意的是SAS并不推荐使用此方法，因为它所产生的MEER相当大，尤其是在比较的次数C很大时，MEER将趋近于1。

　　控制MEER的另2种MSTs法不像SNK法和DUNCAN法那样出名，但它们却是到本世纪七十年代为止的文献中介绍的最有效的步长减少的MSTs法，它们是REGWQ法和REGWF法，由Ryan(1959,1960)、Einot和Gabriel(1975)和Welsch(1977)研究出来，

(3)REGWQ法 (4)REGWF法

　３．WALLER法(即贝叶斯法)
　　该法由Waller和Duncan(1969)采用，它不是控制Ⅰ型误差率，而是在附加损失条件下使贝叶斯风险达到最小值。该法的假定条件是∶各组总体均数具有未知方差的先验正态，均数的方差的对数具有先验均匀。

4. DUNNETT法(即所有处理组均数分别与对照组均数比较)
　　DUNNETT检验控制MEER在不超过事先给定的α水平上。