配色: 字号:
论多重比较的几种方法
2016-12-12 | 阅:  转:  |  分享 
  
1997M?4ù```````````d9D?
?```````````1997M1225°

论多重比较的几种方法

ò? ?

K`1`óc×1?¥LSDEaTEaSSREsYT

''?¥ ?
?),

8?s
???_E¥ ?
?$#_rT,
?
?
ê4ZE¥e5#

d9s?¥T¨,ió
?¨
L èb

1oM`×1?`LSDE`TE`SSRE

方差分析是研究一种或多种因素变化对试验结果的观测值(指标)是否具有显著影响的数

理统计方法。通过方差分析已确定某一因素对试验结果影响显著时,并非因素的所有水平对试

验结果的影响都是显著的,为了搞清因素在哪些水平之间差异显著,哪些不显著,需要进一步

对各个平均数作相互比较,以选取最优生产方案。这就是多重比较的问题。

多重比较的方法很多。本文仅就单因素等重复试验中多重比较的几个方法,加以浅析。

引入下面记号:k为要比较因素的水平个数;n为同一水平试验的重复数;xij为因素第i个

水平上第j次试验的观测值;x—(i)(i=1,2,…,k)为第i个水平的平均值;s2为试验误差(组内)

的均方;f为试验误差(组内)的自由度。

ZE1`KlA÷μ
?_E(LSDE)

对单因素等重复试验,通过方差分析得出因素各水平上样本平均数存在显著差异。为进一

步找出差异性存在于哪些水平之间,我们将可能存在于两个显著不同的样本平均数间的最小

差异称为最小显著差异。并以此作为比较两个样本平均数差异性的一个判定尺度,记作LSD。

计算公式为LSD=tnull2s

2

n,其中tnull是以试验误差(组内)的自由度f为自由度,在给定检验水

平null下,查t分布表所得的监界值。

利用上面公式计算出LSD的值,作为检验的判定尺度,当两个样本平均数差的绝对值(简

称平均数的差异)大于LSD,即为在null水平上样本平均数差异显著;否则不显著。这种判定方

法也称为LSD法。

ZE2`Tukey
f%?μ _E,9?×1?¥TE

此种方法,将所有样本平均数的可能数对的差异与一个固定值相比较,以判定其显著性。

此固定值由公式dT=qnull(k,f)s

2

n给出,其中qnull(k,f)为查得的q表值。


là°ù:1997-06-30

i29i

利用上面公式计算出dT的值,作为检验的判定尺度,当两个样本平均数的差异大于dT时,则

认为在null水平上平均数差异显著;否则不显著。

ZE3`? \?ˉμ_E,9?KA÷μE,e?SSRE

此法是用一系列最短显著差数Rp来比较两个平均数间的差异。Rp的计算公式为

Rp=Qp(p,f)s

2

n

其中Qp(p,f)是由试验误差的自由度f和要比较的平均数的个数p在给定水平null下查“邓肯

新复极差表”所得数据。

利用上面公式求得一系列Rp的值作为检验尺度。然后将各样本平均数按大小顺序排列,

如果任何p个相连的样本最大与最小的两个平均数的差异大于Rp,就认为这两个平均数差异

显著,否则不显著。

以上3种检验法各有千秋。因为LSD法计算方便,仅用t分布表,不需引入新表。再则,此

法显著尺度固定,容易判定。可给出任一差数的1-null置信区间

〔(x—(i)-x—(j))-LSD,(x—(i)-x—(j))+LSD〕

且置信区置的长度相等。

LSD法是t检验的自然推广,在本质上仍是t检验,理论上仅适用于两个样本平均数间的

检验。在因素水平个数k较大时,增大了犯第一类错误(null错误)的概率。对于两个极端的平均

数的差异,LSD法的尺度太“短”,致使F检验因素影响不显著而得出因素的两个水平差异显

著的矛盾结果。但在多重比较中,如果一个平均数大集合的差异不显著时,则所包含的各个集

合的差异应一律被看作不显著。所以,为了克服可能出现的这一弊端,可用F检验作为LSD

法易犯第一类错误的一种“保护”,即LSD法只能用在F检验显著时。在不进行方差分析或通

过方差分析已确定因素影响不显著时,不能用此法。

T法与LSD法有类似的优点,所有两个平均数之间的差异都与一个固定尺度作比较,计

算方便,容易判定。任一差数的1-null置信区间容易算得

〔(x—(i)-x—(j))-dT,(x—(i)-x—(j))+dT〕

且置信区间长度相等;T法检验尺度dT比LSD法的检验尺度LSD增大了,对两极端平均数

来说犯第一类错误(null错误)的概率降低了,而对两个接近的平均数用LSD法检验可称为显著

差异,而用T法可能检验不出显著差异,对相邻的平均数犯第二类错误(null错误)的概率有所增

加。因此,用T法时不需要用F检验作“保护”,即可直接用T法进行多重比较;T法不仅可用

来检验单因素试验,而且可检验多因素试验、正交试验等因素水平的显著性,在实际中有着广

泛的作用。一般说,用T法检验得到的显著差异个数要比用LSD法得到的少一些。

SSR法是依平均数秩次距的不同而采用一系列不同的显著值(称为多重极差)作为检验

尺度。它是以自由度为基础的一种极差检验。它可以克服LSD法对两极端平均数检验尺度太

“短”、T法对相邻平均数检验尺度太“长”的缺点,而是不同秩次距的两个平均数用不同的检验

尺度,比LSD法犯null错误的概率小,比T法犯null错误的概率亦小。

当k=2时,LSD=dT=Rp,3者检验结果相同;当k>2时,Rp>LSD,且k越大,Rp超过

LSD越多。所以,用SSR法所发现的显著差异个数少于LSD法,最多一样。使用SSR法时并

不一定要求F检验显著后才进行。但F检验如果不显著,而SSR法也可能发现某些平均数差

i30i

异显著。为了避免这种矛盾,此法最好用在F检验显著之后;用SSR法还可进行统计排队。目

前此法在生物学研究中最为通用。但计算量较大,且不同秩次距的平均数的置信区间长度不等

(这不影响使用)。

现将这三种检验法列表对比如表1:

V1`??_E1V

方法显著尺度所用数表使用条件

LSD法LSD=tnull2s2nt分布表等重复试验F检验显著后

T法dT=q(k,f)s2nq表等重复试验直接使用

SSR法Rp=Qp(p,f)s2n邓肯新复极差检验表等重复试验

F检验显著后

综上所述,LSD法增大了犯null错误的概率,T法降低了犯null错误的概率而增大了犯null错

误的概率,但此二法计算简便、容易判定。SSR法比LSD法犯null错误、比T法犯null错误的概率

都要小,但计算量较大。对于同一资料,采用哪种方法更好,应根据实际问题是否定一个正确假

设H0和接受一个不正确的假设H0的相对重要性而决定。若否定正确H0事关重大或后果严

重,宁肯冒犯null错误的风验较大而不使犯null错误有较大风险,则用T法检验;若接受不正确的

H0事关重大或后果严重,宁肯冒犯较大null错误的风险而不冒犯null错误的风险,则可用SSSR

法或在F检验“保护”下的LSD法。如果需要进行统计排队,应选用SSR法。实例分析比较如

下:

一批由同种原料织成的布,由不同的染整工艺处理,然后进行缩水率试验。现采用了五种

不同的染整工艺,每种工艺试验四块布,测得缩水率的百分数见表2。

若布的缩水率服从正态分布,不同工艺处理布的缩水率方差齐性,试考察不同工艺(因素)

对布的缩水率有无显著影响?若有显著影响,显著性在哪些工艺之间存在?

这个问题实际上是一个单因素(染整工艺)五水平等重复(四次)试验,且满足方差分析条

件。可通过方差分析检验染整工艺对缩水率有无显著影响。方差分析见表3。

由方差分析知,F=6.07的值超过了临界值F0.05=3.06,亦超过F0.01=4.89,可知染整工

艺对布的缩水率影响特别显著。为了进一步搞清差异性存在于哪些工艺之间,现用上述三种方

法进行多重比较。为了简便,仅取检验水平null=0.05。

V2`
k
? V

试验批号

缩水率(%)

染整工艺

1234行和Ti平均x—i

A16.58.38.68.231.67.900

A24.37.83.26.521.85.450

A39.38.77.210.135.38.825

A46.17.34.24.121.75.425

A59.58.811.47.837.59.375

i31i

V3`ZμsV

方差来源离差平方和自由度均方F值F的临界值

组间55.54413.89

组内34.37152.296.07F0.05(4,15)=3.06

总和89.9119F0.01(4,15)=4.89

在这个实例中,

k=5n=4s2=2.29f=15

x1=7.900x2=5.450x3=8.825x4=5.425x5=9.375

再设两样本平均数的差异为dij=nullx—(i)-x—(j)null

算得d12=2.450d13=0.925d14=2.475d15=1.475d23=3.375

d24=0.025d25=3.925d34=3.400d35=0.550d45=3.950

用LSD法检验,查表:t0.05(15)=2.131

计算LSD=t0.05(15)2s

2

n=2.131×

2×2.29

4=2.28

因为d12d14d23d25d34d45均大于2.28,所以工艺A1A2A1A4A2A3A2A5A3A4

A4A5产差异显著。

有时为了简便直观,可将平均数按秩次排列。然后以最大的平均数为准,减去最小的,次小

的,…次大的;以次大的为准减去最小的,…,第三大的;…,直至以次小的为准减去最小的。凡

差数≤LSD的,在其下划以相连横线。这样凡是处理下方没有相连横线的都属于有显著差异

的。对于此例,以LSD0.05为准的比较结果如下:

工艺A5A3A1A2A4

平均数9.3758.8257.9005.4505.425

即染整工艺A5A2A5A4A3A2A3A4A1A2A1A4差异显著。

用T法检验,查q表:q0.05(5,15)=4.37

计算dr=q0.05(5,15)s

2

n=4.37×

2.29

4=3.306

与LSD法类似地进行比较,结果如下:

工艺A5A3A1A2A4

平均数9.3758.8257.9005.4505.425

即染整工艺A5A2A5A4A3A2A3A4A1A2A1A4差异显著。

用邓肯新复极差检验法(SSR法)检验:

Rp=Qp(p,f)s

2

n=Qp(p,15)×

2.29

4

=Qp(p,15)×0.7566

列出最短显著差异范围,见表4:

i32i

V4`KA÷μsS?V

P的值2345

Qp3.013.163.253.31

Rp2.2772.3902.4592.504

工艺A5A3A1A2A4

平均数9.3758.8257.9005.4505.425

比较各样本平均数的差异:

d53=0.550
d31=0.925<2.277

d12=2.45>2.277

d24=0.025<2.277

与R2比较

d51=1.475
d32=3.375>2.39

d14=2.475>2.39

R3的比较

d52=3.925>R4=2.459

d34=3.400>2.459与R4比较d54=3.950>R5=2.504与R5比较

即检得A1A2A2A3A1A4A2A5A3A4A4A5平均数差异显著。

对此例,SSR法与LSD法检验结果相同。T法与这两种方法检验所得显著差异个数减少

(少了A1A2A1A4)。这一结果与前面所论相符合。

对于本例,若要选取最优生产方案,可将这五种染整工艺分组、排队。由邓肯新复极差检验

法可得比较结果:

A5A3A1A2A4

由此可知,这五种工艺可分为A5A3A1与A2A4两组。在所给检验水平上,同组内的各样本

平均数无显著差异,两组之间差异显著。又由资料可知A2A4比A5A3A1缩水率小。因而,可进

一步考察其它因素,如成本效益、技术可行性、环境污染状况、操作者安全等,从工艺A2A4中

选出最优方案或在此基础上再进行试验,以获得最佳工艺,从而科学地有效地指导生产。

? IóD

1〔美〕H·L奥尔德,E·B罗赛勒.概率与统计入门.农业出版社.1986

2莫惠栋.农业试验统计.上海科学技术出版社.1984

(T??ê`?d9Dy)

(3?I`R
B
ó)

i33i

献花(0)
+1
(本文系勤悦轩首藏)