方差分析的基本思想

yeez 2010-10-22

展开全文

1、方差分析的意义

前述的t检验和u检验适用于两个样本均数的比较，对于k个样本均数的比较，如果仍用t检验或u检验，需比较次，如四个样本均数需比较次。假设每次比较所确定的检验水准=0.05，则每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95；那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351，而犯第一类错误的概率为0.2649，因而t检验和u检验不适用于多个样本均数的比较。用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出，以F命名其统计量，故方差分析又称F检验。

2、方差分析的基本思想

下面通过表5.1资料介绍方差分析的基本思想。

例如，有4组进食高脂饮食的家兔，接受不同处理后，测定其血清肾素血管紧张素转化酶（ACE）浓度（表5.1），试比较四组家兔的血清ACE浓度。

表5.1对照组及各实验组家兔血清ACE浓度（u/ml）

对照组	实验组
对照组	A降脂药	B降脂药	C降脂药
61.24	82.35	26.23	25.46
58.65	56.47	46.87	38.79
46.79	61.57	24.36	13.55
37.43	48.79	38.54	19.45
66.54	62.54	42.16	34.56
59.27	60.87	30.33	10.96
		20.68	48.23
329.92	372.59	229.17	191.00	1122.68	()
6	6	7	7	26	（N ）
54.99	62.10	32.74	27.29	43.18	（）
18720.97	23758.12	8088.59	6355.43	56923.11	()

由表5.1可见，26只家兔的血清ACE浓度各不相同，称为总变异；四组家兔的血清ACE浓度均数也各不相同，称为组间变异；即使同一组内部的家兔血清ACE浓度相互间也不相同，称为组内变异。该例的总变异包括组间变异和组内变异两部分，或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致，一是抽样误差；二是由于各组家兔所接受的处理不同。正如第四章所述，在抽样研究中抽样误差是不可避免的，故导致组间变异的第一种原因肯定存在；第二种原因是否存在，需通过假设检验作出推断。假设检验的方法很多，由于该例为多个样本均数的比较，应选用方差分析。

方差分析的检验假设H0为各样本来自均数相等的总体，H1为各总体均数不等或不全相等。若不拒绝H0时，可认为各样本均数间的差异是由于抽样误差所致，而不是由于处理因素的作用所致。理论上，此时的组间变异与组内变异应相等，两者的比值即统计量F为1；由于存在抽样误差，两者往往不恰好相等，但相差不会太大，统计量F应接近于1。若拒绝H0，接受H1时，可认为各样本均数间的差异，不仅是由抽样误差所致，还有处理因素的作用。此时的组间变异远大于组内变异，两者的比值即统计量F明显大于1。在实际应用中，当统计量F值远大于1且大于某界值时，拒绝H0，接受H1，即意味着各样本均数间的差异，不仅是由抽样误差所致，还有处理因素的作用。

（5.1）