第7章 显著性检验的基本问题 教学目的与要求:通过本章讲授,使学生了解下列概念:观察到的显著水平(p_值)、检验时规定的显著水平标准、显著水平、临界值、检验规则、原假设和备择假设,知道什么是双尾检验,什么是左(右)单尾检验以及各自的适用场合,知道什么是显著性检验中的两类错误以及犯这类错误的概率的图示,掌握总体均值是否为某定值以及两点分布总体中一次试验成功率为某定值的检验问题,知道显著性检验中应当注意的问题。 重点内容与难点: 1. 显著性检验的基本问题 2. 总体均值为某定值的显著性检验 3.随机试验中某种事件出现的概率为某定值的显著性检验 §7.1 显著性检验的基本问题 1.显著性检验是除参数估计之外的另一类重要的统计推断问题。 2.显著性检验,又称假设检验:就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。 或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。 3.显著性检验是针对我们对总体所做的假设做检验。 一、显著性检验的基本思想 显著性检验的基本思想可以用小概率原理来解释。 1.小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件 2.观察到的显著水平:由样本资料计算出来的检验统计量观察值所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。 3.检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。 4.在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。大于这个标准时,拒绝原假设的证据不足,认为样本数据不足以表明真实差异存在。 5.检验的操作可以用稍许简便一点的作法:根据所提出的显著水平查表得到相应的 二、原假设和备择假设 1.原假设:对总体所作的论断或推测,指观察到的差异只反映机会变异。记作H0 2.备择假设:是指观察到的差异是真实的。记作H1。 3.原假设和备择假设合在一起,应涵盖我们所研究的总体特征的所有可能性。 三、双尾检验和单尾检验 采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取决于备择 假设的形式。 拒绝域的单、双尾与备择假设之间的对应关系
四、显著性检验的两类错误 (一)显著性检验中的第一类错误及其概率 显著性检验中的第一类错误是指,原假设H0:θ=θ0事实上正确,可是检验统计量的观察值却落入拒绝域,因而否定了本来正确的假设。这是弃真的错误。 发生第一类错误的概率(记作 (二)显著性检验中的第二类错误及其概率 显著性检验中的第二类错误是指,原假设H0: θ=θ0不正确,而备择假设H1: θ<θ0或H1: θ>θ0是正确的,可是检验统计量的观察值却落入了接受域,因而没有否定本来不正确的原假设。这是取伪的错误。 发生第二类错误的概率(记作 (三) 当样本容量一定时, 五、显著性检验的P—值 若用计算机统计软件进行假设检验, 我们会见到P—值。将算得检验统计量样本值查表得的概率是就是P—值(在那里我们称之为观察到的显著水平)。 六、关于显著性检验的结果 (一) 显著性检验回答什么问题 我们所观察到的差异(是纯属于机会变异,还是反映了真实的差异? 1.如果显著性检验得到差异显著的结论这时并不能评价差异的大小和重要性。 2.显著性检验只能告诉我们差异是否在事实上存在,而不能回答差异产生的原因。 3.显著性检验不能检查我们对实验所作的设计是否有缺陷 (二)显著性检验回答问题的方式 在表述显著性检验结论的时候,应与检验的逻辑推理相符。 当检验统计量的观察值落在拒绝域时,我们应该说,样本资料显著地(或高度显著地)表明,差异是存在的。 (三)对观察到的显著水平数值的评价 七、显著性检验中的总体和样本 (一)显著性检验的对象是无限总体 (二)大样本可能会使检验统计量过分敏感 (三)从有限总体中抽取样本用于显著性检验时,必须作概率抽样 八、显著性检验的步骤 显著性检验的一般步骤或格式如下: (1)提出假设 H0: H1: 同时,与备择假设相应,指出所作检验为双尾检验还是左单尾或右单尾检验。 (2)构造检验统计量,收集样本数据,计算检验统计量的样本观察值 (3)根据所提出的显著水平 (4)作出检验决策 把检验统计量的样本观察值和临界值比较,或者把观察到的显著水平与显著水平标准比较;最后按检验规则作出检验决策。当样本值落入拒绝域时,表述成:“拒绝原假设”,“显著表明真实的差异存在”;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假设”,“没有充足的理由表明真实的差异存在”。另外,在表述结论之后应当注明所用的显著水平。 §7.2 总体均值为某定值的显著性检验 总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布的不同情况,总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。 一、总体为正态分布,总体方差已知,样本不论大小 对于假设 如果规定显著性水平为 二、总体分布未知,总体方差已知,大样本 对于假设 如果规定显著性水平为 三、总体为正态分布,总体方差未知,小样本 对于假设H0: 如果规定显著性水平为 四、总体分布未知,总体方差未知,大样本 对于假设H0: 如果规定显著性水平为 §7.3 总体比例为某定值的显著性检验 总体比例指的是随机试验中某种指定事件出现的概率。随机试验中某种指定事件出现叫做“成功”,把一次试验中成功的概率记作 对于假设 其中 如果规定显著性水平为 ① 一、显著性检验的意义 为了便于理解,我们结合具体例子来说明显著性检验的意义。例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量高于45%(记为 因为通过5个样品测定的蛋白质含量计算的样本平均数 其中, 样本平均数 (4-1)式表明,样本平均数 于是, (4-2)式表明, 又如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为 因为两个水稻品种平均产量 于是, 其中, (4-5)式表明,试验的表面差异( 二、显著性检验的步骤 下面通过一个例子来介绍显著性检验的基本步骤。 【例4·1】 已知某品种玉米单穗重 (一)提出假设 首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数 这种假设通常称为无效假设或零假设(null hypothesis),意味着,所要比较的两个总体平均数之间没有差异,记为H0: (二)计算概率 在假定无效假设成立的前提下,根据所检验的统计数的抽样分布,计算表面差异( 本例是在假定无效假设H0: 本例, 下面估计|u|≥2.526的两尾概率,即估计P(|u |≥2.426)是多少?我们知道,两尾概率为0.05的临界 P(| P(| 根据样本数据计算所得的 所以,| 差异( (三)统计推断 根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件。在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当表面差异是抽样误差的概率小于0.05时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0: 显著性检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异( 综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。 上述显著性检验利用了 三、显著水平与两种类型的错误 (一)显著水平 在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来否定或接受无效假设的概率标准叫显著水平(significance level),记作 对于上述例子的 这里可以看到,是否否定无效假设H0: 显著性检验时选用的显著水平,除常用的 (二)两类错误 因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。例如,经 显著性检验可能出现两种类型的错误:Ⅰ型错误(typeⅠerror)与Ⅱ型错误(typeⅡerror)。Ⅰ型错误又称为 因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率” 这是统计推断的基本特点。显著性检验的两类错误归纳如下: 表4-1 显著性检验的两类错误
为了降低犯两类错误的概率,一般从选取适当的显著水平 对于田间试验,由于试验条件不容易控制完全一致,试验误差较大,为了降低犯Ⅱ型错误的概率,也有选取显著水平 四、两尾检验与一尾检验 在【例4·1】中,对应于无效假设H0: 两尾检验在实践中应用广泛,但是在有些情况下两尾检验不一定符合实际情况。例如,前已述及,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%( 又如,国家规定稻米中某种农药成分的残留物含量应低于0.1%( 这种利用一尾概率进行的检验叫一尾检验(one-tailed test)。此时 一尾检验的 图4-1 两尾检验 图4-2 一尾检验 实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道 五、显著性检验应注意的问题 上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题: 1、 要有合理的试验设计和准确的试验操作,避免系统误差、降低试验误差,提高试验的准确性和精确性。 2、 选用的显著性检验方法要符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所选用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其应用条件和适用范围。 3、 选用合理的统计假设。进行显著性检验时,无效假设和备择假设的选用,决定了采用两尾检验或是一尾检验。 4、 正确理解显著性检验结论的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在实际应用上一定就有重要或很重要的价值。“显著”或“极显著”是指表面差异为试验误差可能性小于0.05或0.01,已达到了可以认为存在真实差异的显著水平。有些试验结果虽然表面差异大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果虽然表面差异小,但由于试验误差小,反而可能推断为“差异显著”。 显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99%,而在0.05水平下否定无效假设的可靠程度为95%。 “差异不显著”是指表面差异为试验误差可能性大于统计上公认的概率水平0.05,不能理解为没有差异。下“差异不显著”的结论时,客观上存在两种可能:一是无本质差异,二是有本质差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本容量,则可能表现出差异显著性。显著性检验只是用来确定无效假设能否被否定,而不能证明无效假设是正确的。 5、统计分析结论的应用,还要与经济效益等结合起来综合考虑。 |
|