分享

六西格玛统计工具——假设检验

 天行健西格玛 2019-11-19

六西格玛统计工具——假设检验

假设检验是六西格玛团队项目中应用最多的统计工具。诸如要判断下列结论是否正确:“新员工比老员工得到更多的投诉”,“改进工作后平均产量有提高”,“加工温度为180度时比160度时垫圈断裂强度要高”等等。由于我们观测到数据总会带有误差,不能从简单的样本统计量的结果下定论,必须使用严格的统计假设检验方法才能得出准确的判断结论。



参数估计和假设检验是统计推断的两个重要方面。参数估计是以“数”为其输出结果,而假设检验是以“判断”为其输出结果。下面介绍假设检验步骤。

1、建立假设。

假设检验的第一步便是建立假设,通常需要建立两个假设:原假设Ho和备择假设H1。

2、选择检验统计量,确定拒绝域的形式。

若对总休的均值进行检验,那么我们将用样本均值引出检验统计量;若对正态总体的方差进行检验,我们将从样本方差引出检验统计量。

根据统计量的值把整个样本空间分成两个部分:拒绝域W与非拒绝域A。当样本统计量的值落在拒绝域中就拒绝原假设,否则就无法拒绝原假设。所以在假设检验中我们必须找出拒绝域。

根据备择假设的不同;拒绝域可以是双边的也可以是单边的。在确定了拒绝域的类型后,还要确定临界值。这应根据允许犯错误的概率来确定。

3、给出检验中的显著性水平a。

在对原假设是否成立进行判断时,由于样本的随机性,判断可能产生两类错误。第1类错误是当原假设为真时,由于样本的随机性,使样本观测值落在拒绝域w中,从而做出拒绝原假设的决定,这类错误称为第1类错误,也称为弃真概率。

关于第2类错误的说明:如果钢筋平均抗拉强度比原来真有提高,这时钢筋平均抗拉强度已经不是原来的2 000kg了,但我们没有拒绝Ho误认为没提高,即把“已提高”误认为“未提高”。一般来说就是,当Ho不成立时,我们却没有拒绝Ho,这就是第二类错误。

4、给出临界值,确定拒绝域。

有了显著性水平a后,可以根据给定的检验统计量的分布,查表得到临界值,从而确定具体的拒绝域。在不同的备择假设下,拒绝域、临界值与显著性水平a的关系是不同的。其义看下图。

备择假设、拒绝域、显著性水平

5、根据样本观测值,计算检验统计量的值。

根据样本观测值,计算检验统计量的值;收集样本数据,计算检验统计量的值。

6、根据检验统计量的值是否落在拒绝域中做出判断。

①将检验统计量的值与拒绝域的临界值相比较,当它落在拒绝域中就做出拒绝原假设的结论,否则就做出不能拒绝原假设的结论。

②由检验统计量计算p值,所谓p值,就是当原假设成立时,出现目前状况的概率(严格说是:当原假设成立时,出现目前状况或对原假设更不利状况,即对备择假设更有利状况的概率)。当这个概率很小时(例如小于0.05),这个结果在原假设成立的条件下就不该在一次试验中出现;但现在它确实出现了,因此我们有理由认为“原假设成立”的这个前提是错的,因而应该拒绝原假设,接受备择假设。因此可以有个最一般的规则:如果p<a,则拒绝原假设。

③根据样本观测值可以得到总体参数的置信区间,如果原假设的参数值未落入此置信区间,就做出拒绝原假设的结论,否则就做出不能拒绝原假设的结论。目前大多数统计软件都提供了相应的置信区间,不必自己计算,因此用这个方法判断也很方便。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多