分享

Minitab系列5:t检验还是配对检验?

 松哥精鼎统计 2020-10-23
导读

      新年伊始疫情影响波及大范围的企业复工、运营的方方面面,希望这场灾难早点结束。同时,我们也要向前看,在不确定性的环境下完成远程办公、项目加速、有限条件评估等确定性的工作。努力完成的项目当然希望得到认可,今天咱们聊聊利用假设检验评估“今年VS去年”。

内容开启





--缅怀传奇CEO杰克·韦尔奇

案例数据:

    一般情况下项目都会在上半年完成,年底在年度总结上进行评审。下列数据是某公司工程师完成提高设备正常产出项目后的统计数据:



我们先用双样本T检验看看:统计-基本统计-双样本t

按下图对话框设置:

‘假定等方差’项,不同统计书上说法略有差异,总结起来:任何总体的方差不可能完全相同。如果相信数据,不去检验方差是,直接用方差不等的方法去做,不会有问题,即使方差相等,结果差别不太大。现在有很多产物都是手工时代从近似某种分布而遗留下的,如果有疑问将两种方法都列出来,如果明显差异,再回过头找原因。过程还是很简单的,输出结果如下:


P>0.05无法拒绝原假设,即 “证据不足,无法拒绝今年与去年一样” 的假设。那是不是还需要增加其他的证据呢?我们知道有的行业与季节性、周期性等时间因素相关,将样本视为非独立样本吗,看看3-12月的配对T检验情况:点击统计-基本统计-配对t,然后按下图对话框。


结果输出如下:

P<0.05, 拒绝原假设,则我们得出今年比去年好的结论了,一年的努力可以被肯定,皆大欢喜。

问题来了两个结论,该相信谁呢?

首先要强调的是此案例双样本t检验结论是“证据不足,无法拒绝原假设”,而不是“接受原假设”,这样就能理解两种方法并不矛盾,两个结论都可信。从下面的图形也可以看出背后的数据模型是有差异的。

那该不该拒绝原假设呢?

我们知道“原假设”就是用来拒绝的,同一个假设检验问题,往往有多个检验统计量和方法,不同方法之间就涉及检验的“势(power)”,渐进相对效率(ARE)等概念。假设检验是基于证伪的小概率事件原理,原则上只要有一个拒绝,就可以拒绝。所以,应该拒绝原假设。

假设检验的使用场景还是非常多的,很多论证中都使用配对T检验来说明结论的可信度。今天分享的案例是为了扩宽一些思路,大家有兴趣可以继续使用两组数据的差值,然后进行单样本t检验看看,以及配对检验ANOVA 的联系。

忘了说,案例的假设检验前提是总体是正态分布,如果不是则该方法不适用。下期我们将聊一聊总体不是正态分布的情况-非参数检验。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多