假设检验1、假设检验的由来我们先看一个例子: 那么如何检验这位女士的说法呢?FISHER进行了研究,从而提出了假设检验的思想。 比如: 正常情况下我们去猜先倒茶还是先倒牛奶的话,概率应该是1/2, 1.总共检验了两杯,全部猜对的概率是:0.5✖️0.5=0.25,虽然概率很低,但是也算正常; 2.继续猜,又猜了两次,也全部猜对了几率是 3.我们继续猜,加大样本,如果连续猜对10杯,那么我认为这位女士确实有特殊的能力。 虽然我们上面说猜对10杯来确认这位女士有特殊能力,这只是我们的臆测,我们假设一个x,当这位女士能够猜对x杯才认为这位女士确实有特殊的能力,其实对于我们最难的是来确认着x。 下面我们就来看一下怎么样来确认这个x。
2、什么是假设检验假设检验(Hypothesis Testing):是推断统计的最后一步,是依据一定的假设条件由样本推断总体的一种方法。 你提出你的假设:说你有特殊的能力,可以品出先倒茶还是牛奶; 我提出要检验你的假设:品十(x)杯,看实验结果是不是和你说的假设相符
假设检验其实就是假设和检验两步,先提出假设,之后再来验证假设是不是合理的。 3、P值为了完成假设检验,需要先定义一个概念:P值。 根据上面的描述,这里假设检验的思路就是:
猜奶茶的实验应该符合二项分布(这就不解释了),也就是:
在我们认为猜之前没有泄密(也就是确实是凭自己的嗅觉去猜)的前提下,猜10次应该符合以下分布:
下图表示的就是,假如猜是公平的情况下的分布图:
也就是说猜10次能猜对8次的概率是0.0439 为了方便大家计算,附上python代码:
把八次猜对概率,与更极端的九次猜对、十次猜对的概率加起来: 为什么要把更极端的情况加起来? 根据猜奶茶这个例子,可能你会觉得,我知道八次猜对出现不正常就行了,干嘛要把九次、十次加起来? 比如我们要猜1000次用二项分布来计算很麻烦,根据中心极限定理,我们知道,可以用正态分布来近似: 但是,对于正态分布,我没有办法算单点的概率(连续分布单点概率为0),我只能取一个区间来算极限,所以就取530、以及更极端的点组成的区间: (我上面只取了单侧P值,说明下:取单侧还是双侧,取决于你的应用,什么叫做更极端的点,也取决于你的应用) 3.1、单侧检验
3.2 双侧检验
4、显著水平总共猜10次,那么是出现7次猜对,可以认为有特殊能力,还是9次猜对之后我才能确认有特殊能力,这是一个较为主观的标准。 我们一般认为 P-value<=0.05 就可以认为假设是不正确的。 0.05这个标准就是显著水平,当然选择多少作为显著水平也是主观的。
我们可以认为刚开始的假设(这位女士不能准确的猜出先倒茶还是牛奶)错的很“显著”,也就是是有特殊能力的。 5、假设检验步骤我们回顾下我们刚才所说的,总结下: 这里简单说下检验统计量
6、实例我们这里举2个例子: 首先我们先引入一个检验统计量分布的选择规则 例1:
我们知道总体均值和总体方差,根据上图的规则可以看出我们可以用Z统计量:
例2:
本例自由度v=n-1=35-1=34,查表得得t0.05/2,34=2.032。 因为t < t0.05/2,34,故P>0.05,按 α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为该地难产儿与一般新生儿平均出生体重不同。
以上就是对假设检验思想的一个简单介绍,其实对于理论的介绍理解起来比较晦涩,就像我们用1+1=2很简单,要是理解1+1为什么等于2就难了。假设检验在运用的时候就像最后的两个例子,其实是很简单的,但是对于理论的理解就需要比较长的时间。 |
|
来自: 好易学 > 《概率论与数理统计》