分享

T检验和其他假设检验的P值怎么理解

 我是皮卡丘 2021-12-14
关于单样本和两独立样本T检验的操作方法,前两天推送的两文已经逐步讲解。今天我们不谈具体的步骤,而是通过案例全方位地将T检验和P值的逻辑和思想,掰开揉碎,尝试用白话再梳理一遍,增进大家的理解,不足之处,欢迎指出讨论。
案例5年前,全国男性的平均身高是1.75米(普查得到的总体均值),现在我们想知道如今男性的平均身高是否发生了改变。
思路:从全国男性群体中随机抽取1000名样本,获得样本均值和样本标准差,进行假设检验。
此处需要提醒的是,在进行假设检验时,我们的关注点在样本均值上,即我们不太关注原始样本的情况,而是关注由这个样本计算的样本均值了。
现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名,所以,我们会得到100个样本均数,将这100个样本均数放在一起再求均数和标准差,得到的均数会更加接近全国这个总体的均数,而这个标准差就是你听过的“标准误”。
然而,现实情况中我们只会抽取一次,只会得到一个样本均数和一个样本标准差,虽然这一个样本均数不如上面由100个样本均数平均后计算地精确,但在数学上仍可以证明,这一个样本均数也可以用来很好地估计总体均数。所以,问题的关键就变成了,不抽取100次,怎么计算“标准误”?好在我们也能证明,只抽样一次获得的样本标准差(S),除以根号N就可以得到“标准误”的估计值了,于是抽样一次就可以简单算出“标准误”,再次提醒,这个“标准误”实际上就是均数的标准差。
现在我们正式开始T检验的思路。上文提到了,我们关注的随机变量已经不是原始的身高了,而是身高的均数,身高的均数,身高的均数(重要的话,讲三遍)所以,身高均数成为了我们研究的随机变量,它也存在总体与样本的区分,它也有均值和标准差,而且我们还可以确定无论身高是否真正服从正态分布,身高均值这个变量总是近似服从正态分布(中心极限定理),由此我们就可以利用这些性质进行假设检验。
回到上面的问题,5年前全国男子身高的总体均值是1.75米(μ),我们想知道现在是否有变化,其实就是想检验,5年后的现在全国男子身高的总体均值是否还是1.75米因为我们不进行普查,所以我们希望通过随机抽取一个1000人的样本来进行推断和检验。得到样本后,我们可以计算出样本均数、样本标准差以及标准误。
假设样本均数为 1.77,显然我们不能因为1.77和1.75这两个数字的不同就判断说现在全国男子的平均身高要大于5年前了。因为即使现在的身高没有变化,你随机抽取一个1000人的样本得到的样本均数也不可能就恰好等于1.75,这很好理解,抽样是有误差的。于是,我们就要搞清楚现在得到的这个样本均数(1.77)和5年前的总体均数(1.75)的差异仅仅是因为抽样误差,还是确实是因为现在人们的平均身高发生了变化,这里的“变化”用数学的语言表达就是:现在全国男子身高的总体均数到底还是不是1.75,注意这里是“总体均数”,也就是说我们真正关心的是总体,样本只是用来获得总体信息的一个手段。
我们先假设,现在的总体均数没有变,仍等于1.75。所以,我们抽取的1000人就认为是在这个总体中抽取的一个样本。在零假设情况下,这个总体的均数是1.75,而我们获得的样本计算出来的样本均数是1.77,假设检验的问题就转换成了:在一个总体均数为1.75的总体中,抽到如今这个样本的概率是多少?
很明显,如果这样问,答案肯定就是0。在先前的文章中,我们知道一个样本相当于数轴上的一个点,而从一个数轴中抽取一个点的概率就是0。然后,你就看到了那句“永远让人费解的话”:P值是抽取到现有样本或更极端情况样本的概率。
如果把样本割裂来看,抽到一个样本的概率就是0,而“现有样本或更极端情况的样本”中的“或”字表明,P不是指的一个点的概率,而是一个区间的概率,也就是在μ为1.75的总体中,根据抽到的样本计算的样本均值比1.77还要大的样本(比如1.78或1.80),这些样本合起来的概率就是P,而这些样本相对均数为1.75的总体而言便是“更极端样本”了。看到这里,你可以想想这句话怎么用概率式子表示出来呢?
最后一个问题就是,如何计算P值?这里需要的基础知识是:知道一个变量服从正态分布,怎么计算这个变量在某个区间上的概率。比如,随机变量X服从均值为2.5,标准差为1.6的正态分布,如何求X<4的概率。这种问题的解法应该都学过,我们简单回顾一下。首先将X进行标准化处理(即将变量减去均数然后除以标准差),比如将4标准化:(4-2.5)/1.6=0.94,然后查标准正态概率分布表P(Z≤0.94)=0.8264,于是就得到P(X<4)=0.94。
(因为微信公众号不支持公式的编辑,所以以下文字通过截图的形式呈现,望见谅)

图片


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多