分享

为什么报告效应量

 钟山紫竹林 2020-06-05

作者:薛韶航   封面:吉江


        大家在进行t检验或者F检验的时候,大多都会盯着p值看,期待着结果差异显著,也好证明假设。但是p值小于临界值,真的代表着结果差异显著吗?或者说,这样的结果真的有意义吗?下面我们以F检验为例进行说明。

方差分析计算过程

 方差分析利用平方和的可加性,将总平方和分解成了组间、组内等平方和。

    接下来,求出各平方和对应的自由度。

    其中N代表总样本量,k代表组别数。总自由度由样本量决定,组间自由度由组别数对应,组内自由度则等于总自由度减去组间自由度,(划重点)即在组别数一定的前提下,样本量越大,对应的组内自由度越大。

    接下来,平方和除以对应自由度,得出对应均方,组间均方比组内均方即为F值。

    这时我们注意到,组内自由度成了分母的分母。也就是说,组间自由度一定的情况下,组内自由度越大,F值就越大。根据上文提到的,组间自由度一定情况下,样本量越大,组内自由度也就越大,对应的F值也就越大。

    通过查询F值分布表,我们可以得知,组内自由度越大,F的临界值是越来越小的。也就是说,控制其他变量不变,我们测量的样本量越大,F值越容易显著。这样一来,即便本来不显著的差异,由于样本量的增加,F值也会变得显著。

    讲道理,如果我们的结论足够可靠,那么它是不会随着样本量而变化的。换种说法,如果样本量足够大,一切不显著的差异都将变得显著,这可太没有道理了。

    那么我们如何避免样本量带来的误差呢?这就要提到另一个指标——效应量。 

啥是效应量

     效应量(effect size)的含义是“反应处理效应大小的指标”,换句话说,就是“由于我们处理产生的变异”的占比大小。以单因素方差分析为例,效应量的计算公式为:

    我们前面也有提到,平方和代表了对应变异的大小。效应量则是看由于处理(在此为“分不同组给不同条件”这一处理)造成的变异占总变异的多少,从而判断处理效应的大小。

   从公式中我们也可以看到,效应量不受样本量的影响。但是效应量并不像F值那样,有明确的p值与之对应。因此我们在报告F检验的结果时,要同时报告F值、显著性水平p值和对应的效应量ηp2

    上述过程我们都是以单因素方差分析为例的。在多因素方差分析和重复测量方差分析里,甚至t检验中,样本量引起的困扰同样存在,因此,我们也要报告出对应的效应量。(跟大家提个醒,t检验的效应量可就不是η2咯)

所以,以后在分析数据时,除了单纯的盯着p值看,效应量也是个不可忽视的指标啊!

    今天的分享就是这些啦

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多