搜索

分享

QQ空间 QQ好友新浪微博微信

为什么报告效应量

钟山紫竹林 2020-06-05

展开全文

作者：薛韶航封面：吉江

大家在进行t检验或者F检验的时候，大多都会盯着p值看，期待着结果差异显著，也好证明假设。但是p值小于临界值，真的代表着结果差异显著吗？或者说，这样的结果真的有意义吗？下面我们以F检验为例进行说明。

方差分析计算过程

方差分析利用平方和的可加性，将总平方和分解成了组间、组内等平方和。

接下来，求出各平方和对应的自由度。

其中N代表总样本量，k代表组别数。总自由度由样本量决定，组间自由度由组别数对应，组内自由度则等于总自由度减去组间自由度，（划重点）即在组别数一定的前提下，样本量越大，对应的组内自由度越大。

接下来，平方和除以对应自由度，得出对应均方，组间均方比组内均方即为F值。

这时我们注意到，组内自由度成了分母的分母。也就是说，组间自由度一定的情况下，组内自由度越大，F值就越大。根据上文提到的，组间自由度一定情况下，样本量越大，组内自由度也就越大，对应的F值也就越大。

通过查询F值分布表，我们可以得知，组内自由度越大，F的临界值是越来越小的。也就是说，控制其他变量不变，我们测量的样本量越大，F值越容易显著。这样一来，即便本来不显著的差异，由于样本量的增加，F值也会变得显著。

讲道理，如果我们的结论足够可靠，那么它是不会随着样本量而变化的。换种说法，如果样本量足够大，一切不显著的差异都将变得显著，这可太没有道理了。

那么我们如何避免样本量带来的误差呢？这就要提到另一个指标——效应量。

啥是效应量

效应量（effect size）的含义是“反应处理效应大小的指标”，换句话说，就是“由于我们处理产生的变异”的占比大小。以单因素方差分析为例，效应量的计算公式为：

我们前面也有提到，平方和代表了对应变异的大小。效应量则是看由于处理（在此为“分不同组给不同条件”这一处理）造成的变异占总变异的多少，从而判断处理效应的大小。

从公式中我们也可以看到，效应量不受样本量的影响。但是效应量并不像F值那样，有明确的p值与之对应。因此我们在报告F检验的结果时，要同时报告F值、显著性水平p值和对应的效应量η_p²。

上述过程我们都是以单因素方差分析为例的。在多因素方差分析和重复测量方差分析里，甚至t检验中，样本量引起的困扰同样存在，因此，我们也要报告出对应的效应量。(跟大家提个醒，t检验的效应量可就不是η²咯)

所以，以后在分析数据时，除了单纯的盯着p值看，效应量也是个不可忽视的指标啊！

今天的分享就是这些啦

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：钟山紫竹林 > 《统计》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

钟山紫竹林

关注对话

TA的最新馆藏

R语言中的引号
一个等号（=）和三个等号和两个等号的区别（“===”和“==”）
R语言细节汇总
R语言读取的文本中的空格如何保留？
R语言基础数据类型
R语言数据类型

喜欢该文的人也喜欢更多

热门阅读换一换