分享

真的!单因素方差分析你用错了!

 松哥精鼎统计 2020-10-23

方差分析简介

方差分析(analysis of variance,简写为ANOVA)是进行多个均数比较的常用方法。这种方法的基本思路是通过对变异进行分解和分析,从而达到统计推断之目的。由于该方法是由英国统计学家R.A.Fisher于1923年首先提出的,因此又称为F检验。最简单的方差分析,就是单因素方差分析(one-way anova),用于分析含有一个分类变量、一个定量变量的资料,用于多个样本均数的比较中。

方差分析对原始数据的要求与t检验一样,即要求资料满足独立性、正态性和方差齐性。

 

来个判断题,求围观!!

因为单因素方差分析要求资料满足方差齐、正态性的条件,故当方差齐或正态性的条件不满足且经过变量变换也不满足时,应当采用非参数检验(如Kruskal-Wallis test)。

这句话对吗?

这是有些传统统计教材中的说法,但是我很负责任的告诉你,上面的观点是错误的。

近日,在国外生物统计学方法相关资料中发现了针对单因素方差分析不满足应用前提(正态性、方差齐)的推荐处理方法,完全颠覆了我的以往思路。

现总结归纳如下

一、当资料不满足正态性,由于单因素方法分析结果对资料不满足正态性的情况并不敏感,仍推荐使用单因素方差分析,不推荐非参数检验(Kruskal-Wallis test)。

二、当资料不满足方差齐性,推荐采用Welch's ANOVA,不推荐非参数检验(Kruskal-Wallis test)。

下面详细解释为什么不推荐非参数检验(Kruskal-Wallis test)的原因。

 1 

不满足正态性的情况

当资料中含有一个分类变量、一个定量变量,我们常常采用单因素方差分析。但当不同组中的定量变量不满足正态性的条件,Kruskal–Wallis test往往被人们用为替代方法。因为他们认为除非样本量非常大并且满足正态分布,否则就应该采用Kruskal–Wallis test;而且当数据正态性的条件不满足时,使用单因素方差分析是错误和危险的。

但是,他们不知道:单因素方差分析的结果对不满足正态性的情况并不敏感。生物统计学家John H. McDonald模拟了一系列非正态分布数据采用单因素方差分析进行分析,包括低峰分布、高峰分布、偏态分布和双峰分布,最终发现:结果是假阳性的比例总是在5%左右或更小。

结论:以此为依据,可以看出单因素方差分析的结果对不满足正态性的情况并不敏感。

故在正态性不满足的条件下,不推荐用Kruskal–Wallis test替代单因素方差分析,仍采用单因素方差分析。

2

不满足方差齐性的情况

单因素方差分析的另一个前提条件是:方差齐性。Kruskal-Wallis test不要求数据的正态性,但要求不同组的数据具有相同的分布,然后对分布位置进行比较。但是各组的方差不同时,各组的分布也就不同了。因此,当数据不满足方差齐性时,Kruskal-Wallis test也不比单因素方差分析更好,甚至可能更坏。

结论:不满足方差齐性的情况时,推荐使用Welch‘s anova。

实现方法

那以上两种情况具体该怎样实现呢?

一、正态性不满足的条件下,仍采用单因素方差分析,该操作与普通的单因素方差分析一致,此处省略。

二、不满足方差齐性的情况时,推荐使用Welch‘s anova。此方法以往使用较少,下面介绍如何在SPSS中进行实现。

Welch‘s anova的SPSS操作

案例

在A、B、C、D、F五个地点分别采集样本进行F指标(定量变量)的检测,欲比较五个地点的F指标是否相同。

本案例资料有一个分类变量(地点),一个定量变量(F指标)。并根据研究目的,初步考虑采用单因素方差分析。但首先需要对资料的正态性、方差性进行探索,然后进一步确定方法。

 1 

正态性检验




根据上表显示,由于样本量小于50,看Shapiro-Wilk的结果,以α=0.1为检验水准,A、B、C三个组的数据均满足正态性,D、F组不满足。由于单因素方差分析的结果对不满足正态性的情况并不敏感,故在实际应用中正态性条件可以不过多考虑。

2

方差齐性检验以及Welch‘s anova




3

Welch‘s anova之后的两两比较方法

可以看出Welch's anova方法在SPSS中实现十分方便。那在方差不齐的情况下,假如Welch's anova的结果显示不同组间存在统计学差异,该运用什么方法进行两两多重比较呢?

生物统计学家John H. McDonald推荐采用Games-Howell test来进行方差不齐情况下的两两比较。SPSS的实现也非常方便,结果展示与LSD等两两比较方法一样,如下:



松哥统计说

单因素方差分析在分析一个分类变量、一个定量变量的资料时经常会存在前提条件(正态性、方差齐)不满足情况,以前往往想着用非参数检验替代单因素方差分析。其实这是不可取的。本期内容是不是颠覆了你的思路?好好思考,慢慢吸收吧!本期内容感谢秦老师的悉心撰稿!为大家提供新的分析方法与思路!


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多