<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">格拉布斯对异常值的测试</font></font>

昵称47241897 2019-07-12

展开全文

在统计学中，Grubbs的测试或Grubbs测试（以1950年发表测试的Frank E. Grubbs命名^[1]），也称为最大归一化残差测试或极端学生化偏差测试，是用于检测异常值的测试。假设来自正态分布的人口的单变量数据集。

内容

格拉布斯的测试基于正态假设。也就是说，在应用Grubbs测试之前，首先应验证数据是否可以通过正态分布合理地近似。^[2]

格鲁布斯的测试一次检测到一个异常值。从数据集中删除该异常值，并且迭代测试直到没有检测到异常值。但是，多次迭代会改变检测概率，并且测试不应该用于六个或更少的样本大小，因为它经常将大多数点标记为异常值。

Grubbs的测试是针对假设定义的：

H ₀：数据集中没有异常值

H _a：数据集中只有一个异常值

Grubbs测试统计定义为：

同和分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。

这是测试的双面版本。Grubbs测试也可以定义为单侧测试。要测试最小值是否为异常值，检验统计量为

与ÿ _分钟表示的最小值。要测试最大值是否为异常值，测试统计信息是

与Ÿ _最大表示最大值。

对于双侧检验，没有异常值的假设在显着性水平 α 处被拒绝

与吨_{α/（2 Ñ），Ñ -2}表示的上临界值的的t分布与ñ - 2 自由度和α的显着性水平/（2 Ñ）。对于单侧检验，替换α/（2 Ñ与α/）Ñ。

^ 格拉布斯，弗兰克E.（1950）。“测试异常观测的样本标准”。数学统计年鉴。21（1）：27-58。doi：10.1214 / aoms / 1177729885。
^ 引自工程和统计手册第1.3.5.17段， http：//www.itl./div898/handbook/eda/section3/eda35h.htm

格拉布斯，弗兰克（1969年2月）。“检测样本中的外围观察的程序”。技术计量学。Technometrics，Vol。11，第1号11（1）：1-21。doi：10.2307 / 1266761。JSTOR 1266761。
Stefansky，W。（1972）。“拒绝因子设计中的异常值”。技术计量学。Technometrics，Vol。14，No。2. 14（2）：469-479。doi：10.2307 / 1267436。JSTOR 1267436。