在统计学中,Grubbs的测试或Grubbs测试(以1950年发表测试的Frank E. Grubbs命名[1]),也称为最大归一化残差测试或极端学生化偏差测试,是用于检测异常值的测试。假设来自正态分布的人口的单变量数据集。 定义[ 编辑]格拉布斯的测试基于正态假设。也就是说,在应用Grubbs测试之前,首先应验证数据是否可以通过正态分布合理地近似。[2] 格鲁布斯的测试一次检测到一个异常值。从数据集中删除该异常值,并且迭代测试直到没有检测到异常值。但是,多次迭代会改变检测概率,并且测试不应该用于六个或更少的样本大小,因为它经常将大多数点标记为异常值。 Grubbs的测试是针对假设定义的:
Grubbs测试统计定义为: 同 和 分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。 这是测试的双面版本。Grubbs测试也可以定义为单侧测试。要测试最小值是否为异常值,检验统计量为 与ÿ 分钟表示的最小值。要测试最大值是否为异常值,测试统计信息是 与Ÿ 最大表示最大值。 与吨α/(2 Ñ),Ñ -2表示的上临界值的的t分布与ñ - 2 自由度和α的显着性水平/(2 Ñ)。对于单侧检验,替换α/(2 Ñ与α/)Ñ。 相关技术[ 编辑]可以并且应该使用几种图形技术来检测异常值。简单的运行序列图,箱形图或直方图应显示任何明显的外围点。一个正态概率图也可能是有用的。 另见[ 编辑]参考文献[ 编辑]
本文结合 了国家标准与技术研究院网站https://www.的公共领域资料。 |
|
来自: 昵称47241897 > 《待分类》