分享

Minitab系列07:多少个数据合适

 松哥精鼎统计 2020-10-23
导读

上一篇我们从why出发数据正态的重要性,这一篇我们聊一聊关于正态性检验这一过程。因为个人是一个企业人员不是学术研究者,不会从接近临界P值的学术角度来计算或者从原理来解析,所以更多是从应用层面解析这一话题。

内容开启






Minitab提供了3种正态性检验的方法,每种方法背后就是一套算法,A-D统计量是在分布的尾部施加更大权重的平方距离,R-J评估数据和数据的正态评分之间的相关性,K-S则属于“非专业性选择手”可以参考Lilliefors test, a correctedversion of the K-S test for normality。其功效自然就是就是A-D>R-J>K-S。既然功效不一样,肯定就会出现A-D拒绝,K-S接受的情况。在企业活动中,客户端永远是从严考虑,供应端则希望是从宽考虑,冲突就出现了。

从严与从宽谁对呢?都对,又都不对。都对是因为站的角度不一样,对数据认知不一样,都不对是因为属于“懒政”。正态性检验可不仅仅是输入数据,检验就完事的,下面我们就扒一扒怎么做。

多少样本数据合适?





Minitab官方说法如果样本数量小于 20,则提供的功效可能不足,无法检测样本数据和正态分布之间的显著差异。但是,在使用很大的样本数量时要格外小心,因为它们可能会提供过大的功效。当检验功效太大时,样本数据和理论分布之间可能无意义的小差异似乎会非常显著。

SPSS相关参考书摘选:With large enough sample sizes (> 30 or 40), theviolation of the normality assumption should not cause major problems; thisimplies that we can use parametric procedures even when the data are notnormally distributed. If we have samples consisting of hundreds ofobservations, we can ignore the distribution of the data. According to thecentral limit theorem, (a) if the sample data are approximately normal then thesampling distribution too will be normal; (b) in large samples (> 30 or 40),the sampling distribution tends to be normal, regardless of the shape of thedata ; and (c) means of random samples from any distribution will themselveshave normal distribution.

参考书:

Pallant J. SPSSsurvival manual, a step by step guide to data analysis using SPSS for windows.3 ed. Sydney: McGraw Hill; 2007. pp. 179–200.

Elliott AC, WoodwardWA. Statistical analysis quick reference guidebook with SPSSexamples. 1st ed. London: Sage Publications; 2007.

Statistics notes: thenormal distribution. Altman DG, Bland JM BMJ. 1995 Feb 4; 310(6975):298.

FieldA. Discovering statistics using SPSS. 3 ed. London: SAGE publicationsLtd; 2009. p. 822

从上述角度,样本量在20-3040)的时候,正态性检验的结果说服力强。这时候很多标准里面(例如AIAGSPC 要求25组数据)就能解释通了。

图形+检验= 结论

内容开启






如下所示,我用Minitab使用统计-基本统计-图形化汇总以及统计-基本统计-正态性检验输出如下所示:

我们可以得到如下结论:

1A-D检验拒绝数据的正态性;

2)汇总报告以及概率图上数据没有明显非正态性。

从数值判断上A-D已经拒绝正态假设,从图形判断上没有明显差异,该怎么办呢?作为工程人员,从实际应用出发作如下判断:

1)参考数量,119个;

2)图形显示数据没有明显不服从正态特征,拟合线也未发现明显异常;        3)我用其他软件作了一个对比,结果只有A-D检验给拒了。

结束语






正态性检验基于假设检验的原理,在应用中一直存在各种争议。本篇幅从数据解释的角度从数量、图形以及对比的角度阐述了如何解释正态性检验,抛开“懒政”,以事实为基础,客观的看待正态的应用环境,将精力用在刀刃上。

Minitab系列

Minitab系列06:数据为什么要正态?

Minitab系列5:t检验还是配对检验?

Minitab系列4:Minitab描述性统计与图形

Minitab系列3:Minitab数据+计算+协助菜单

Minitab系列2:Minitab安装与界面介绍

Minitab系列1:Minitab简介

Minitab番外_6sigma关于起源与发展(1)

Minitab番外_6sigma关于起源与发展(2)

Minitab番外_6sigma关于起源与发展(3)

整理不易,欢迎点亮再看!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多