统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。在质量管理领域统计得到广泛应用,积善利他,现共享统计学在质量领域的应用给各位质量人。 一、直通率(FTY,RTY,TPY)及其相关概念 基本统计(Basic Statistic) 当今,我们在日常生活中不知不觉地使用统计学,跟统计学有着非常密切的关系。 q某批产品不良发生的概率 q为了预测棒球比赛的胜负,调查各队过去的胜率 q搞民意测验预测总统选举结果 q根据收集到的气象数据预测未来的天气 q报纸、广播的问卷调查
用于属性数据,即数据的取值为有限个数。 例) 硬币投3次,出现正面为0,1,2,3次的概率分别是?硬币投10次,出现正面为0,1,2,3,4,5,6,7,8,9,10次的概率分别是? 用于连续数据, 即数据取值为无限个。 假设一个过程的特性服从正态分布(m=50, s=15),那末生产的产品小于20的机会是多少? 其中m、s为常数,e=2.718,且s>0,则称X服从参数为m,s的正态分布(Normal
distribution),记为X∼N(m,s2)。正态分布密度函数的图形见下图所示。
记为Z~N(0,1),其密度函数和分布函数分别记为φ ( x) 和 F ( x) 。 设X∼N(m,s2),则 上式就称为正态分布的标准化变换。 用Excel的函数功能: 函数分类: 统计 函数名: NORMDIST NORMDIST所计算出的概率为任何正态分布的样本值的左部概率 NORMDIST函数的语法规则: 格式: NORMDIST( x,μ,σ, 逻辑值) 功能:当逻辑值为1时,返回正态分布的分布函数P{X≤x}的值;当逻辑值为0时,返回其密度函数值。 可用Excel的统计函数NORMSINV返回Za。 语法规则如下: 格式:NORMSINV(1-a) 功能:返回Za的值。 说明: NORMSINV(a)返回的是Z1-a的值。 一、概率论的起源 概率论的研究始于意大利的文艺复兴时期,当时赌徒要求找到掷段子决定胜负的规则,曾向学者G.卡达诺(150l--1576)和著名的数学天文学家G.加利莱(1564—1642)求教;加利莱所写的一篇短文中,说明了概率的基本定律,从而为整个统计科学的发展奠定了理论基础。 在16与17世纪,机会对策(赌博)在富人中特别普遍,而且引进了更复杂的对策,包括更大的赌注,不同的对策需要一个合理的计算机会,当时这个问题成了一个非常重要的问题。一个法国知识分子C,梅勒也是一个狂热的赌徒,他曾向著名的数学家和哲学家B.帕斯卡尔(1623—1662)求教,帕斯卡尔的注意促成了帕斯卡尔与他的数学朋友的交往,特别是与P.弗曼特马(1601--16S5)的书信往来,就成为现代概率论与组合分析的起源。
本世纪初,一位爱尔兰吉尼斯啤酒厂的统计学家W.S.戈塞特(1876一1937),笔名“Student”,出版了许多篇关于解释抽样资料的文章。他是第一个认识到发展小样本方法以得出可靠信息的重要性的人。这种方法以后由R.A.Fisher(费雪)(1890一1962)及其同事在英国推广,费雪对统计科学作出了很大贡献,他开拓了试验理论,注意统计方法及其在科学研究领域中的应用。他引入了现在广泛应用的“零假设”一词(null hypothesis),并发展了方差分析的统计方法。 三、排列 Example: 四、二项分布(BinomialDistribution) 例) 硬币投3次,出现正面为0,1,2,3次的概率分别是? 硬币投10次,出现正面为0,1,2,3,4,5,6,7,8,9,10次的概率分别是? 二项试验的概率公式 对于一由n次试验组成的二项试验,令成功的概率为 p(不成功的概率 则为q = 1-p),则概率分布为:
设随机变量的可能取值为0,1,2,...,且 则称服从参数为λ的泊松分布,其中λ表示一定时间或空间内事件发生次数的平均值,λ=np,n代表取样数,p代表发生事件的概率,x(或k)代表发生事件的次数,x(或k)可以取任何正整数,也可以取大于n的值,所以取N个样本,发生x个缺陷的概率通常可以用泊松分布来描述。 泊松分布是概率论中重要分布之一。许多随机现象都可以用泊松分布来进行描述,如单位产品的缺陷数,电话总机在单位时间内收到的呼叫数,一个地区每月发生的事故数,物理学中热电子的发射个数等等都服从泊松分布。 当p<0.1且n非常大时,二项分布可近似地用泊松分布代替。 N 越大, p值越小,两种分布就越接近。 七、推断统计学
某种产品按照规定,次品率不得超过4%才能出厂,从1000件产品中抽检10件,假设有4件次品,问这批产品能否出厂. 解:假设产品次品率p=0.04,则抽捡10件产品中有4件次品的概率为: 先假设“符合出厂条件”,然后分析抽检结果,如果出现了在假设成立的条件下,竟发生了实际很难发生的事件.于是有理由认为“符合出厂条件”的原假设不能成立,因此 就拒绝原假设.所以产品不能出厂。上面的推理运用了“小概率原理”,可称为概率论的反证法,掌握这种思想方法是很重要的。小概率原理:概率很小的随机事件,(通常以 α<0.05的概率为小概率=在一次试验中是很难出现的.如果依据原假设H0,预计某事件出现的概率很小,而在一次试验中,某事件竟然出现了.则我们可以认为原假设 是不正确的,从而否定(拒绝)原假设。通常情况,将 α=0.05叫做检验标准或检验水平或显著性水平。 八、假设检验的基本思想 先假设所要检验的假设H0成立,在此前提下,根据给定的α值,使用样本构造概率不超过α的小概率事件.然后根据一次实验的结果,即样本观察值,看上述小概率事件在此次实验中是否发生,如果未发生,此时说假设H0与数据是相容的,简称H0是相容的,于是我们不否定H0,否则就否定H0,称α为检验水准或检验标准。 自由度表示独立的随机变量个数。 例如,如果已知n个数据的和等于m,则只要n-1个数据确定, 则第n个数据自然被确定了,所以在这n个数据中, 个数据是独立的随机变量.所以n个数据自由度为n-1。 如果您对本文有任何看法或者知识补充,欢迎在文章尾部留言参与讨论。 |
|