分享

离开统计学,质量管理就好比一条腿走路。

 rajamayun 2018-01-12


统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。在质量管理领域统计得到广泛应用,积善利他,现共享统计学在质量领域的应用给各位质量人。

一、直通率(FTY,RTY,TPY)及其相关概念

基本统计(Basic Statistic)


当今,我们在日常生活中不知不觉地使用统计学,跟统计学有着非常密切的关系。

q某批产品不良发生的概率

q为了预测棒球比赛的胜负,调查各队过去的胜率

q搞民意测验预测总统选举结果

q根据收集到的气象数据预测未来的天气

q报纸、广播的问卷调查




DiscreteDistributions  离散型分布

用于属性数据,即数据的取值为有限个数。

例)  硬币投3次,出现正面为0,1,2,3次的概率分别是?硬币投10次,出现正面为0,1,2,3,4,5,6,7,8,9,10次的概率分别是?

用于连续数据, 即数据取值为无限个。

假设一个过程的特性服从正态分布(m=50, s=15),那末生产的产品小于20的机会是多少?
设随机变量X的概率密度为

其中ms为常数,e=2.718,且s>0,则称X服从参数为m,s正态分布(Normal distribution),记为X∼N(m,s2)正态分布密度函数的图形见下图所示。


m= 0s =1的正态分布为标准正态分布

记为ZN(0,1),其密度函数和分布函数分别记为φ ( x) F ( x)


 设XN(m,s2),则


上式就称为正态分布的标准化变换


用Excel的函数功能:

函数分类:

统计

函数名:

NORMDIST

NORMDIST所计算出的概率为任何正态分布的样本值的左部概率


NORMDIST函数的语法规则:

格式: NORMDIST(  x,μ,σ, 逻辑值)

功能:当逻辑值为1时,返回正态分布的分布函数P{X≤x}的值;当逻辑值为0时,返回其密度函数值。

可用Excel的统计函数NORMSINV返回Za

语法规则如下:

格式:NORMSINV(1-a)

功能:返回Za的值。

说明: NORMSINV(a)返回的是Z1-a的值。

一、概率论的起源

概率论的研究始于意大利的文艺复兴时期,当时赌徒要求找到掷段子决定胜负的规则,曾向学者G.卡达诺(150l--1576)和著名的数学天文学家G.加利莱(15641642)求教;加利莱所写的一篇短文中,说明了概率的基本定律,从而为整个统计科学的发展奠定了理论基础。  

    在16与17世纪,机会对策(赌博)在富人中特别普遍,而且引进了更复杂的对策,包括更大的赌注,不同的对策需要一个合理的计算机会,当时这个问题成了一个非常重要的问题。一个法国知识分子C,梅勒也是一个狂热的赌徒,他曾向著名的数学家和哲学家B.帕斯卡尔(16231662)求教,帕斯卡尔的注意促成了帕斯卡尔与他的数学朋友的交往,特别是与P.弗曼特马(1601--16S5)的书信往来,就成为现代概率论与组合分析的起源。


二、假设检验的由来?

      本世纪初,一位爱尔兰吉尼斯啤酒厂的统计学家W.S.戈塞特(1876一1937),笔名Student,出版了许多篇关于解释抽样资料的文章。他是第一个认识到发展小样本方法以得出可靠信息的重要性的人。这种方法以后由R.A.Fisher(费雪)(1890一1962)及其同事在英国推广,费雪对统计科学作出了很大贡献,他开拓了试验理论,注意统计方法及其在科学研究领域中的应用。他引入了现在广泛应用的零假设一词(null hypothesis),并发展了方差分析的统计方法。

三、排列

Example:

四、二项分布(BinomialDistribution)



例)  硬币投3次,出现正面为0,1,2,3次的概率分别是? 硬币投10次,出现正面为0,1,2,3,4,5,6,7,8,9,10次的概率分别是?



二项试验的概率公式

对于一由n次试验组成的二项试验,令成功的概率为 p(不成功的概率

则为q = 1-p),则概率分布为:


五、泊松(Poisson)分布:

设随机变量的可能取值为0,1,2,...,且


则称服从参数为λ的泊松分布,其中λ表示一定时间或空间内事件发生次数的平均值,λ=np,n代表取样数,p代表发生事件的概率,x(或k)代表发生事件的次数,x(或k)可以取任何正整数,也可以取大于n的值,所以取N个样本,发生x个缺陷的概率通常可以用泊松分布来描述。

   泊松分布是概率论中重要分布之一。许多随机现象都可以用泊松分布来进行描述,如单位产品的缺陷数,电话总机在单位时间内收到的呼叫数,一个地区每月发生的事故数,物理学中热电子的发射个数等等都服从泊松分布。
六、泊松分布与二项分布

   p<0.1且n非常大时,二项分布可近似地用泊松分布代替。

N 越大, p值越小,两种分布就越接近




七、推断统计学



实例“

    某种产品按照规定,次品率不得超过4%才能出厂,从1000件产品中抽检10件,假设有4件次品,问这批产品能否出厂.

    解:假设产品次品率p=0.04,则抽捡10件产品中有4件次品的概率为:


先假设“符合出厂条件”,然后分析抽检结果,如果出现了在假设成立的条件下,竟发生了实际很难发生的事件.于是有理由认为“符合出厂条件”的原假设不能成立,因此  就拒绝原假设.所以产品不能出厂。上面的推理运用了“小概率原理”,可称为概率论的反证法,掌握这种思想方法是很重要的。小概率原理:概率很小的随机事件,(通常以  α<0.05的概率为小概率=在一次试验中是很难出现的.如果依据原假设H0,预计某事件出现的概率很小,而在一次试验中,某事件竟然出现了.则我们可以认为原假设   是不正确的,从而否定(拒绝)原假设。通常情况,将 α=0.05叫做检验标准或检验水平或显著性水平。

假设检验的基本思想

       先假设所要检验的假设H0成立,在此前提下,根据给定的α值,使用样本构造概率不超过α的小概率事件.然后根据一次实验的结果,即样本观察值,看上述小概率事件在此次实验中是否发生,如果未发生,此时说假设H0与数据是相容的,简称H0是相容的,于是我们不否定H0,否则就否定H0,称α为检验水准或检验标准。

  自由度表示独立的随机变量个数。

  例如,如果已知n个数据的和等于m,则只要n-1个数据确定,

则第n个数据自然被确定了,所以在这n个数据中,

个数据是独立的随机变量.所以n个数据自由度为n-1。


如果您对本文有任何看法或者知识补充,欢迎在文章尾部留言参与讨论。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多