分享

Minitab统计分析(下)

 留在家里 2017-12-29

相关链接:

Minitab统计分析(上)

Minitab统计分析(中)

相关与回归分析

相关分析与一元回归

1.相关分析及其实现

2.回归分析基本理论

3.标准的一元线性回归模型

4.一元线性回归模型的估计

5.一元线性回归模型的检验

6.一元线性回归模型的Minitab实现

7.一元线性回归模型预测

8.非线性回归简介

9.小组讨论与练习


本章目标

1. 了解并掌握相关分析的基本理论及应用

2.了解并掌握一元回归模型的理论

3.理解并掌握一元回归模型的估计方法

4.掌握一元回归模型的检验方法

5.了解一元回归模型的预测

6.学会用Minitab建立模型并用于预测

7.了解并熟悉非线性回归知识


相关分析及其实现

相关分析和回归分析是研究客观现象之间数量联系的重要统计方法,两者在有关现实经济和管理问题的定量分析中,具有广泛的应用价值。


测定两变量是否线性相关?


相关系数的检验:


案例实现


绘制散点图,观察其相关关系

散点图及关系表述

计算相关系数

变量选择及结果

回归分析基本理论

应用案例及变量分类

标准的一元线性回归模型

一元线性回归模型的估计


一元线性回归模型的检验

回归模型检验的种类

回归模型的检验包括理论意义检验,一级检验和二级检验。

理论意义检验

统计一级检验(统计学检验)

1.拟合程度的评价

2.回归模型的显著性检验

统计二级检验(经济计量型检验)


1.一元线性回归模型拟合优度的评价

2.一元线性回归模型的显著性检验

系数检验的方法选择

回归模型整体的F检验

绘制散点图:

弹出如下对话框:选择销售量资料C2进入因变量Y,广告费支出C1进入自变量X,点击OK将绘制Y与X的散点图。

散点图结果及意义

结果输出

结果输出(续)

一元线性回归模型预测

回归预测的置信区间

非线性回归简介

在许多场合,非线性回归函数比线性回归函数更能够正确地反映客观现象之间的相互关系。

非线性回归分析必须着重解决以下两个问题:

第一,如何确定非线性函数的具体形式。与线性回归分析的场合不同,非线性回归函数有多种多样的具体形式,需要根据所要研究的问题的性质并结合实际的样本观测值做出恰当的选择。

第二,如何估计函数中的参数。非线性回归分析最常用的方法仍然是最小二乘估计法,但需要根据函数的不同类型,作适当的处理。

常见的可线性化的曲线回归方程

常用的非线性函数的线性变换法

常用的非线性函数的线性变换法(续)

实际应用时要注意的问题

1.对于一些比较复杂的非线性函数,常常需要综合利用多种变换方法。

2.为了能够根据样本观测值,对通过变换得到的非线性回归方程式进行估计,该方程中的所有变量都不允许包含未知的参数。

3.严格地说,上述的各种线性变换方法只是适用于变量为非线性的函数。

4.经过变换后可能出现了多元线性的形式,我们在下一章将详细介绍其模型的建立方法。

非线性案例分析

例3.某超级连锁市场进行了一项实验,研究价格p(元)对一种家用白糖品牌每周需求y(公斤)的影响。以往这种产品的需求记录大致相等的8家超市参加了此项试验。有8种价格被随机指定给销售这种产品的商店并采用相同的广告措施,记录每家商店下一周内售出白糖的公斤数。

数据如下表所示:

数据及散点图绘制

图示为销售量与价格的散点图,从图中大致看出是呈现一种负相关的相关关系,近似直线,也象数学上用到的双曲线,但从经济角度出发,一般商品的销售量同销售价格呈现的是双曲线型的相关关系,所以我们需要用双曲线的形式拟合。

数据变换计算

变换过的数据及回归命令

选择变量及结果输出

结果输出(续)

结果分析与模型建立

回归分析的一般程序

小组讨论与练习

1.思考你自己的工作评价与哪些因素具有相关关系,分别呈现何种相关关系,你是否可以量化这种关系?

2.思考回归分析方法能在你的部门起什么作用?

3.结合本岗位的案例运用一元回归分析方法进行经济数据分析与预测。

练习题

炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,我们希望找出使用次数与增大的容积之间的关系,试验数据如下:

多元回归分析

1.多元线性回归分析基本理论

2.标准的多元线性回归模型

3.多元线性回归模型的估计

4. 多元线性回归模型的检验

5. 多元线性回归模型预测

6.多元线性回归模型的Minitab实现

7. 多元非线性回归

8.小组讨论与练习

本章目标

1.了解并掌握多元回归模型的理论

2.理解并掌握多元回归模型的估计方法

3.掌握多元回归模型的检验方法

4.了解多元回归模型的预测

5.学会用Minitab建立模型并用于预测

6.了解并熟悉多元非线性回归的基本形式及实现

多元线性回归分析的基本理论

多元线性回归是简单线性回归的推广,指的是多个因变量对多个自变量的回归(Multivariate  Regression),最常用的是一个因变量对多个自变量的回归。

见的管理决策问题:

销售量y与广告投入x1,销售人员数量x2,特定产品的价格x3,可支配的个人收入x4,各种投资x5,销售费用x6,食品店顾客数y与食品价格x1,座位数x2。

标准的多元线性回归模型

多元线性回归模型的性质

多元线性回归模型的估计

多元线性回归模型的检验

多元线性回归模型的显著性检验

多元线性回归模型的显著性检验(续一)

多元线性回归模型的显著性检验(续二)

多元线性回归模型预测

多元线性回归模型的Minitab实现

很多人在研究多元回归问题时可能感到比较复杂,下面我们用统计软件帮助大家实现多元线性回归模型的建立,估计,检验以及预测问题。

多元回归模型在建立过程中可采用两种不同的方法,分别为:

多元回归案例分析:

例1:在研究某超市顾客人数y与该超市促销费用x1,超市面积x2,超市位置x3之间关系时,选取变量如下:

y——某超市某一周六顾客人数(千人)

x1——该超市上周促销所花的费用(万元)

x2——该超市的面积(百平方米)

x3——超市所处位置(0表示市区,1表示郊区)

按照y变量排序后的原始数据是:

定性分析过程:

数据分析之前,我们要先考虑各个自变量与因变量之间是否存在相关关系。

分别绘制顾客人数y与促销费用x1,超市面积x2 的散点图,直观上测定其是否存在线性关系,散点图绘制过程上一章已介绍,在此不再赘述。

通过散点图可以看出,因变量y与自变量x1,x2 之间确实存在较明显的线性相关关系,而x3超市位置是虚拟二元变量,我们无法从散点图中看出其中的线性关系,但经验所知其一定影响着因变量y,所以我们同时将其纳入分析模型。

模型建立过程如下:

选择变量进入命令框:

弹出如下对话框,分别选择因变量到Response,选择影响变量到Predictors框中,以此分析促销费用x1,超市面积x2,超市位置x3对顾客人数y的影响。

输出结果

输出结果(续)

逐步回归实现:

多元非线性回归

多元非线性回归是一元非线性回归的多元扩展,其理论基础建立在多元回归与非线性回归的基础上。

在实际工作中,多元非线性回归的应用非常广泛,大多数生产函数和需求函数都需要用到多元非线性拟合,常用的有C—D生产函数,产品的需求弹性分析。

下面我们用需求弹性分析实例介绍此类模型的估计方法及结果处理解释。

案例分析:

例2:厂商想研究其产品销售量与居民月平均收入,商品价格之间的变化关系,现调查某城市有关此商品需求的数据如下:

试根据数据建立销售量y与居民人均收入x2及商品单价x3之间的关系。

数据变换分析

数据的初步变换

原数据与新产生数据列

对变换后的数据进行建模

计算结果

计算结果(续)

结果解释及预测分析:

由上式可知:居民收入的需求弹性约为1.16,而价格的需求弹性约为-0.4。也就是说,在其他情况不变的条件下,居民人均收入每增加1%会使此商品的需求增加1.16%,价格每提高1%会使此商品的需求减少0.4%。

若此时我们要预测居民人均收入为2200元,商品单价为50元时该商品的需求量y,只需将x2=22,x3=5代入方程即得:

小组讨论与练习:

1.思考多元回归分析方法能在你的部门起什么作用?

2.结合本岗位的案例运用多元回归分析方法进行经济数据分析与预测。

3.思考企业的产品与那些因素有关,分别呈现一种怎样的相关关系?

回归分析的Minitab实现--直接回归分析(Regression)

填入参数

输出结果之一

输出结果之二

结论:

由回归系数显著性检验的t值的大小及P值 0.000<><>

MSA测量系统分析

MSA的目的:

了解测量系统是否有足够的能力来侦测出产品或制程参数的变更。

MSA分析的对象:

只要控制计划当中所提出的测量系统就必须进行分析,包含产品特性,包含过程特性。

MSA分析方法的分类:

计量型MSA

计数型MSA

破坏性MSA

偏倚(Bias)

重复性(Repeatability)

再现性(Reproducibility)

稳定性(Stability)

线性(Linearity)

线性是在量具预期的工作范围内,偏倚是基准值的函数。

注:一般说来,当测量基准值较小时(量程较低的地方),测量偏倚会比较小;当测量基准值较大时(量程较低的地方),测量偏倚会比较大,线性就是要求这些偏倚量与其测量基准值呈线性关系。

线性(Linearity)

Case study(你喜欢什么类型仪器)

稳定性分析的做法

稳定性分析的做法

稳定性分析的做法

稳定性分析的做法

稳定性分析的做法

稳定性分析的做法

稳定性分析的做法

Minitab的做法

范例

稳定性分析输出

结果判定:

1.可以利用Xbar-R来评估其偏差程度。

2.可以利用Rbar/d2来评估其EV(重复性),用EV/TV(总变差)可以了解其相应的EV%。


偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏倚分析的做法

偏差练习

数据解析结果

将数据输入minitab

Select:Stat >Basic Statistics>1 Sample t

设定检定对象及检定值

绘图选检定直方图

置信区间选0.95

结果输出

图形输出

线性分析的做法

线性分析

线性示例

一名工厂主管希望对过程采用新测量系统,作为PPAP(先期质量策划)的一部份,需要评价测量系统的线性,基于已证明的过程变差,在测量系统操作量程内选择了五个零件。每个零件经过全尺寸检测测量以确定其基准值。然后由领班分别测量每个零件12次,研究中零件是被随机选择的。

示例

输入数据

Select:Stat>Regression>Regression

输入参数

结果输出

图形输出

判定:

图形分析显示特殊原因可能影响测量系统,基准值4数据显示可能是双峰。

即使不考虑基准值数据4,作图分析也清楚的显示出测量系统有线性问题。R2值指出线性模型对于数据是不适合的模型。即使模型可以接受,”偏倚=0”线与置信交叉而不是被包含其中。

此时,主管应该开始分析和解决测量系统的问题。因为数据分析不会提供任何其它的有价值的线索。然而,为确保所有书面文件都已作标记,主管还是计算了在此斜率和截距情况下的t统计量。

ta=-12.043;tb=10.158

采用默认值α=0.05,t表自由度(gm-2)=58和0.975的比率。主管得出临界值t(58,0.975)=2.00172。

因为ta>t(58,0.975),从作图分析获得的结果由数据分析得到增强─测量系统存在线性问题。

在此种情况下,因为有线性问题,tb与t(58,0.975)的关系如何无关紧要,引起线性问题可能的原因也可以在前面找到。

如果测量存在线性问题,需要通过调整软件,硬件或两项同时进行来再校准以达到0偏倚。

如果偏倚在测量范围内不能被调整到0,只要测量系统保持稳定,仍可用于产品/过程控制,但不能进行分析,直到测量系统达到稳定。

测量系统线性和偏倚分析

输入各项参数

R&R分析的做法

R&R分析

R&R练习1

输入各项参数

图形结果

选择ANOVA分析

ANOVA分析结果

ANOVA分析图形输出

R&R练习2

输入各项参数

注:Minitab对嵌套式数据只用方差分析法

得到结果

图形结果

测量系统趋势图

输入各项参数

图形结果

计数型MSA

计数型风险分析法的做法

计数型风险分析法的做法

风险分析法范例

输入各项参数

结果输出



破坏性MSA

破坏性MSA的分析

此项分析有其先天性的限制,所以我们必须有以下的前提,我们有一些的标准样品,这些样品不会随时间而变化。另外这些标准样品其本身的平均值和变异我们已事先知道,所以在此前提下我们才能进行破坏型MSA的分析。

破坏性MSA的分析方法

破坏性MSA的分析方法

范例:

今有一台硬度计,其配予了一片的标准片,但由于硬度计是破坏性试验,所以被测过的地方是不能再测的。

在购买标准硬度片时,厂商提供的数据如下:

标准值:75

标准差:1

今测试了三十次标准样本的数据如下:

填入参数

结果输出

结果输出(续)

DOE

试验设计

简单的试验设计技术

1.试验设计DOE  

2.单因素试验设计 

3.多因素试验设计 

4.因素轮换法 

5.随机试验法

6.小组讨论与练习 

本章目标

1.了解试验设计的思想和作用

2.明确不同试验设计方法的适用场合

3.掌握常用的单因素设计方法

4.了解多因素试验设计方法的特点

5.学会使用随机试验设计方法

试验设计DOE

1.试验设计的作用。

2.寻找和验证影响过程的主要因素。

3.优化因素的取值,找出因素的最佳水平搭配。

4.提高过程和产品的质量,实现6σ管理。

5.提高过程和产品的稳定性,减少受环境的影响。

6.提高产品的可靠性,延长产品的使用寿命。

7.减少不必要的工艺和材料,降低生产成本,缩短生产周期。

8.通过提高产品的设计质量,减小对检验的依赖。

试验设计DOE(续1)

试验设计DOE(续2)

单因素试验设计

单因素试验设计(续1)

单因素试验设计(续2)

单因素试验设计(续3)

单因素试验设计(续4)

单因素试验设计(续5)

均分法属于整体设计,在试验前就把全部试验设计好。如果试验设备和其他的资源条件允许,就可以同时进行试验,这样从试验时间上来说是最节省的。如果试验可以同时进行,并且每个试验的费用很低而试验时间较长,就适合于采用均分法。

等分法,0.618法,菲波那契数法都属于序贯试验法,需要在一次试验结束后才能安排下一个试验,试验周期是每次试验的叠加。这样就必然需要较长的试验时间,适合于每个试验的时间较短但是费用比较高的场合。

很多情况下需要综合考虑试验费用和试验时间,如果试验的费用不很高,并且试验设备和其他的资源条件允许,就可以使用分批试验法,以多做几次试验为代价而缩短试验的周期。

单因素试验设计(续6)

多因素试验设计

生产过程是复杂的,影响过程输出的因素往往不是单一的,需要考虑多个因素对试验指标的共同影响,这时就需要采用多因素试验设计。在多因素试验设计中,合理地选择试验因素和水平是关系到试验能否成功的关键,下列的注意事项和建议对使用多因素试验设计是重要的:

1.因素数目要适中,不要过多或过少。

2.试验的范围应当尽可能大一些。

3.因素的水平数要尽量多一些。

4.水平的间隔要适当分开。

多因素试验设计(续)

因素轮换法

因素轮换法(续)

因素轮换法的缺点:

1.当因素间存在交互作用时因素轮换法的效果就会较差。

2.不利于对试验数据的深入分析。

3.属于序贯试验法,试验的周期长。

4.试验的效果往往与试验的起始点有关。

随机试验法

随机试验法(续1)

随机试验法(续2)

小组讨论与练习:

思考题

1.说明试验设计的意义和实施流程。

2.谈谈单因素试验设计的方法。

3.多因素试验设计的特点是什么?

4.谈谈你对随机试验设计的认识。

练习题

1.在一定范围内钢的强度y(MPa)是碳含量x(%)的单调增加函数,光盘第4章的数据文件中给出了碳含量x取值在[0.01,0.50]范围内钢的强度数值。试验是有一定误差的,所以试验的数据并不是严格的递增数列。现在假设我们事先并不知道这些试验结果,希望用试验设计方法找到使钢的强度达到500以上的最低碳含量值,给出一种解决这个问题的试验设计方法,用光盘中给出的数据实施这项试验设计。

2.结合自己的工作找出一项可以用单因素试验设计解决的问题,给出设计方案,并争取得到实施。

稳健设计:

1.平均水平与稳健性 

2.稳健设计的思想

3.稳健设计的实施方法

4.损失函数与信噪比

5.灵敏度设计

6.多变量图

7.小组讨论与练习

本章目标:

1.明确稳健性的意义

2.理解稳健设计的思想

3.了解稳健设计的基本方法

4.了解损信噪比和灵敏度的含义和作用

5.学会使用简单灵活的稳健设计方法

平均水平与稳健性:

产品质量的两个衡量标准

第一是产品的平均水平

第二是产品的稳健性.

平均水平与稳健性(续1)

稳健性(robustness)就是指产品的质量变异程度

1.变异程度小的产品稳健性就高

2.变异程度大的产品稳健性就低

引起质量变异的因素称为噪声,有三种形式

1.外部噪声

2.零件间噪声

3.内部噪声

稳健设计的思想

稳健设计(robust design)就是用试验设计提高产品稳健性的方法,是6σ管理的重要组成部分,也是一种当今世界上发达国家深入研究和广泛应用的提高产品开发设计质量的重要新技术。

从20世纪70年代末期开始,日本学者田口玄一(G.Taguchi)博士创立了以三次设计法为内容的质量工程学,其中的主要内容就是稳健设计。

近些年来稳健设计方法不断发展和完善,在传统的稳健设计方法中又注入了许多新的内容,逐渐形成近代的稳健设计方法,并在学术界和工程界引起了广泛的重视和兴趣。目前,在美国把所有用于提高和改进产品质量的有关工程方法统称为稳健设计。

稳健设计的思想(续1)

稳健设计的思想(续2)


稳健设计的思想(续3)

减小产品质量的变异性有两种方式:

一种是消极的方式,也就是限制产品的使用环境,使用更高等级的元件。

另一种是积极的方式,就是提高产品适应外部环境变化和抵抗内部干扰的能力。

稳健性设计的思想不是去控制波动源改变外在环境,而是致力于改进产品内部的结构以提高抗干扰的能力。

稳健设计的实施方法

稳健设计的实施方法(续1)

稳健性设计的试验指标要尽可能选择为计量(连续)型的指标,不用或少用不合格品率等属性指标。

 用不合格品率作为试验指标的缺点

1.需要做大量的试验

2.不适合于分析试验指标和影响因素间的数量联系

3.容易对质量改进产生误导。导致试验失败

稳健设计的实施方法(续2)

稳健设计的实施方法(续3)

损失函数与信噪比

假如产品的质量目标值为m,产品质量特性的实际值记为y,当y≠m时就认为会对社会造成损失,两者的差异越大损失也就越大。常用平方损失函数表示这种损失关系:

损失函数与信噪比(续1)

损失函数与信噪比(续2)

损失函数与信噪比(续3)

灵敏度设计

灵敏度设计(续1)

多 变 量 图

多 变 量 图(续1)

1.产品的质量用多个相关的指标衡量

2.用于发现质量随时间,位置等因素的变化

3.在不同的时间或位置抽取产品检测

4.可以在生产现场抽样检测

5.只需要较小的样本量

6.小组讨论与练习

思考题:

1.解释稳健性的概念,说明稳健设计的思想和意义

2.谈谈稳健设计的方法

3.结合你对稳健设计的了解

4.谈谈稳健的作用

练习题:

1.一种电器的功率与电路电压和电器阻值的关系是P=U2/R,功率P的目标值是0.5 W,电路的电压U有1.5,3.0,4.5,6.0(V)这4种水平选择。为了达到功率的目标值是0.5W,电压U和电阻R(单位Ω)之间可以有4种搭配方式(1.5,4.5),(3.0,18.0),(4.5,40.5),(6.0,72.0),在电压U的1.5,3.0,4.5,6.0(V)这四种水平下分别会有±0.1,±0.14,±0.17,±0.20(V)的波动,在电阻R的每种水平下实际会有10%的波动。问应该选择电压U和电阻R的哪一种搭配方式才能使电器的功率最稳定。

2.结合你的工作找出一个稳健设计的问题,用所学的方法解决这个问题。

……完……


ouryao-com·因为有你



近期培训

近期热门培训课程请点击下面蓝色课题链接阅读原


20181 18日至 20日在武汉市举办“原料药、药用辅料和药包材关联审评解析及应用实施专题培训班”


2018119日至 21日在杭州市举办“原料药、药用辅料和药包材关联审评解析及应用实施专题培训班”

【福州市】2017CFDA最新注册法规变化专题培训班”的通知主讲老师:张哲峰、陈洪博士、叶祖光、蔡荣老师’


2018114-16日在成都市举办“新法规环境下药品研发质量体系的建立与实施和操作高级经理人”高级研修班。


2018112 -14 日在上海市举办“2018国内新药研发、创新质量体系建立及如何应对新法规变化研修班”


李永康201814-6日杭州市“如何治理已发生的数据可靠性问题暨数据可靠性管理高级培训提升班”


2018119-21日成都市“化学原料药生产工艺中试放大与技术转移研究与实施”


【谢沐峰】于2018111-13日在南京市举办“药品研发质量分析研究实践过程关键点解析”专题研修班


2018118-20日在杭州市举办2018第四届全国化工结晶大会暨第四届蒸发结晶关键技术研究与工艺设备优化设计实践应用研讨会


电话咨询 李老师 13641150050 (微信同号

QQ咨询  2736812589

望药届的朋友帮忙转发 谢谢大家!

组团统一找李老师报名可享受会员价优惠!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多