配色: 字号:
统计学培训教程 Excel在统计中的应用演示
2022-02-24 | 阅:  转:  |  分享 
  
3.输入样本数据,和用户指定的置信水平0.95,如图附-13所示。4.为样本数据命名。选定D1:D11单元格,选择“插入”菜单的“
名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,最后得到图附-14所示的计算结果。图附-13(三
)结果说明:以上例子说明如何交叉组合使用Excel的公式和函数,以构造出一个能实现样本推断总体有关计算的Excel工作表。实际上
,在用Excel进行数据统计处理之时,许多统计功能可以使用和上例类似的方法,通过组合使用Excel的各类统计函数和公式加以实现。
图附-14五、假设检验(一)简介:假设检验是统计推断中的重要内容。以下例子利用Excel的正态分布函数NORM
SDIST、判断函数IF等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel工作表。(二)操作步骤:
1.构造工作表。如图附-15所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。图附
-152.将A列的名称定义成为B列各个公式计算结果的变量名。选定A3:B4,A6:B8,A10:A11,A13:A15和A
17:B19单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。3.
输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图附-16所示。图附-164.为样本数据指定名称。选定C1
:C11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,最后得到如图附-1
6中所示的计算结果。(三)结果说明:如图附-16所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho假设。所以,根据样本的计
算结果,在5%的显著水平之下,拒绝总体均值为35的假设。同时由单侧显著水平的计算结果还可以看出:在总体均值是35的假设之下,样本均
值小于等于31.4的概率仅为0.020303562<0.05,小概率事件居然发生,所以,同样得出在5%的显著水平下,拒绝总体均值为
35的假设的结论。六、单因素方差分析(一)简介:单因素方差分析可用于检验两个或两个以上的总体均值相等的假设是否成立。此方法
是对双均值检验(如t-检验)的扩充。该检验假定总体是服从正太分布的,总体方差是相等的,并且随机样本是独立的。这种工具适用于完全随
机化试验的结果分析。例子如图附-17表中所示,一产品制造商雇佣销售人员向销售商打电话。制造商想比较四种不同电话频率计划的效率,他从
销售人员中随机选出32名,将他们随机分配到4种计划中,在一段时期内记录他们的销售情况已经在表中列出,试问其中是否有一种计划会带来较
高的销售水平。图附-17(二)操作步骤1.选择“工具”菜单的“数据分析”子菜单,双击“方差分析:单因素
方差分析”选项,弹出单因素方差分析对话框。2.按图附-18所示方式填写对话框。然后单击“确定”按扭即可。图附
-18(三)结果分析:按照如上的操作步骤即可得到图附-19的计算结果。其中表格的第二部分则是方差分析的结果。SS列分别
给出了四个分组的组间方差、组内方差以及总方差,DF列分别给出了对应方差的自由度,MS列是平均值方差,由SS除于DF得到,它是总体
方差的两个估计值。F列是F统计量的计算结果,如果四个总体均值相等的假设成立的化,它应该服从F分布,即近似为1,它是最终的计算结果,
通过将它与一定置信水平下的F临界值Fcrit比较,可以判断均值相等的假设是否成立,在本例中,1.67761<2.94668,所
以不能拒绝四个总体均值相等的假设。P-value列,是单尾概率值,表明如果四个总体均值相等的假设成立的化,得到如上样本结果的概率是
19.442%,即得到以上样本并不是小概率事件,同样也得到不能拒绝四个总体均值相等的假设的结论。按
相似方法可进行无重复双因素方差分析,有重复双因素方差分析。图附-19七、线性回归分析(一)简介:线性回归分析通过
使用“最小二乘法”对样本数据进行直线拟合,用于分析单个因变量是如何受一个或几个自变量影响的。例子如图附-20所示,表中是我国198
7年至1997年的布匹人均产量和人均纱产量,试用线性回归分析的方法分析两组数据之间的关系。图附-20(二)操作步骤
1.选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。对话框主要选项的含义如下:Y值输入区域,在
此输入因变量数据区域,该区域必须由单列数据组成;X值输入区域,在此输入对自变量数据区域,自变量的个数最多为16;置信度,如果需要
在汇总输出表中包含附加的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度,95%为默认值;常数为零,如果要强
制回归线通过原点,则选中此复选框;输出区域,在此输入输出表左上角单元格的地址,用于控制计算结果的输出位置。汇总输出表至少需要有七列
的宽度,包含的内容有anova表、系数、y估计值的标准误差、r2值、观察值个数,以及系数的标准误差;新工作表,单击此选项,可
在当前工作簿中插入新工作表,并由新工作表的A1单元格开始显示计算结果,如果需要给新工作表命名,则在右侧的编辑框中键入名称;新工
作簿,单击此选项,可创建一新工作簿,并在新工作簿中的新工作表中显示计算结果;残差,如果需要以残差输出表的形式查看残差,则选中此复选
框;标准残差,如果需要在残差输出表中包含标准残差,则选中此复选框;残差图,如果需要生成一张图表,绘制每个自变量及其残差,则选中此复
选框;线形拟合图,如果需要为预测值和观察值生成一个图表,则选中此复选框;正态概率图,如果需要绘制正态概率图,则选中此复选框。
2.按如下方式填写对话框:X值输入区域为$B$1:$B$12,Y值输入区域为$C$1:$
C$12,并选择“标志”和“线性拟合图”两个复选框,然后单击“确定”按扭即可。(三)结果分析按照如上的操作
步骤即可得到图附-21下表的计算结果。结果可以分为四个部分,第一部分是回归统计的结果包括多元相关系数、可决系数R2、调整之后的相关
系数、回归标准差以及样本个数。第二部分是方差分析的结果包括可解释的离差、残差、总离差和它们的自由度以及由此计算出的F统计量和相应的
显著水平。第三部分是回归方程的截距和斜率的估计值以及它们的估计标准误差、t统计量大小双边拖尾概率值、以及估计值的上下界。根据这部分
的结果可知回归方程为Y=8.46433X-18.288。第四部分是样本散点图,其中蓝色的点是样本的真实散点图,红色的点是根
据回归方程进行样本历史模拟的散点。如果觉得散点图不够清晰可以用鼠标拖动图形的边界达到控制图形大小的目的。用相同的方法可以进行多元线
性方程的参数估计,还可以在自变量中引入虚拟变量以增加方程的拟合程度。对于非线性的方程的参数估计,可以在进行样本数据的线性化处理之后
,再按以上步骤进行参数估计。图附-21八、相关系数分析(一)简介:使用“相关系数”分析工具来确定两个区域中数据的变化是
否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(
负相关);还是两个集合中的数据互不相关(相关性为零)。(二)操作步骤:采用图附-3表中的数据,可按如下步骤计算变量x,y,z之间
的相关系数。1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单
,用鼠标双击数据分析工具中的“相关系数”选项。3.填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相
关系数矩阵,结果如图附-22所示。(三)结果说明:以上下三角矩阵计算出三个变量x,y,z两两之间的相关系数,如变量x,y之间
的相关系数为:0.929,所以可以判断x,y之间存在着较高的正线性相关关系。图附-22九、季节变动时间序列的分解分析
(一)简介:分解分析法是时间序列分析和预测过程中常用的统计方法。该方法假设时间序列是趋势变动(T)、循环变动(C)、随机变动(
I)综合影响的结果,分解过程首先从原始序列中消除随机变动,然后在此基础上,分别识别出循环变动和趋势变动的变化模式。假设的合理性、方
法的科学性和操作的简易性使分解分析法在经济预测中得到了较为广泛的应用。下面结合具体例子介绍在Excel中如何实现时间序列的分解分析
。如图附-23所示,表中A1至B13单元格是1996至1998年各季度某海滨城市旅游人口数(千人),试预测1999年各季度旅游人口
数。(二)操作步骤:1.计算一次移动平均,消除随机波动。在C3单元格填入公式“=AVERAGE(B2:B
5)”,然后用“填充柄”将公式复制到C4:C11单元格。2.中心化移动平均数。在D4单元格输入公式“=AVE
RAGE(C3:C4)”,再用“填充柄”将公式复制到D5:D11单元格。3.计算季节指数。在E4单元格输入公
式“=B4/D4”,然后用“填充柄”将公式复制到E5:E11单元格。4.计算平均季节指数。在F4单元格中输入公式“=AVE
RAGE(E4,E8)”,然后用“填充柄”将公式复制到F5:F7单元格。图附-235.计算调整后的季节指数。为了让季节
指数的总平均为1,必须对季节指数加以调整。先在G4单元格中输入公式“=F4/AVERAGE($F$4:$F$7)”,再用“填充柄
”将公式复制到G5:G7单元格。此时,G4:G7就是最终计算出的四个标准化之后季节指数,的季节指数,它反映的是原始时间序列中的循环
变动。然后,根据G4:G7单元格数值,将四个季节指数分别填充到G2:G13的其它对应季节的空白单元格内,供下一步计算使用。6.
消除旅游人数序列中的季节变动。在H2单元格中输入公式“=B2/G2”,然后将公式复制到H3:H13单元格。此时,H列就是消除季节
变动之后的旅游人数时间序列。图附-247.对消除季节变动的旅游人数进行回归分析。在I列填入时间序号1至15。选择“工具”菜
单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。按图附-24所示的方式填写对话框。然后单击“确定”按扭,即可得到剔
除了季节波动的时间序列的线性趋势模型。线性模型估计结果如图附-25所示,其中B35单元格是线性趋势模型的截距,B36单元格是斜率。
图附-258.预测。在G14:G17单元格中分别填入刚才计算出的四个调整后的季节指数,在B14单元格中输入公式“=($B
$35+I14$B$36)G14”,其中“($B$35+I14$B$36)”只是趋势变动的预测结果,乘以G14(季节指数)
后,则反映的是趋势变动和季节循环变动叠加之后的预测结果。然后利将此公式复制到B15:B17单元格,B14:B17单元格中就是199
9年各个季度旅游人数的预测值,如图附-26所示。图附-26(三)结果分析:以上步骤完成了整个季节时间序列的分析和预测过程。
使用了分解分析的方法,能将时间数列的各个影响因数都分解出来,由这种方法得到的预测模型和预测结果都比直接对时间序列使用回归分析要更为
可靠合理。读者可以参考以上分析步骤,用类似的方法在Excel中进行月份时间序列、双循环变动时间序列等的分解分析和预测。Exce
l在描述统计中的应用前言一、描述统计工具二.直方图工具三、利用Excel绘制散点图四、数据透视表
工具五、排位与百分比工具前言在使用Excel进行数据分析时,要经常使用到Excel中一些
函数和数据分析工具。其中,函数是Excel预定义的内置公式。它可以接受被称为参数的特定数值,按函数的内置语法结构进行特定计算,最后
返回一定的函数运算结果。例如,SUM函数可对单元格或单元格区域执行相加运算。函数的语法以函数名称开始,后面分别是左圆括号、以逗号
隔开的参数和右圆括号。参数可以是数字、文本、形如TRUE或FALSE的逻辑值、数组、形如#N/A的错误值,或单元格地址
。给定的参数必须能产生有效的值。参数也可以是常量、公式或其它函数。Excel还提供了一组数据分析工具,
称为“分析工具库”,在建立复杂的统计分析时,使用现成的数据分析工具,可以节省很多时间。只需为每一个分析工具提供必要的数据和参数,该
工具就会使用适宜的统计或数学函数,在输出表格中显示相应的结果。其中的一些工具在生成输出表格时还能同时产生图表。要浏览已有的分析工具
,可以单击“工具”菜单中的“数据分析”命令。如果“数据分析”命令没有出现在“工具”菜单上,则必须运行“安装”程序来加载“分析工具库
”,安装完毕之后,再通过“工具”菜单中的“加载宏”命令,在“加载宏”对话框中选择并启动它。一、描述统计工具(一)简介:
此分析工具用于对输入区域中数据的单变量分析,并提供数据趋中性和易变性等有关信息。(二)操作步骤:1.用鼠标
点击工作表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单,用鼠标双击数据分析工具中的“描述统计”选
项。3.出现“描述统计”对话框,对话框内各选项的含义如下:输入区域:在此输入待分析数据
区域的单元格范围。一般情况下Excel会自动根据当前单元格确定待分析数据区域。分组方式:如果需要指出
输入区域中的数据是按行还是按列排列,则单击“行”或“列”,“描述统计”工具可以同时对多列或多行数据进行统计分析。标志
位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选
中“标志位于第一列”复选框;如果输入区域没有标志项,则不需要选择该复选框,Excel将在输出表中生成适宜的数据标志。
输出区域:在此框中可填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。整个输出结果分为两列,左边一列
包含统计标志项,右边一列包含统计值。根据所选择的“分组方式”选项的不同,Excel将为输入表中的每一行或每一列生成一个两列的统计
表。新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始存放计算结果。
如果需要给新工作表命名,则在右侧编辑框中键入名称。新工作簿:单击此选项,可创建一新工作簿,并在新工作簿
的新工作表中存放计算结果。汇总统计:指定输出表中生成下列统计结果,则选中此复选框。这些统计结果有:平均
值、标准误差、中值、众数、标准偏差、方差、峰值、偏斜度、极差(全距)最小值、最大值、总和、样本个数。均值
置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,若置信度95
%计算出的总体样本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为(-10,+10)。
第K个最大/小值:如果需要输出每个区域的数据的第k个最大或最小值,则选中此复选框。然后在右侧的编辑框中,输入k的数
值。5.填写完“描述统计”对话框之后,按“确定”按扭即可。(三)结果说明:描
述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值(),标准误差(),组中值(Medium),众数(Mode),
样本标准差(S),样本方差(S2),峰度值,偏度值,极差(Max-Min),最小值(Min),最大值(Max),样本总和,样本
个数(n)和一定显著水平下总体均值的置信区间。二.直方图工具(一)简介:直方图工具,用于计算
数据的个别和累积频率,再根据有限集中某个数值元素的出现次数建立图表。例如,在一个有50名学生的班级里,可以通过直方图确定考试成
绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区
域”框中。(二)操作步骤:1.用鼠标点击表中待分析数据的任一单元格。
2.选择“工具”菜单的“数据分析”子菜单。用鼠标双击数据分析工具中的“直方图”选项。3.出现“直方图
”对话框,对话框内主要选项的含义如下:输入区域:在此输入待分析数据区域的单元格范围。
接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只
要存在的话,Excel将统计在各个相邻边界直之间的数据出现的次数。如果省略此处的接收区域,Excel将在数据组的最小值和最大值
之间创建一组平滑分布的接收区间。标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如
果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。输出区域:在此输
入结果输出表的左上角单元格的地址用于控制计算结果的显示位置。如果输出表将覆盖已有的数据,Excel会自动确定输出区域的大小并显示
信息。柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel
将只按升序来排列数据。累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直
方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。图表输出:选中此复选框,可以在输出表
中同时生成一个嵌入式直方图表。4.按需要填写完“直方图”对话框之后,按“确定”按扭即可。
(三)结果说明:完整的结果包括三列数据和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分
布的累积百分比。三、利用Excel绘制散点图(一)简介:散点图是观察两个变量之间关系程度最为直观的工具之一,利用
Excel的图表向导,可以非常方便的创建并且改进一个散点图,也可以在一个图表中同时显示两个以上变量之间的散点图。(二)操
作步骤:如图附-3所示数据,可按如下步骤建立变量x-y,x-z的散点图:图附-31.拖动鼠标选定数值区域A2:
C12,不包括数据上面的标志项。2.选择“插入”菜单的“图表”子菜单,进入图表向导。3.选择“图表类型”为
“散点图”,然后单击“下一步”。4.确定用于制作图表的数据区。Excel将自动把第1步所选定的数据区的地址放入图表数
据区的内。5.在此例之中,需要建立两个系列的散点图,一个是x-y系列的散点图,一个是x-z系列的散点图,因此,必须单击
“系列”标签,确认系列1的“X值”方框与“数值方框”分别输入了x,y数值的范围,在系列2的“X值”方框与“数值方框”分别输入了x,
z数值的范围。在此例中,这些都是Excel已经默认的范围,所以,通常情况下,直接单击“下一步”即可。6.填写图表标
题为“X-Y与X-Z散点图”,X轴坐标名称为“X”与Y轴坐标名称“Y/Z”,然后单击“下一步”。7.选择图表输
出的位置,然后单击“完成”按扭即生成图附-4的图表。(三)结果说明:如图附-4所示,Excel中可同时生成两个序列的散点图,并
分为两种颜色显示。通过散点图可观察出两个变量的关系,为变量之间建立数学模型作准备。图附-4四、数据透视表工具(
一)简介:数据透视表是Excel中强有力的数据列表分析工具。它不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作双变量数据
的交叉频数分析、总和分析和其它统计量的分析。(二)操作步骤:如图附-5所示,表中列出学生两门功课评定结果,图附-5
可按如下步骤建立交叉频数表:1.选中图附-5中表格中有数据的任一单元格,然后选择“数据”菜单的“数据透视表”子菜
单,进入数据透视表向导。2.选择“MicrosoftExcel数据清单或数据库”为数据源。单击“下一步”。
3.选择待分析的数据的区域,一般情况下Excel会自动根据当前单元格确定待分析数据区域,因此你只要直接单击“下一步”按
扭即可。4.确定数据透视表的结构,在此例中,要建立的是一个交叉频数表,分别按语文和数学的成绩对学生的人数进行交叉
频数分析,因此可按图附-6将三个按扭“学号”、“语文”、“数学”分别拖放到表格的指定部位,并且双击“求和项:学号”,将其改为记数
项,结果如图附-6所示,然后单击“下一步”按扭。5.选择数据透视表的显示位置之后,单击“完成按扭”,可出现如图附-7所示的数
据透视表。图附-6(三)结果说明:如图附-7的结果所示,数据透视表可以作为一个交叉频数分析工具。完成数据透视表之后,可按
需要修改数据表的显示格式。例如,如果想要把表格中的频数替换成为百分比数。可以用鼠标右击频数的任一单元格,选择“字段”子菜单,单击“
选项”按扭,将“数据显示方式”替换成为“占总和的百分比”,然后单击“确定”按扭即可。按同样方式,可将数据透视表修改成为其它不同
样式。图附-7五、排位与百分比工具(一)简介:此分析工具可以产生一个数据列表,在其中罗列给定数据集中各个数值的
大小次序排位和相应的百分比排位。用来分析数据集中各数值间的相互位置关系。(二)操作步骤:
1.用鼠标点击表中待分析数据的任一单元格。2.选择“工具”菜单的“数据分析”子菜单,用鼠标双击
数据分析工具中的“排位与百分比”选项。3.填写完“排位与百分比”对话框,单击“确定”按扭即可。
(三)结果说明:输出的结果可分为四列,第一列“点”是数值原来的存放位置,第二列是相应的数值,第三列是数值的排序号,第四列是
数值的百分比排位,它的计算方法是:小于该数值的数值个数/(数值总个数-1)。?第四节Excel在推断统计中的应用一
、二项分布工具二、其它几种主要分布的函数三、随机抽样工具四、样本推断总体五、假设检验六、单因素方差分析七、
线性回归分析八、相关系数分析九、季节变动时间序列的分解分析一、二项分布工具(一)简介:在Excel中想要
计算二项分布的概率值、累积概率,需要利用Excel的工作表函数BINOMDIST。函数BINOMDIST适用于固定次数的独立实
验,实验的结果只包含成功或失败二种情况,且每次实验成功的概率固定不变。例如,已知次品概率的情况下,函数BINOMDIST可以计算
抽查10个样品中发现2个次品的概率。以下例子说明如何在Excel中计算二项分布的概率值,以及如何进一步建立二项分布图表。
(二)操作步骤:例子如下所示,一个推销员打了六个电话,推销成功的概率是0.3,那么可以按以下步骤建立推销成功次数的概率分布图表。
1、如图附-8所示,先在Excel之下建立好概率分布表格的框架。图附-82、如图附-9所示,先在B7至F7单元格分别输
入概率计算公式。图附-93、公式的拷贝。选取B7至F7单元格,然后移动鼠标至F7单元格的右下角,使其成为黑色实心
十字星状,一般称之为“填充柄”,拖动“填充柄”至F13单元格即可完成公式的拷贝操作。结果图附-10所示。图附-10
4.下面开始创建二项分布图表。选取B7至B13单元格,选取“插入”菜单的“图表”子菜单。5.选择“柱状图”
,然后单击“下一步”。6.单击“系列”标签,单击“分类(X)轴标志”框,并用鼠标选取A7至A13单元格为图表
X轴的轴标,然后单击“下一步”。7.分别键入图表名称“二项分布图”,X轴名称“成功次数”,Y轴名称“成功
概率”,单击“完成”按扭即可生成二项分布图表。(三)结果说明:如图附-10所示,利用Excel的BINOMDIST的
函数可以计算出二项分布的概率以及累积概率。BINOMDIST函数可以带四个参数,各参数的含义分别是:实验成功的次数,实验的总次数,
每次实验中成功的概率,是否计算累积概率。第四个参数是一个逻辑值,如果为TRUE,函数BINOMDIST计算累积分布函数概率值,
如果为FALSE,计算概率密度函数概率值。?二、其它几种主要分布的函数(一)函数CRITBINOM:
1.说明:函数CRITBINOM可称为BINOMDIST的逆向函数,它计算出使累积二项式分布概率P(X<=
x)大于等于临界概率值的最小值。2.语法:CRITBINOM(trials,probability_s,
alpha)Trials:贝努利实验次数。
Probability_s:一次试验中成功的概率。Alpha:
临界概率。3.举例:CRITBINOM(6,0.5,0.75)等于4,表明如果每次试验成功的概率
为0.5,那么6次试验中成功的次数小于等于4的概率恰好超过或等于0.75。(二)函数HYPGEOMDIST:
1.说明:函数HYPGEOMDIST计算超几何分布。给定样本容量、总体容量和样本总体中成功的次数,函数HYPGEOMDIST
计算出样本取得给定成功次数的概率。使用该函数可以解决有限总体的问题,其中每个观察值只有两种取值,或者为成功或者为失败,且给定样本区
间的所有子集有相等的发生概率。2.语法:HYPGEOMDIST(sample_s,number_sample,po
pulation_s,number_population)Sample_s:
样本中成功的次数。Number_sample:样本容量。
Population_s:样本总体中成功的次数。Numbe
r_population:样本总体的容量。3.举例:容器里有20块巧克力,8块是焦糖的,其余12块是果仁
的。如果从中随机选出4块,下面函数计算式计算出只有一块是焦糖巧克力的概率:HYPGEOMDIST(1,4,8,20)=0.3
63261。(三)函数POISSON:1.说明:函数POISSON计算泊
松分布。泊松分布通常用于预测一段时间内事件发生指定次数的概率,比如一分钟内通过收费站的轿车的数量为n的概率。
2.语法:POISSON(x,mean,cumulative)X:
事件数。Mean:期望值。Cumul
ative:为一逻辑值,确定计算出的概率分布形式。如果cumulative为TRUE,函数POISSON计算
出累积分布函数概率值,即,随机事件发生的次数在0和x之间(包含0和1);如果为FALSE,则计算概率密度函数,即,
随机事件发生的次数恰好为x。3.举例:POISSON(2,5,FALSE)=0.084224
表明,若某一收费站每分种通过的轿车平均数量为5辆,那么某一分钟通只2辆的概率为0.084224。(四)正态分布函数N
ORMDIST:1.说明:正态分布在模拟现实世界过程和描述随机样本平均值的不确定度时有广泛的用途。函数NORMDIS
T计算给定平均值和标准偏差的正态分布的累积函数概率值。同样可以用类似“七”中的方法,利用NORMDIST函数建立正态分布密度函数
图,这里不再赘述。2.语法:NORMDIST(x,mean,standard_dev,cumulative)
X:为需要计算其分布的数值。
Mean:分布的算术平均值。Standard_de
v:分布的标准偏差。Cumulative:为一逻辑值,指明函数的形式。如果cumula
tive为TRUE,函数NORMDIST计算累积分布函数;如果为FALSE,计算概率密度函数。
3.举例:公式NORMDIST(6,5,2,0)计算出平均值为5、标准差为2的正态函数当X=6时概率密度函数的数值,公式NORM
DIST(60,50,4,1)计算出平均值为50、标准差为4的正态分布函数当X=60时累积分布函数的数值。(五)函数NORM
SDIST:1.说明:函数NORMSDIST计算标准正态分布的累积函数。2.语法:NORMSDIST
(z)Z为需要计算其分布的数值。3.举例:NORMSDIS
T(0)=0.5,表明若x服从标准正态分布,那么x<0的概率为50%(六)函数NORMSINV:1.说明:函数
NORMSINV计算标准正态分布累积函数的逆函数。2.语法:NORMSINV(probability)
Probability:正态分布的概率值。3.举例:NORMSINV(0.
5)=0(七)t分布函数TDIST:1.说明:函数TDIST计算student的t分布数值。T分布用于小样本
数据集合的假设检验。使用此函数可以代替t分布的临界值表。2.语法:TDIST(x,degrees_freedo
m,tails)X:为需要计算分布的数字。
Degrees_freedom:为表示自由度的整数。Tails:指明计算的分
布函数是单尾分布还是双尾分布。如果tails=1,函数TDIST计算单尾分布。如果tails=2,函数TDIS
T计算双尾分布。3.举例:TDIST(1.96,60,2)=0.054645三、随机抽样工具
(一)简介:Excel中的RAND()函数可以产生大于等于0小于1的均匀分布随机数,RAND()不带任何参数运行,每次计算
时时都将产生一个新的随机数,如果将RAND()函数从一个单元格复制或移动到另外一个单元格,RAND()函数也将重新计算一个新的数
值。RAND()函数可以被用来作为不重复抽样调查的工具。(二)操作步骤:如图附-11所示,10个象征性的样本数据,欲从
中随机抽取5个数据可按如下步骤操作:图附-111.选择B2单元格,输入公式“=RAND()”并回车。2.拖动B2单元格右下角的填充柄至B11单元格,并在B1单元格输入列标志名称“random”。3.选取单元格B2至B11,右击选中的区域选择“复制”,再次右击选中的区域,选择“选择性粘贴”,单击选项“数值”后,点击“确定”按扭,此时B2:B11单元格是10个稳定的随机数。4.选取单元格A2至B11单元格,选择“数据”菜单项下的排序子菜单。5.选取“RANDOM”为主要关键字,然后点击“确定”按扭。排序结果如图附-12所示,可以用A2至A6单元格的样本作为随机抽取的5个样本。图附-12(三)结果说明:1.以上进行的是不重复随机抽样,可以用类似的方法,利用Excel的RANDBETWEEN(TOP,BOTTOM)函数实现总体的重复随机抽样。RANDBETWEEN(TOP,BOTTOM)函数可随机产生介于TOP与BOTTOM之间的随机整数,抽取此整数对应编号的样本可作为总体的重复随机抽样的结果。2.RAND()函数产生的是0与1之间均匀的随机数,利用数据分析工具中的随机数发生器,可以生成用户指定类型分布的随机数。例如0-1正态分布的随机数,指定γ参数的迫松分布的随机数等。3.Excel易于产生各类型随机数,可以用类似的方法方便的进行进行随机数字模拟试验与随机游走模拟试验。四、样本推断总体(一)简介:利用Excel的几个函数,如求平均函数AVERAGE、标准差函数STDEV、T分布函数TINV等的组合使用可以构造出一个专门用于实现样本推断总体的Excel工作表。以下例子先计算样本的平均数和标准差,然后在一定置信水平上估计总体均值的区间范围。(二)操作步骤:1.构造工作表。如图附-13所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。2.将A列的名称定义成为B列各个公式计算结果的变量名。选定A4:B6,A8:B8和A10:B15单元格(先用鼠标选择第一部分,再按住CTRL键选取另外两个部分),选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。
献花(0)
+1
(本文系小怪是小猪...原创)