配色: 字号:
04描述性统计分析
2022-04-15 | 阅:  转:  |  分享 
  
04描述性统计分析《统计与数据分析基础》目录/Contents4.14.2集中趋势的统计分析4.3离散程度的统计分析分布形态的统计分析4.
4课堂实训——生产资料市场价格分析4.1.1集中趋势的含义集中趋势反映了一组数据中心点所在的位置,统计分析集中趋势,不仅可以找
到数据的中心值或一般水平的代表值,还可以发现数据向其中心值靠拢的倾向和程度。比如全国人均GDP(GrossDomesticPr
oduct,国内生产总值)就是一个集中趋势指标,反映的是人均国内生产总值的情况。虽然每个人对GDP的贡献度不同,但人均GDP能够反
映一个国家的经济发展水平。4.1.2算术平均值1.简单算术平均值算术平均值指的是一组数据相加后除以数据个数的结果,它可以反映
出一组数据的平均水平,如上文所述的人均GDP。该指标的优点在于利用了所有数据的信息,缺点则是容易受极端值的影响,这样会导致结果的代
表性较差。?简单算术平均值是对未经分组的数据计算平均数而采用的计算形式。假设一组数据有n个变量值,分别为,则这组数据的简单算术
平均值的计算公式如下。在Excel中,可以直接使用AVERAGE函数计算某一组数据的简单算术平均值。4.1.2算术平均值2.
加权算术平均值加权算术平均值则是对已分组的数据计算平均数而采用的计算形式。若将一组数据分为k组,各组的简单算术平均值表示为,每组
数据的个数为各组数据的权数,分别,则这组数据的加权算术平均值的计算公式如下。??在Excel中,可以使用SUMPRODUCT函数计
算加权算术平均值公式中的分子部分。该函数可以返回对应区域的乘积之和。4.1.2算术平均值【实验室】掌握西红柿试验田的平均产量情
况TOP2:计算其他品种西红柿的平均产量TOP1:计算A品种西红柿平均产量4.1.2算术平均值TOP3:计算A品种西红柿的权数
TOP4:计算其他品种西红柿的权数4.1.2算术平均值TOP5:应用SUMPRODUCT函数TOP6:应用SUM函数4.1.2
算术平均值TOP7:计算加权算术平均值TOP8:计算简单算术平均值4.1.3中位数中位数:是指将一组数据按从小到大或从大到
小的顺序排列后,处于中间位置上的数据。当一组数据中含有异常或极端的数据时,通过算术平均值这个指标就有可能得到代表性不高甚至错误的结
果,此时则可以使用中位数来作为该组数据的代表值。A?注意:当该组数据的个数n为奇数时,中位数就是位于位置上的数值,如当n
=13时,中位数就是第7位对应的数值;当该组数据的个数n为偶数时,中位数就是位于前后相邻的两个自然数位置对应数值的算术平均
值,如当n=14时,中位数就是第7位和第8位数值的算术平均值。B4.1.3中位数【实验室】识破招聘启事中的工资待遇陷阱TOP
1:插入函数TOP2:选择函数4.1.3中位数TOP3:设置函数参数TOP4:再次设置函数参数4.1.3中位数TOP6:返
回计算结果TOP5:继续设置函数参数4.1.4众数众数注意众数是指一组数据中出现频率最高的数值,这个指标对定类数据、定序数据、
定距数据和定比数据都适用,能表示由它们组成的一组数据的集中趋势。如果在一组数据中,只有一个数值出现的次数最多,就称这个数值为该组数
据的众数;如果有两个或多个数值的出现次数并列最多,则称这两个或多个数值都是该组数据的众数;如果所有数值出现的次数都相同,则称该组数
据没有众数。4.1.4众数【实验室】通过众数票选出班级口号TOP1:插入函数TOP2:选择函数4.1.4众数TOP3:设置
函数参数TOP4:继续设置函数参数4.1.4众数TOP5:返回计算结果目录/Contents4.14.2集中趋势的统计分析4.
3离散程度的统计分析分布形态的统计分析4.4课堂实训——生产资料市场价格分析4.2.1离散程度的含义在统计学中,把反映总体中各
个个体的变量值之间差异程度的指标称为离散程度,也称为离中趋势。描述一组数据离散程度的指标有很多,常用的包括极差、四分位差、平均差、
方差、标准差、变异系数等,使用这些指标,并结合集中趋势的描述,就可以更好地发现数据的特性。在同类离散指标的比较中,离散指标的数值越
小,说明该组数据的波动(变异)程度越小;离散指标的数值越大,则说明该组数据的波动(变异)程度越大。4.2.2极差极差又称范围误
差或全距,通常以R表示,反映的是一组数据中最大值与最小值之间的差距,其计算公式如下:?由于极差是一组数据中最大值与最小值之差,
因此该组数据中任何两个变量之差自然都不会超过极差。这一特性,使得极差能够刻画出一组数据中变量分布的变异范围和离散幅度,能体现出一组
数据波动的范围。一组数据的极差越大,该组数据的离散程度越大;极差越小,离散程度则越小。注意:极差只能反映一组数据的最大离散范围,未
能利用该组数据的所有信息,不能细致地反映出变量彼此之间的离散,从而不能反映变量分布情况,同时极差也易受极端值的影响。4.2.2
极差【实验室】通过极差观察气温变化TOP1:输入函数TOP2:继续输入函数4.2.2极差TOP4:填充公式TOP3:计算201
9年的气温极差4.2.3四分位差如果将一组数据按从小到大或从大到小的顺序排列后等分为4份,则处于该组数据25%位置上的数据称为
上四分位数QL,处于50%位置上的数据称为中位数,处于75%位置上的数据称为下四分位数QU。四分位差Q_d则指的是上四分位数Q
U与下四分位数QL之差,即Q_d=Q_U-Q_L,如图所示。若一组数据中包含个数值,则下四分位数QL和上四分位数QU的位置分别如
下:下四分位数QL的位置,上四分位数QU的位置?4.2.3四分位差【实验室】利用四分位差分析全班的数学成绩TOP1:选择函数T
OP2:设置函数参数4.2.3四分位差TOP3:继续设置函数参数TOP2:继续输入函数4.2.4平均差?平均差也是一种表示
各个变量值之间差异程度的指标,指的是各个变量值与其算术平均值的离差绝对值的算术平均值,可以用“A.D”或“M.D”表示。其中,离差
就是偏差,是某个变量值与整个数据的算术平均值之差。假设一组数据有n个变量值,分别为,其算术平均值为,则平均差的计算公式如下。
?例如,一组数据包含的数值有20、40、60、80、100,则该数据的平均差为:?4.2.4平均差【实验室】使用平均差分析销售
部门的销量TOP2:返回销售1部的平均差数据TOP1:输入函数并引用单元格区域4.2.4平均差【实验室】使用平均差分析销售部门
的销量TOP1:输入函数并引用单元格区域TOP2:返回销售1部的平均差数据4.2.4平均差TOP3:计算销售2部的平均差数据T
OP4:计算销售3部的平均差数据4.2.4平均差TOP5:计算平均销量4.2.5方差与标准差1.总体的方差和标准差假设一
组数据有N个变量值,分别为,为总体方差,为总体均值,μ为总体的均值,则总体方差的计算公式如下。??总体标准差σ的计算公式
则为:?4.2.5方差与标准差2.样本的方差和标准差实际工作中,如果总体均数无法得到,则可以使用样本统计量代替总体参数。假设
样本量为n,样本量的均值为,此时样本方差的计算公式如下。???样本标准差的计算公式则为:?4.2.5方差与标准差【实验
室】分析篮球队每一百回合得分数据TOP1:选择函数TOP2:设置函数参数4.2.5方差与标准差TOP4:计算样本标准差TOP3
:计算总体方差4.2.5方差与标准差TOP5:计算样本方差4.2.6变异系数变异系数是用绝对值形式的离散指标与平均值相除的
结果,是用比率的形式反映离散程度大小的一种指标,通常用标准差除以算术平均值的百分数来表示。总体的变异系数计算公式如下。??样本的变
异系数计算公式如下。注意:变异系数是无单位指标,它不仅可以说明同类数据的相对离散程度,还可以说明不同类型数据的相对离散程度。3.1
.3逻辑错误修复【实验室】分析衣柜与五金件的价格波动幅度TOP1:计算成品衣柜的样本标准差TOP2:计算五金件的样本标准差3.
1.3逻辑错误修复TOP3:计算算术平均值TOP4:计算成品衣柜的变异系数3.1.3逻辑错误修复TOP5:计算五金件的变异
系数目录/Contents4.14.2集中趋势的统计分析4.3离散程度的统计分析分布形态的统计分析4.4课堂实训——生产资料市场价
格分析4.3.1偏度与峰度1.偏度偏度描述的是样本分布的偏斜方向和程度,偏度系数则是以正态分布为标准来描述数据对称性的指标。
如果偏度系数大于0,则高峰向左偏移,长尾向右侧延伸,称为正偏态分布;如果偏度系数等于0,则为正态分布;如果偏度系数小于0,则高峰向
右偏移,长尾向左延伸,称为负偏态分布,如图4-48所示。4.3.1偏度与峰度2.峰度峰度描述的是样本分布曲线的尖峰程度,峰度
系数则是以正态分布为标准来描述分布曲线峰顶尖峭程度的指标。如果峰度系数大于0,则两侧极端数据较少,比正态分布更高更窄,呈尖峭峰分布
;如果峰度系数等于0,则为正态分布;如果峰度系数小于0,则两侧极端数据较多,比正态分布更低更宽,呈平阔峰分布,如图4-49所示。4
.3.2使用Excel的描述统计功能加载“数据分析”选项卡TOP1:Excel选项设置TOP2:管理Excel加载项4.3.
2使用Excel的描述统计功能TOP3:加载分析工具库TOP4:显示数据分析工具4.3.2使用Excel的描述统计功能2.
描述统计分析【实验室】分析农产品销售情况TOP1:选择分析工具TOP2:设置描述统计参数4.3.2使用Excel的描述统计功
能分析统计结果目录/Contents4.14.2集中趋势的统计分析4.3离散程度的统计分析分布形态的统计分析4.4课堂实训——生产
资料市场价格分析4.4.1实训目标及思路某企业专注于黑色金属类生产资料的经营业务,为了更好地调整经营策略,企业相关人员从国家统
计局采集了相关黑色金属类生产资料1月至5月的市场价格数据。下面需要通过描述性统计来分析这些生产资料的价格变动情况,具体操作思路如图
4-58所示。4.4.2操作方法TOP2:输入文本TOP1:设置描述统计参数4.4.2操作方法TOP4:计算其他生产资料的
极差TOP3:计算极差4.4.2操作方法TOP5:继续输入文本TOP6:应用QUARTILE.INC函数4.4.2操作方法TOP7:完善公式内容TOP8:计算四分位差4.4.2操作方法TOP9:计算其他生产资料的四分位差TOP10:输入文本和公式4.4.2操作方法TOP12:继续输入文本和公式TOP11:计算其他生产资料的平均差4.4.2操作方法TOP14:复制单元格格式TOP13:计算其他生产资料的变异系数4.4.2操作方法TOP16:添加边框TOP15:设置数据类型4.4.2操作方法TOP18:合并加粗文本TOP17:合并单元格区域
献花(0)
+1
(本文系太好学原创)