分享

|管理科学与工程|《统计学》(10)描述性统计数据

 相国转角 2021-12-28
复习规划服务
答辩论文写作事项咨询

描述性统计数据



一、描述性统计概述
     描述性统计,是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。描述性统计分析要对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形
①数据的频数分析。在数据的预处理部分,利用频数分析和交叉频数分析可以检验异常值
②数据的集中趋势分析。用来反映数据的一般水平,常用的指标有平均值、中位数和众数等。
③数据的离散程度分析。主要是用来反映数据之间的差异程度,常用的指标有方差和标准差。
④数据的分布。在统计分析中,通常要假设样本所属总体的分布属于正态分布,因此需要用偏度峰度两个指标来检查样本数据是否符合正态分布。
       ⑤绘制统计图。用图形的形式来表达数据,比用文字表达更清晰、更简明。在SPSS软件里,可以很容易地绘制各个变量的统计图形,包括条形图、饼图和折线图等。

1、数据的整理与图形表示
饼形图,主要用于表示总体或样本中各组成部分所占的比例。

 

频率直方图,亦称频率分布直方图。统计学中表示频率分布的图形。在直角坐标系中,用横轴表示随机变量的取值,横轴上的每个小区间对应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图。

 

条形图,排列在工作表的列或行中的数据可以绘制到条形图中。条形图显示各个项目之间的比较情况。 描绘条形图的要素有3个:组数、组宽度、组限。

 

柱状图,也称条图、长条图、条状图,是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。相似的还有扇形统计图和折线统计图。


 
  ⑤茎叶图,茎叶图又称“枝叶图”,在20世纪早期由英国统计学家阿瑟·鲍利设计,1977年统计学家约翰托奇在其著作《探索性数据分析》中将这种绘图方法介绍给大家,从此这种作图方法变得流行起来。
 
 

 


2、数据的描述性指标
1)反映数据集中趋势的指标:测度集中趋势就是寻找数据的代表值或中心值。
众数:是数据中出现次数最多的变量值,不受极端值的影响,一组数据可能没有众数或有几个众数。
中数(中位数),排序后处于中间位置上的值,有一半的数据大于等于中数,有一半的数据小于等于中数,不受极端值的影响。
四分位数,排序后处于25%和75%位置上的值,QU为上四分位数,QL 为下四分位数,不受极端值的影响。
简单均值与加权均值,易受极端值影响,数学性质优良,应用场合最多。
 
 
2)反映数据离散趋势的指标,反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度,离散程度的测度常用于衡量数据的稳定性,说明事物风险的大小。
 
 ①极差(全距),一组数据的最大值与最小值之差,离散程度的最简单测度值,易受极端值影响,未考虑数据的分布,计算公式为 R = max(xi) - min(xi)。
四分位差,上四分位数与下四分位数之差 QD = QU – QL,反映了中间50%数据的离散程度,不受极端值的影响。
方差和标准差,是统计中最常用的度量数据离散程度的指标,能够比较合理地反映不同数据对离散度量的作用。缺点是计算比较繁琐,方差的单位没有实际意义,与原数据集不一致。
 

二、常见考题
选择题:数据整理及图形、数据集中、离散趋势指标。
 
简答题:数据集中、离散趋势指标分析

计算分析题:计算数据的平均数、中数和众位数;对于集中、离散数据的度量趋势进行说明。
三、答题关键点

      这部分内容比较简单。一般以考单项选择题、简答题、计算分析题的形式进行考察。

复习方式:阅读考纲+理解记忆+举例。

关于简述题需要多看书,将书本理论联系实际,多理解多思考,不死记更背。回答问题时,重要知识点写在前面,展开说明或是解释的内容写在后面,注意逻辑关系,内容结构和完整性。

关注“相国转角”微信公众号,同等学力考试不迷茫!

大家有任何同等学力申硕上的问题困惑

都可以在留言区域留言,免费咨询~

闫老师一直陪伴申硕成功

< “相国转角”一直陪伴你 >

编辑 | 九岁红

素材来源 |闫相国申硕团队

别忘了点赞+在看哦!


1

辅导机构及辅导班推荐

北京学苑科技开发中心  (简称:学苑中心)  

2

本知识点常见考题

【题例1】数据组(4   7   8   6   6   5   4  5   3   6)的众数为(   )。

A. 6              B.  5.5           

C.  5.4           D.  5

【答案提示】 A。

【题例2】在下列数据集的综合度量指标中,最容易受到极端值影响的是(     

A、极差        B、上四分数     

C、中位数      D、众数

【答案提示】 A。

【题例3】计算一组数据的标准差时,如果每一个数值加上一个常数a,与原数据组标准差相比,新数据组的标准差(   

A.大               B.小

C.不变             D.不一定

【答案提示】 C

【题例4】下列计量属于集中趋势的是          

A.   总体单位数      B. 样本单位数

C.平均数           D. 方差

【答案提示】 C


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多