各位盆友: 计量资料的概念我们前面已经说过,而我们也说过不同资料类型将会有不同的统计分析方法,本篇将给大家阐明计量资料如何进行统计学描述,即描述性分析。 为让大家了解知识的结构,我先用思维导图做一张知识结构图如下,本篇请重点关注计量资料部分。 计量资料的统计描述分为两大类方法: (一)图表法 (1)统计表,此处主要指频数表,可以对计量资料进行整理和后续统计指标的计算,近年用的一般不多。加之SPSS等软件的应用,对其手工计算更加束之高阁。 (2)统计图:此处主要指直方图,此处的图标主要用于反映计量资料的频数分布类型及两种趋势。统计图表将在后续中有专题。 (二)指标法 1、集中趋势指标(3个) (1)算数均数(简称均数): (2)集合均数(G) (3)中位数(M) (4)百分位数(Px) 2、离散趋势指标(7个,如下图) (1)极差(R) 极差:为一组数据的最大值与最小值之差。 R = max (Xi) - min(Xi) 优点为:计算简单,易于理解;缺点为:极端值不稳定,以点概面。 (2)四分位数间距(Q) Q:一组数据上四分位数与下四分位数之差,其间包括全部观察值中间的一半。 (3)平均偏差(MD) (4)离均差平方和(SS) (5)方差(S2) (6)标准差(S) (7)变异系数(CV) (三)总结: 其实对于我们大部分实战派的科研工作者来说,根本没有必要了解上述指标如何推导,只要记住其如何运用就可以了。所以给大家总结如下: (1)频数表和直方图:记得可以帮助我们看看数据的集中与离散趋势,初步判断对称还是偏态分布。 (2)统计指标要点:均数加减标准差是一对黄金搭档,一起用于描述对称分布资料的集中与离散趋势;中位数与四分位数间距是另一对黄金搭档【M(Q)】,一起用于描述偏态分布资料的集中与离散趋势。变异系数只有在不同资料之间比较时才有意义,一组数据的自身变异系数计算意义不大。 (3)具体如何计算:我们今天已经走出手工计算的年代,武松说统计专题后;武松说SPSS,专门讲解实战。 今天很多发表的文章,仅凭肉眼都能看出是偏态分布,但文中依然选择均数和标注差描述,是显然不对的。 (4)下期播报:武松老师说统计之七:正态分布的那些事? |
|