分享

武松老师说统计之六:计量资料的统计描述

 lsyy2096 2018-05-08

各位盆友:

计量资料的概念我们前面已经说过,而我们也说过不同资料类型将会有不同的统计分析方法,本篇将给大家阐明计量资料如何进行统计学描述,即描述性分析。

为让大家了解知识的结构,我先用思维导图做一张知识结构图如下,本篇请重点关注计量资料部分。



计量资料的统计描述分为两大类方法:

(一)图表法

(1)统计表,此处主要指频数表,可以对计量资料进行整理和后续统计指标的计算,近年用的一般不多。加之SPSS等软件的应用,对其手工计算更加束之高阁。

(2)统计图:此处主要指直方图,此处的图标主要用于反映计量资料的频数分布类型及两种趋势。统计图表将在后续中有专题。

(二)指标法

1、集中趋势指标(3个)

(1)算数均数(简称均数):

(2)集合均数(G)

(3)中位数(M)

(4)百分位数(Px)


2、离散趋势指标(7个,如下图)


(1)极差(R)

极差:为一组数据的最大值与最小值之差。

R = max (Xi) - min(Xi)

优点为:计算简单,易于理解;缺点为:极端值不稳定,以点概面。


(2)四分位数间距(Q)

Q:一组数据上四分位数与下四分位数之差,其间包括全部观察值中间的一半。



(3)平均偏差(MD)


(4)离均差平方和(SS)



(5)方差(S2)


(6)标准差(S)


(7)变异系数(CV)




(三)总结:

其实对于我们大部分实战派的科研工作者来说,根本没有必要了解上述指标如何推导,只要记住其如何运用就可以了。所以给大家总结如下:

1)频数表和直方图:记得可以帮助我们看看数据的集中与离散趋势,初步判断对称还是偏态分布。

(2)统计指标要点:均数加减标准差是一对黄金搭档,一起用于描述对称分布资料的集中与离散趋势;中位数与四分位数间距是另一对黄金搭档【M(Q)】,一起用于描述偏态分布资料的集中与离散趋势。变异系数只有在不同资料之间比较时才有意义,一组数据的自身变异系数计算意义不大。

(3)具体如何计算:我们今天已经走出手工计算的年代,武松说统计专题后;武松说SPSS,专门讲解实战。

今天很多发表的文章,仅凭肉眼都能看出是偏态分布,但文中依然选择均数和标注差描述,是显然不对的。

(4)下期播报:武松老师说统计之七:正态分布的那些事?

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多