分享

数据集中趋势的几个度量指标

 新用户08306761 2021-02-18

众数

众数,就是在一堆数据中出现次数最多的那个数,非常好理解。它主要是用来衡量分类数据的集中趋势的。

数据集中趋势的几个度量指标

举例:

随机调查了10个人的月收入状况,具体数据如下:

2000 3000 2000 4500 5000 3000 2500 3000 6000 3000

那么月收入的众数是多少?

显然,在上面10个数中,出现次数最多的是3000,共出现4次。因此,月收入的众数就是3000.

中位数和分位数

首先要说明的是,中位数和分位数都是用来测度带顺序的数据的。

1.中位数

顾名思义,中位数,就是将数据从小到大排列后,处在中间位置上的那个数。

也就是说,中位数将所有的数据分为两部分,一部分都比中位数大,另一部分都比中位数小;而且这两部分的数据个数各占50%。

那中位数的位置该如何确定呢?

需要用到这个公式:(n+1)/2

这里的n就是数据的个数。

举例:

1,3,5,7,9 这5个数的中位数的位置在哪里?

运用上面的公式,将n=5代入,可得

(5+1)/2=3

也就是说,中位数的位置在第3个数上,也就是数字5.

上面的例子是奇数个数据,假如是偶数个呢?我们再看下面这个例子:

2,4,6,8 这4个数的中位数位置在哪里?

同样,将n=4代入公式,可得

(4+1)/2=2.5

也就是说,中位数在第2个数和第3个数之间的中心位置。

中位数的位置确定好以后,下一步就是要确定中位数的具体数值了。

假设我们有以下数据:x(1),x(2),···x(n),那么这n个数的中位数是多少呢?

根据上面的经验,我们也分为2种情况来讨论:

当n是奇数时,那么中位数为

x[(n+1)/2]

当n是偶数时,那么中位数为

[x(n/2)+x(n/2+1)]/2

感兴趣的同学可以自己将公式代入,这里我们不再举例。

2.四分位数

四分位数,是指将数据按顺序从小到大排列后,处在第25%的位置(下四分位数)和第75%的位置(上四分位数)的值。

和中位数不同的地方是,四分位数确定位置的方法有很多种,我们这里只列出了一种方法。

下四分位数的位置确定公式为n/4;上四分位数的位置公式为3n/4。

在具体计算数值时,可以根据位置的比例来计算对应的四分位数。

我们还拿之前的月收入数据举例,只不过这里只取了9个值,如下:

2000 2000 2500 3000 3000 3000 3000 4500 5000

先来计算下四分位数,一共有9个数,因此代入公式,可得

9/4=2.25

因此,下四分位数是在第2个数和第3个数之间0.25的位置上。计算得到下四分位数为

2000+(2500-2000)*0.25=2125

同理,上四分位数的位置为

3*9/4=6.75

因此,上四分位数的值为

3000+(3000-3000)*0.75=3000

平均数

别看平均数很简单,其实它也有很多种形式。

1.简单平均数

当我们计算未分组数据的平均数时,可将其称为简单平均数。

假设我们有n个数据,分别为x(1),x(2),···x(n),那么平均数的计算公式为

数据集中趋势的几个度量指标

2.加权平均数

当我们计算带有分组数据的平均数时,此时可称作加权平均数。

假设我们有m组数据,每组数据的值(组中值,可通过计算得出)x(1),x(2),···,x(m)对应的权重分别为k(1),k(2),···,k(m),则加权平均数的公式为:

数据集中趋势的几个度量指标

这里的k就是加权平均数中“权”的含义了。

3.几何平均数

几何平均数主要用来计算平均比率,如平均增长率,平均收益率等等。它的公式如下:

数据集中趋势的几个度量指标

也就是说,几何平均数就是n个样本的乘积再开n次方根的结果。

这里就不再举例,大家感兴趣的话可以找些数据自己来试试。


这就是今天的几个集中趋势的度量指标,你都理解了吗?别忘了点赞关注哦!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多