分享

用Excel做直方图(2):频率分布直方图

 进击的可乐 2021-12-15

终于来更新这篇用Excel做直方图的文章了,这和用Excel做直方图(1):随机数发生器是一个系列的,个人认为生成随机数以后就可以做直方图了,所以这两部分是一体的,忘记随机数发生器的小伙伴可以回头复习一下。

本篇文章涉及到的知识点:

  1. 数据分析工具库

  •        随机数发生器

  •        描述统计

  •        直方图

    2. Excel公式:

  •        COUNT

  •        MAX

  •        MIN

  •        AVERAGE

  •        SQRT

  •        ROUNDUP

  •        STDEV.S

  •        FREQUENCY

一、什么是直方图

1、定义

直方图是一种条形图,是以组距为底边、以频数为高度的一系列连接起来的直方型矩形图

2、相关概念

组数在统计数据时,把数据按照不同的范围分成几个组,分成的组的个数称为组数。

组距每一组两个端点的差

规格上限:Tu

规格下限:Tl

公差中心:M=(Tu+Tl)/2

3、步骤

  • 求出其最大值和最小值。

  • 将数据分成若干组,并做好记号。

  • 计算组距的宽度。用最大值和最小值之差(极差)去除组数,求出组距的宽度。

  • 计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。

  • 统计各组数据出现频数,作频数分布表。

  • 作直方图。以组距为底长,以频数为高,作各组的矩形图。

4、注意事项

1、数据量在50个以上

2、分组数在5~12个为宜

3、在直方图上应标注出公差范围(T)、样本容量(n)、样本平均值(x)、样本标准偏差值(s)x的位置

二、实战:用Excel做直方图

1、获取数据源

按照上节内容讲的随机数发生器,我们随机生成均值为0,标准差为1的100个符合正态分布的数据,用这100个数据来做频率分布直方图。生成的数据如A列所示。

2、计算相应值

我们要算出这组数据的个数,最大值、最小值、平均值、极差(最大值-最小值)、组数和组距。相应的公式如下图所示。

  • 组数:其中组数是这组数组被分成组的个数,是对数据个数开方然后向上取整求出。

  • 组距:组距是每一组数两个端点的差,用极差除以组数求得。

这里提供另外一种直接生成数据描述性统计分析的值的方法,Excel——数据分析 工具库——描述统计 分析工具,直接生成关于一组数据的“描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表,组数和组距还是要手动公式输入,这里的描述性统计分析只是用来提供有关数据趋中性和易变性的信息。

如下图所示,输入区域为A例,也就是数据源一列,汇总统计在F列,可以发现汇总统计的和我们公式算的结果是一致的。

3、分组

然后进行分组,第一组下限值要比最小值小一点,第一组上限值为第一组下限值+组距,如图

分组完成后求每组的频数,可以用公式FREQUENCY,选中J2到J14单元格,输入下图公式,再按“Ctrl+Shift+Enter”组合键,即可求出每个分组的频数。

还有一种方法不用输公式,可以直接得到频数,选择数据分析 工具库——直方图,输入区域是生成的随机数,接收区域是分组。

输入区域是数据源一列,接受区域是分组一列。

可以得到如下图所示的频数分布表和直方图,可以看出和我们公式算的频数一致。

4、绘制图形

设置数据系列格式,将间隙宽度调小。

最后微调把图表调成你想要的样子。

三、怎样评价直方图

正常形态的直方图一般符合标准的正态分布图形,两边低中间高。上述做出的直方图就不是一个标准的形态。

当直方图的形状符合一个标准形状后,还可以对均值和公差进行比较来进一步评价,均值和公差近似重合是我们希望看到的理想形状。

直方图的内容就到这里了,除了不定期更新Excel的内容外,下期起会开始更新另外一个系列:深入浅出学SQL


注:本文首发于CSDN,原文见原文链接

@文章属原创,转载请联系作者

@作者:虾壳,在数据分析的道路上努力奔跑

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多