分享

Excel应用大全 | 集中趋势

 hercules028 2022-02-16
直方图有很多种形态,如图 7-16 所示。
图片
7-16不同形态的直方图
无论何种形态,都可以用如下两个特征来进行描述:中心点和围绕该中心点的变动幅度。这两个特点也是每个计量数据都有的特征。从直方图转换到数据组,这两个特征分别对应的就是集中趋势和离散趋势。集中趋势也称为平均数,最常见的三种形式是:均值(又称:算数平均数)、中位数和众数。平均数(average)和均值(mean)是不同的概念,均值是平均数的表现形式之一。离散趋势的形式包括极差、方差和标准差等,该部分内容在下一节中会进行讲解。
图片

均值
从平均成绩、平均身高、平均产量、平均价格到生活中的方方面面,人们都经常用均值来衡量某一组数据的中心点特征。均值是最常见的数据指标,也称为算数平均数,它的重要性不言而喻。人人都会计算均值,但使用中需要注意以下几点。 
1. 均值的统计学意义假设有一组数据包含 3 个数值 123,这组数据的均值是 2,每个数值与均值相减得到的值是均值偏差,如图 7-17 所示
图片
7-17计算均值偏差
将所有的均值偏差相加得到:-1+0+1=0,这就是均值在统计学中的意义,均值是数据组中令所有均值偏差总和为 0 的那个数值。2. 和均值相关的两个重要符号™ :英文发音Sigma”,中文发音西格玛 ”, 1 2 , , ,,i xx x   代 表1 2 i xx x + +++  ,就是将 后面的所有数值相加。™ X :读音X 拔”,表示数据组的均值。
3. 均值的局限性
均值能非常直观地描述一组数据,但是它对极值非常敏感,如果数据组中出现差异很大的极值,均值的准确性会下降。例如,有 9 个人围坐在一起交流每个人的年收入,经过计算得出,这 9 个人的年均收入为 12 万美金,此时比尔·盖茨突然走了过来,加上比尔·盖茨后的年均收入达到了上千万美金,但是这个均值无法代表 90% 的大多数人,只是由于异常值存在,导致均值出现了极大的偏差。
如果不希望受异常值的干扰,那么中位数是一个很好的选择。
中位数
图片ENJOY THE SUMMER

中位数是另一种对中心点的描述方法。
某服装公司有 5 个销售渠道,每个渠道 2018 年的净利润如图 7-18 所示。
图片
图7-18 5 个销售渠道在 2018 年的净利润
7-18 5 个销售渠道在 2018 年的净利润数据,按照净利润从小到大的排列,位于中间位置的是第 3 个渠道京东商城,年利润 7 万元,7 就是该组数据的中位数。中位数就是一组数据从小到大排列以后,在中心位置的数。这组数据有 5 个渠道,数据项数是 5,由于 5 是个奇数,很容易找到中间位置(第 3 个数据),如果数据项数是个偶数,则需要换一种方法。
该服装公司在 2019 年又增加了拼多多的渠道,净利润如图 7-19 所示。
图片
7-19 6 个销售渠道在 2019 年的净利润
数据组的项数增加到 6 项,中心点位于唯品会和京东商城之间,也就是在 4 万元和 8 万元之间,这种情况下,中位数是 6 万元(4 8 的均值)。
对于偶数项数据组,中位数是紧挨中心点左右的两个数值的均值。从计算方法中可以很容易看出中位数的优点,它不受极值的影响。在图 7-18 中,线下专卖店 100 万元与其他渠道差异很大,可以认为是一个极值,净利润的均值是 24 万元,中位数是 7 万元。
一个能代表数据组的中心点的数应该具备此特征:约有一半的数值比它小,约有一半的数值比它大。均值 24 万元是该组数据中第二大的数值 8 万的 3 倍,很显然它不能代表数据的中心点。但是中位数可以满足该特征,无论是去年的 7 万元,还是今年的 6 万元,都是处在数据组的中心位置。
正是这个原因,特定场景的数据集中趋势都是使用中位数,而不是均值,一瓶水在全国各地的售价,如果用均值,会受到少数特殊场景的售价影响,如景区的天价水等,而使用中位数则可以较准确地体现真实售价。

众数
众数是数据组中出现次数最多的数值。计算方法是找出所有数值的频数,频数最高即为众数。
10 个学生,每个人可以报一个特长班,如图 7-20所示。
图片
7-20报名人数分布
A1:B11 区域是报名详情表,D1:E4 区域是报班统计结果。从报班统计结果看,声乐是报名人数最多的课程,所以所有特长班的众数是声乐。
注意:众数不一定是个数值也有可能是某种事物属性类别等由于大家的惯性思维通常会认为众数是 5其实众数应该是声乐另外众数有可能有多个例如舞蹈 2 朗诵和声乐分别是 4 那么众数就是朗诵和声乐众数也有可能不存在如果三个特长班的报名人数完全相等时现实生活中绝大多数用到众数的场景都是事物的属性和类别遇到数值类的数据组通常用均值和中位数
在没有极端值影响的前提下,均值是最能表达数据集中趋势的形式,因为均值是运用了全部的数据组信息,是最精确的表达。但是由于均值对极端值很敏感,这时可以用中位数来表达。如果该数据组不是数值型的,是事物属性的组合,则需要用众数来表达集中趋势。



在Excel中计算数据组的均值、中位数、众数
图片
1. 均值、中位数
7-21 所示是北京某连锁超市在国庆当天的营业额,需要在 Excel 中计算国庆当天 6家店的营业额均值和中位数。
图片
图7-21计算均值中位数的函数
E2 单元格输入以下公式,计算营业额均值,结果为 73 443=AVERAGE(B2:B7)
E3 单元格输入以下公式,计算营业额中位数,结果为 70 038
=MEDIAN(B2:B7)
2. 众数
某服装店在冬季即将结束之前举办了一场短时促销,共有 3 个款式大衣参与此次活动,时间是从 10 点至 14 点,在 4 个小时内共售出 20 件大衣,销售记录如图 7-22 所示。
图片
7-22某服装店促销销售单
如果需要快速计算出哪一款大衣销量最高,可用 Excel 计算,如图 7-23 所示。
图片
7-23Excel 计算销售最高的单品众数
E1 单元格输入以下公式,得到众数(销量最高的单品),结果是 B 款。
=INDEX(B2:B21,MODE(MATCH(B2:B21,B2:B21,)))
再一次看到,众数不一定是“数”,在本例中众数是个商品。众数在商业领域应用最广泛的场景是寻找热销单品;如果是统计投票结果,众数就是高票当选的人;如果是在研究高考报考专业时,众数就是当年最热门的专业。        
图片
END
图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多