分享

标准差与标准误的区分(二)

 liyu_sun 2020-09-22

昨天的文章我们初步认识了标准差和标准误的联系与区别,今天我们深入地来谈谈标准差这个大家日常“貌似”很熟悉的概念。

从概念上看,标准差反映的是数据间的波动情况。什么叫波动情况?就是数据之间的差别。那什么叫差别大,什么叫差别小?
请看下面这两张图:
阅兵士兵身高
小朋友身高
第一张图是阅兵士兵的身高,肉眼可见,互相差距极小,意味着标准差小;相反,第二张图中小孩们身高参差不齐,互相差距大,从而意味着标准差大。
下次再看到标准差时,可以先联想这两张图。
接下来,可能有同学会问:两个人可以很直观地比较,看出差距,即谁高谁矮;但如果一群人比较的话,怎么就表示数据互相差异大或是差异小呢?
所以,这便引出了关于标准差的第二个性质:平均差距!
一组数据,我们要先求出其平均数,然后再用每一个数与这个平均数相减,对差值平方后加和,最后再取平均数,就得到了方差,开方后就得到标准差。
所以,从上述倒数第二步“取平均数得到方差”可以看出,标准差(或者方差)实际上也是一种平均数。
通过这种平均,我们才可以说,这个指标整体地反映了数据的变异程度,即平均而言,每一个数与它的平均数的偏离程度。
为什么要研究与平均数的偏离程度?
在这个充满变异的世界里,我们找不出“两片完全相同的叶子”,但我们没有精力去研究每一片叶子,而只能研究大部分叶子大概相同的特征,比如是绿色、还是红色;是椭圆形还是三角形等等,这些大概的特征用统计学的语言来讲就是“平均数”。
另一方面,如果我们说某个小区男性的平均身高是1.8m,给人的第一印象是这个小区的男性居民身高普遍都很高,印象是,步入这个小区肯定会遇到个子很高的人。
这是一种预期,即根据平均身高来进行的预测,由此,我们知道,平均数不仅反映了数据的普遍特征,同时也是我们进行预测的最基本的工具。
谈到这里,你估计就能明白,为什么统计学上会把均数称作“期望(Expectancy)”。
可是,我们知道预期并非每次都准,比如,当你步入平均身高为1.8m的小区,也有可能迎头碰上一名身高不足1.6m的小伙子,这种“理想(即预期)”与“现实”的差距其实就很好地诠释了“标准差”的含义。

下面,我们通过投硬币的例子来系统还原一下标准差的计算过程和它背后的意义。
我们知道一般抛硬币正反两面朝上的概率各一半。如果抛10次,直觉上或者理论上,正面(数字面)朝上的次数应该是5次(10*0.5)。
但是,如果我们现在真抛十次,敢打包票一定会恰好出现5次正面向上的情况么?显然不敢,为什么不敢,按道理来说,就是会有5次正面向上啊?
如果有人跟你这样争论,你肯定认为他是杠精:“运气不好,可能连一次正面向上都不会出现!”
确实!除此以外,我们按照概率的公式来算,抛10次硬币,恰好有5次正面朝上的概率其实只有0.25左右(这里概率不会算的同学,可以复习二项分布这一课),并不是100%,也就是意味着抛10次无法确保一定有5次正面向上。
换句话说,我们抛10次硬币,正面向上可能出现4次,或6次……或一次也没有。
这里就反映出了“理想”与“现实”的区别,而这两者之间的“差别”就可以理解为“标准差”。
理想情况下5次正面向上,但实际情况可能只有3次,那么标准差(这里考虑绝对值)就是2;如果实际是8,那么标准差就是3。
现在,我们做100次试验(每次试验都抛10次硬币),该怎么计算标准差呢?
首先,我们会得到100个数,代表每一次试验“正面出现的次数”,然后将每一个数与“5”做减法,就会得到100个差值,那么平均而言,这个差值有多大呢?
第一个想法是将这100个差值,加和求平均数,但如果简单地把这100个差值相加,因为这其中“有正有负”,很可能结果等于0了,没有什么意义。(请大家想想为啥这里是“很可能”,而不是“一定”,欢迎在评论区留言讨论!
第二个办法是考虑取绝对值,把负数都变成正数,然后加和取平均数,但因为绝对值有符号,不利于深入计算,所以最终才引入了“平方”的方式。
通过将每一个差值平方,都变为正数,然后加和再取平均数,由此就得到我们熟知的“方差”,开方后就得到了标准差。
(平方还有更深的意义,这里不展开,仅方便理解!)
于是,方差或标准差就代表,平均试验一次,理想与现实的差距,即硬币实际正面朝上的次数与理想正面朝上正面次数的差距。
所以,总结而言,方差或标准差代表的是一个差异的概念,而且是平均差。这个指标的大小,反映了数据整体而言偏离均数的平均程度,数值越大,偏离程度越大,反映在图像上就是波动性大。
明天是这个系列文章的最后一篇,我们会主要结合两者做一个总结,同时看看标准误如何与假设检验相联系。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多