一百多年前,一个游乐场举办了一次“猜牛体重”的比赛。围观的群众们聚在一起,猜测一头十四岁公牛的体重。 统计学家高尔顿,将现场观众的所有猜数带回家里,统计后发现,虽然没有一个猜数是精准的,但是所有猜数的平均数却准确猜中了牛的体重。这就是“群体智慧”。 在统计数据中,可以通过一些统计结果去估计事件的情况。 我们已经学习了用图、表来组织样本数据。图表最重要的作用就是用样本估计总体。 例题一 在这张图中,我们可以估计众数。 那么,如何从频率分布直方图中估计中位数呢? 可以在整个图的中间画一条竖直线,竖直线所在的位置,就是中位数的位置。 在中间的什么地方画线,才能使得两侧的面积相等呢? 计算: 所以面积为总面积一半的竖直线,一定会划在第五组这个区间范围内。 看穿图表信息背后体现的规律,有重要意义。 下面再来估计平均数。 加权平均数公式: 计算: 这意味着全体相关居民中,月均用水量的平均数是2.02吨。 注意: 这主要是由于用每一组的组中值,代替这一组中的每一个数据所造成的。 用样本估计总体,可以使我们用较少的数据,去分析更大范围的问题,直观地观察到数据的大致状况。 熟练地掌握这一技巧,在如今信息无处不在的大数据时代,才能立足潮流,行稳致远。 |
|