分享

为什么许多变量可以用正态分布很好的描述?

 pgl147258 2014-06-26

【陳浩的回答(13票)】

中心极限定理

http://en.wikipedia.org/wiki/Central_limit_theorem

注1:由@吴涛的评论,我指出一下,此定理是严格的数学定理,不是规律总结。

注2:应用时,注意“独立同分布随机变量“这一条件。所以不是什么都呈正态分布。见@郝显 的答案。

【郝智恒的回答(7票)】

我觉得不是自然界会出现正态分布,而是我们将自然界中出现的这种随机的现象总结抽象命名为正态分布。我觉得不应该说说自然界的现象都服从这个规律,而应该是我们的规律是从自然界的现象中提炼出来的。当然了,很多我们观察到的现象验证了正态分布确实是有用的。但是我觉得还是Cox的那句话,没有模型是正确的,只有有些模型是有用的。

【郝显的回答(4票)】

我觉得这个问题更准确的提法是:为什么许多变量可以用正态分布很好的描述?

教科书上通常的说法是,若一个指标受到许多因素的影响,并且其中任何一个因素都不对其产生决定性的影响,那么该指标的值很可能近似于正态分布。正态分布最早是为了简便地计算二项系数产生的,后来天文物理学家发现它很适合用来描述测量误差分布。再后来人们发现它同样可以极好地刻画人类社会中的其他变量,如身高、体重和智商。

但也有许多满足上述描述的变量的分布与正态相去甚远,如居民收入、股票收益率、书籍销量。这些用scalable(我一直没找到这个词的恰当翻译)的分布更为准确。

至于中心极限定理,我觉得和lz的问题关系不大,它只是可以用来说明为什么正态分布这么牛逼,应用如此广泛,甚至到了滥用的地步。

【山醒的回答(3票)】

        中心极限定理是有严格的推导的。我从一个实例来说明它:

        下面我分享一下大一的时候的一个小想法,当时看到高尔顿版问题的结果,感觉和正态分布的图像很像,于是就去查资料,最后找到了中心极限定理,而这个可以算是对规律的总结。估计发现中心极限定理的数学家们当时也是从此点出发的:

 高尔顿版问题,就是一个随机过程。给出以下链接:

        如果用排列组合的概念去理解的话,那么对于n层的高尔顿版,其落到第n层第k个洞的小球个数是:C(n,k)。如果用画图软件去画的话,那么随着n的增大,越来越接近正态分布的图像!

        估计当时数学家们发现这个东西后,就从数学上就逐步地、成功地得到了中心极限定理。因此对于该类随机过程,就可以用正态分布去描述。正态分布就是对该类随机事件的描述。

——————————

        在上述的链接中,你可以改变flash中的"Left Probability",然后会发现,得到的与正态分布就会差得比较远了。

 

        ps:现在,虽然早已忘记中心极限定理,但是一提起中心极限定理,我最先想到的就是高尔顿版问题。 正是这个问题,让我对统计学有了很大兴趣,就去修统计学双学位了。^_^ (顺便提起一下,正态分布又叫高斯分布)

 

【程劭非的回答(0票)】

自然界中有很多线性分布,而多个独立的相同的线性分布随机的和或者平均就会呈现正态分布,这很普遍。——好吧,其实我说的也是中心极限定理......

【覃鲁的回答(0票)】

自然界的各个现象都取决于很多种随机的因素。而根据中心极限定理,多个随机因素影响的分布呈正态分布,因此如题。这个好像是概率论里面的思考题?

原文地址:知乎

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多