分享

计算概率分布

 东东Wr 2018-06-08

数据搜集以后,数据分析的第一步是什么?没有别的,就是计算概率,准确而言就是计算概率分布。你收集的数据,先把样本的概率分布计算出来,然后根据样本数据概率分布,估算总体概率分布。一般就是这样子,这是计算总体概率分布的一个方法,它的一个理论依据,也就是我们之前说的实验法。

一般而言。我们要认识清楚某个领域,那么就要大量搜集这个领域的数据,数据样本个数不能过少,过少的话,看不出它的分布出来。比如说,我们想认识一下抛硬币的统计规律,那么就抛它100下,如果抛一下,如果我们发现正面朝上,于是,就认为正面朝上概率是1,反面朝上概率是0,显然不科学。而如果大量抛,抛100下,基本上就可以把其概率分布情况估算出来了。我们要认识某个人什么样子,你交往一次两次,一天两天,是摸不透他的,就像抛硬币抛个一次两次,概率分布展现不出来,得达到一定的样本数才可以。一般的随机变量,我们需要多大样本呢?100个就差不多了。

当然,这都是用历史数据样本估算,统计推断总体的概率分布,这是一个方法,我们称之为实验法。还有一个逻辑法。比如抛硬币它的概率分布,完全可以逻辑法直接推导出来,正面概率0.5,反面概率0.5.不管用什么方法,我们认识某个事物某个随机变量的第一步就是计算它的概率分布情况。而计算概率分布的方法,一般就是历史数据估算法和逻辑数学计算法。历史数据估算的时候,样本不要太少,而且样本要均匀抽取,具有代表性。当然,也没有必要太多,有些其实一个样本就够了,具体还要看你要分析什么样随机变量的概率分布。

当我们把随机变量的概率分布计算出来以后,然后再进行其他的一些统计分析,比如说回归分析啊,因子分析啊,方差分析啊什么的。概率分布分析是第一步,它能够让我们对随机变量的整体情况有一个整体的了解。在这个基础之上,再去分析它的其他的一些统计规律。首先就是要把概率分布这个统计规律找出来。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多