1、高斯分布 高斯分布是最常见的分布,我现在觉得高斯分布中最难的就是,如何说服别人,你假设某个分布是高斯,是有依据的,而不是一个所谓的“经验假设”。 高斯分布的概率密度函数为: 各种各样的心理学测试分数、各种各样的无力现象、测量误差等都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的, 但是理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布。 由正态分布还可以到处一些常见的分布:
2、伯努利分布(又称:两点分布,0-1分布) 均值为p,方差为p(1-p). 这是为纪念瑞士科学家伯努利而命名的,猜测应该与伯努利本人没有太大关系吧,哈哈。
3、二项分布 进行独立的n次伯努利实验得到。均值为np,方差为np(1-p)。 与高斯分布的关系:当n足够大时,且p不接近于0或1,则二项分布近似为高斯分布,且n越大越近似。
4、多项分布 与二项分布对应,每次独立事件会出现3个及3个以上可能值。 二项分布和多项分布的概率值都可以经过计算多项式(x1+x2)^n 和多项式(x1+x2+...+xm)^n的通项得到,对于二项分布,此时的x1=p,x2=1-p。
5、泊松分布 参考资料:http://zh./wiki/%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83 泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。 概率质量函数为:(区分概率质量函数和概率密度函数,概率质量函数-离散,是概率值;概率密度-连续,不是概率值) 泊松分布的期望和方差均为lemta。 与二项分布的关系:当二项分布的p趋近于0,np固定,或np至少趋近固定时,事件在某个事件间隔内发生的次数,就可以用泊松分布近似。这个关系可以用严格的数学语言证明。 泊松分布的最大似然估计:给定n个样本值ki,希望得到从中推测出总体的泊松分布参数λ的估计。最大化似然概率得到的参数为: 6、指数分布 参考:http://zh./wiki/%E6%8C%87%E6%95%B0%E5%88%86%E5%B8%83 指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。 指数分布的概率密度函数为, 指数分布的重要特性是无记忆性。它表示随机变量的概率只与时间间隔有关,而与时间起点无关。数学语言表达为: ![]() 7 、其他 伽马分布, 伽玛分布(Gamma distribution)是统计学的一种连续概率函数。Gamma分布中的参数α,称为形状参数(shape parameter),β称为尺度参数(scale parameter)。在实验中,它模拟假设随机变量X为 等到第α件事发生所需之等候时间。α,β是两个分布调整参量,该分布的期望=C+(α/β),也就是说α/β调整期望;分布的方差=α/β^2,由此并不需要单独定义二者,共同对分布起作用。 β分布 是伽玛函数,贝塔分布的一个重要应该是作为伯努利分布和二项式分布的共轭先验分布出现,在机器学习和数理统计学中有重要应用。贝塔分布中的参数可以理解为伪计数,伯努利分布的似然函数可以表示为,表示一次事件发生的概率,它为贝塔有相同的形式,因此可以用贝塔分布作为其先验分布。 狄利克莱分布 以上所有分布,都属于指数分布族。 |
|
来自: 昵称15459877 > 《概率分布》