分享

陈童 | 概率论、费曼图以及随机矩阵理论(一): 中心极限定理与随机游走

 Naz摘星星 2022-04-24

作者介绍:

中国科学院高能物理研究所 理论物理博士
东华理工大学  教师

中心极限定理可以说是概率论中最为重要的定理之一。它解决的是N个独立随机变量的和在N很大时的概率分布问题。中心极限定理说,不管什么随机变量,在满足一些合理的条件以后这样的概率  分布一定会趋向于一个高斯分布。这样一个普适性的结果是非常令人吃惊的,它首次揭示了系统在大N极限下可能会展现出普遍性的规律。这在整个数学和物理学上都影响深远。我们这里主要讨论这个重要结果的数学证明。为简单起见,这里我们将仅仅处理N个独立同分布随机变量的情形。




1

高尔顿钉板实验


英国生物统计学家高尔顿是达尔文的表弟,高尔顿钉板实验是他设计来直观演示中心极限定理的。
高尔顿在木板上钉了很多钉子,这些钉子分成了N层,每一层的相邻两颗钉子之间间距相等,上一层钉子的水平位置都恰好落在下一层的相邻两颗钉子正中间。在实验时,从上方放入一个小圆球,小圆球的直径小于任意两颗钉子之间的几何距离,但是大于相邻两  层钉子之间的水平距离。因此,小圆球在下落的过程中总会碰到钉子,它碰到钉子以后可以往左边滚下来,也可以往右边滚下来,概率均为1/2。然后再碰到下一层的钉子,又以1/2的概率往左滚或往右滚,如此不断进行下去,直到经过N层钉子以后,小圆球最终会落到下方的格子中。
在第i层,小圆球往左滚还是往右滚是随机的,往右滚则它的水平位移增加1,往左滚则减少1,我们可以定义小圆球在第i层的水平位移为随机变量Xi, 小圆球往右滚Xi= 1,往左滚则Xi= 1。很显然,经过N层钉子以后,小圆球最终会落在哪个方格子中由总水平位移X= X1+ X2+ ... + XN决定。X当然也是一个随机变量,它的分布情况可以通过将实验重复很多很多次,然后统计下方各格子中小圆球的数目,由这个数目的分布情况反映出来。
网上有这个实验的视频,从视频中可以清楚地看到,最终小圆球的数目分布趋向于一个正态分布(当N很大时),因此也就是说,随机变量X最终趋向于一个正态分布。这就是中心极限定理的一个最直观例子。下面我们开始讨论中心极限定理的证明。



2

随机变量的特征


在证明中心极限定理之前,我们先简单地讨论一个有用的数学概念,即一个随机变量的特征。假设有一个随机变量X,其概率分布为p(x),则X的特征(k)定义为

很显然,(0)=1。更一般的,(k)在0处关于ik泰勒展开的n阶项系

数就是随机变量Xn极矩MnMn==,即


一个更有用的概念是所谓的累积量(cumulants),我们这里也称之为 集团n极矩Kn,它由下式给出


n极矩和集团n极矩的两个定义式子可以得出


实际上,如果我们将Km表示成一个m个点的集团,然后将任意n点完全分解成一些这样的集团,那么Mn就可以看成是n个点所有可能集团分解的和,如图(1)所示。很明显,(1)中的图形正好对应等式(4)。其实,K1= M1=就是通常所说的平均值,我们也记为µK2 = M2 M1 2 = 就是我们通常所说的方差σ2。因此,根据累积量,或者说集团n极矩的定义,我们有

Figure 1: 图中每一个未被圈起来的单独黑点自身是一个单点集团, 每一个被虚线圈起来的多点是一个多点集团。




3

中心极限定理的证明与随机游走


假设有N 个独立的随机变量Xi, i = 1, 2, ..., N ,每一个的概率分布都是同一个函数p(xi), 其平均值为µ, 方差为σ2。这里我们以小写的xi来表示随机变量Xi的取值。则随机变量X = Xi的概率分布q(x)可以表示成,


这就证明了中心极限定理。从最终结果我们可以看到随机变量X的平均值为, 而方差为2

下面我们给出中心极限定理的一个简单解释。假设我们考虑一个醉汉在x轴上随机游走,我们将上文的随机变量Xi看成是醉汉第i步这一步所产生的位移,由于这是一个醉汉,因此这个位移是随机变量。µ就是醉汉平均每一步前进的距离。那么随机变量X就是醉汉在N 步中的总位移,中心极限定理告诉我们,在N 很大时,这个总位移趋向于一个高斯分布,这个高斯分布的方差是2

关于方差的这个结果其实可以用下面的方法容易地得到,下面为了简单起见我们不妨假设醉汉醉得很厉害,以致于µ = 0。我们记醉汉在i步中的总位移为X(i), 显然

将这个式子进行递推就可以得到我们需要的结论。当然,从这个推导可以看出,关于方差的这个结果不需要大N 极限,这一点也可以从我们在上文中那个更加数学化的证明方法中看出来。实际上,只有最终的分布是一个高斯分布这一点才是依赖于大N 极限的。



中心极限定理可以说是概率论中最为重要的定理之一。它解决的是N个独立随机变量的和在N很大时的概率分布问题。中心极限定理说,不管什么随机变量,在满足一些合理的条件以后这样的概率分布一定会趋向于一个高斯分布。这样一个普适性的结果是非常令人吃惊的,它首次揭示了系统在大N极限下可能会展现出普遍性的规律。这在整个数学和物理学上都影响深远。我们这里主要讨论这个重要结果的数学证明。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多