前文 前不久写完了《为什么正态分布中有个π》,《姊妹篇:为什么正态分布中会有个e》,这2篇文章吸引了一批读者,他们和我一样都是对正态分布很感兴趣,尤其对正态分布究竟是如何来的困惑也很大。 在之前的基础上,这次继续就正态分布中最后一个字母σ做一下探究。 上篇文章的基础素材——B站笔算推导正态分布的视频中,当几个播主通过分离法得到了微分方程的解后 播主一句就带过了σ的出现: 令C=-1/σ²,然后就得到了 说实话,这种跳跃实在太快了, 我即便按下了暂停键,还是百思不得其解:难道高斯就这么有先见之明,一念之间就把正态分布pdf 的关键参数之一给搞定了? 我相信高斯当初不太可能会这么做。 因此我打算再努把力,把σ到底是如何出现在正态分布中这件事搞明白。 但,这个过程还是需要花些时间和精力的。 于是我继续在B站和知乎搜了一下,发现为数不多的有关正态分布的视频和高赞文章的参考文献,都指向了同一篇来自美国北卡罗来纳州科学与数学学院Dan Teague写的文章《The Normal Distribution: A
derivation from basic principles》。 于是我就按图索骥,找到了这篇文章后,认真地读了起来。 这篇文章是用极坐标系来抽象地描述天文观测时发生的观测误差,后续又通过对极坐标系和笛卡尔坐标系之间做相互转换,并在此基础上结合概率论和微积分对正态分布进行推导的。 最终,我是综合了对B站、知乎、以及Dan Teague文章的理解之后,写完了这关于正态分布几个重要元素介绍的终章。 下面就是介绍σ出现的过程 第一部分,关于x的简单讨论 通常在离散的,所有观测值以相同概率出现时,观测值的算数平均数x的表达式是 而在更一般的情况下,若定义每个观测值有着不同的概率p(x)时,观测值的均值就是以概率p(x)为权重的加权平均数 对于连续型场景,计算式则变成了 这个式子很重要,因为在e-x2为pdf的分布中,xp(x)是个奇函数,因此它的积分是=0 衔接《为什么正态分布中会有个e》的文章最末结论,会得到如下的结论: 那这个结论有什么用呢? 很有用,下面的讨论会用到这个结论。 第二部分 关于σ2的讨论 离散场景下的σ2,也叫做方差,它的计算式如下 这个式子也是有个前提假设,即每个观测误差的平方(实际上也就等价于每个观测值),都是在相同的概率下发生的。 在更一般的情况下,若每个观测误差平方发生的概率不同,那么它的计算式应该变成这样 由此,我们得以获得在连续型场景下,方差的计算式则为 这个时候,我们联系第一部分得到的结论: x=0,方差的计算式就变成了这样 这个式子就大大简化了后续的计算。 此时观察到x2e-x2是一个偶函数,代入之前的计算结果得到 这个时候,作者巧妙地采用了分部积分法对这个积分进行计算。 由于分部积分法是连续求导的逆运算,它的简式如下: 假设u和v都是x的连续可微函数 有了这基础后,再看作者是如何计算的: 在这里,又要遇到到我们的老朋友,e-x2的积分的算法了。具体算法在《为什么正态分布中有个π》中有介绍,这里不再赘述,于是我们继续往下算 利用这结果,很容易得到 当把K的值回代入到文章开头的(1.1)式,就能够解释B站播主那快速的跳跃了。 这样,也就解释了为什么σ会出现在正态分布的公式中了。 这里最后补充下,为什么上面的推导中要令C为一个负数: 感性的说,中世纪虽然科技水平没有现在高,但一个教会训练出来的优秀的天文观测员犯下系统性观测误差的可能性是非常低的。因此,误差分布的pdf
=eCx2中,如果令C是正数的话,那么它就会变成无穷大,这显然是不符合常理的。 如果回到概率论的视角,C如果是正数的话,那么pdf =eCx2就会出现>1的情况,这显然也不符合概率论。 到此,3篇文章联合在一起,就总算将正态分布的pdf 为啥含有π、e、σ这几个要素介绍完了。 第三部分 前文的勘误 我也是这次写作时,才发现上篇文章《为什么正态分布中会有e》中出现的问题,特此修正一下: ……(前文略)经过升维后计算得到 应该改为 |
|