分享

从随机过程到伯努利过程,再从伯努利过程到马尔可夫链

 小元宝爸 2018-10-13

以丢硬币为例。每丢一次硬币,便产生一个随机变量X,那么,我们一次又一次地丢下去,便产生出一系列的随机变量X1、X2……Xi……。一般而言,数学家们将一系列随机变量的集合,称之为“随机过程”。

从随机过程到伯努利过程,再从伯努利过程到马尔可夫链

(丢硬币。图片来自网络)

随机过程中的随机变量Xi,在上例中是第i次投丢硬币的结果,也可以理解为时间ti的“函数”,这也就是称其为“过程”的原因,时间离散的过程,有时也被称为“链”。

丢一次硬币产生一个取值为1或0的随机变量X,接连丢下去产生的(取值1或0)的一系列随机变量的集合,被称为伯努利过程。

伯努利过程也不仅仅用以描述抛硬币的随机过程,掷骰子也可包括在内,可推广到任何由互相独立的随机变量组成的集合,换言之,伯努利过程是一个离散时间,离散取值的随机过程。随机变量的样本空间只有两个取值:成功(1)、或失败(0),成功的概率为p。例如,掷一个6面对称的骰子,如果将“3”出现的概率定为成功的话,则多次掷骰子的结果是一个p=1/6的伯努利过程。

从随机过程到伯努利过程,再从伯努利过程到马尔可夫链

(伯努利。图片来自网络)

马尔可夫链

虽然多次抛硬币也构成随机过程(如上述的伯努利过程),但这种过程比较乏味,因为每次抛的结果都是互相独立的,且正反两面的概率永远是(50%,50%)。即使推广到掷骰子,每一个面出现的概率不是50%了,但仍然是一个固定的数值:1/6。并且,每一次的“抛硬币”或“掷骰子”都是各自独立互不依赖的,这种独立性是构成之前所介绍的“赌徒谬误”之所以是“谬误”的基础。

然而,事实上在自然界以及社会中存在的随机变量之间,往往存在着互相依赖的关系。比如说,考虑明天北京下雨或天晴的可能性,不一定是与抛硬币那样各一半的几率,并且一般来说还与北京今天、昨天、前天……或者好多天之前的气候状况有关。

从随机过程到伯努利过程,再从伯努利过程到马尔可夫链

图3-1-1:典型的马尔可夫过程(简单气象模型)

如果我们不考虑得太复杂,假设明天下雨概率只与今天天气有关的话,便可以用一个如图3-1-1a的简单图形来描述。图3-1-1中表示的气候模型只有简单的 “雨”和“晴” 两种状态,两态之间被数条带箭头的曲线连接。这些连线表示从今天的天气状态,如何预测明天的天气状态。

比如说,从图3-1-1a中的状态“雨”出发有两条连线:结束于状态“晴”的右边那一条标上了“0.6”,意思是说:“今天雨明天晴的概率是60%”;左边曲线绕了一圈又返回“雨”,标识0.4,即“明天继续下雨的概率是40%”。可以类似地理解从状态“晴”出发的两条曲线:如果今天晴那么明天有80%的可能性晴,20%的可能性下雨。随机过程中所有可能状态之集合(雨、晴)构成随机过程的“状态空间”。

上述例子是一个典型的最简单的马尔可夫链,以随机过程开创者,俄罗斯数学家安德烈·马尔可夫(Andreyevich Markov,1856年-1922年)得名。

从随机过程到伯努利过程,再从伯努利过程到马尔可夫链

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多