条件随机场(CRF或CRFs)与隐马尔科夫模型有着千丝万缕的联系。为了理解CRF,这里先简单说一下马尔科夫链(MC, Markov Chain)和隐马尔科夫模型。
1.1 马尔科夫链
马尔科夫链是指具有马尔可夫性质且存在于离散指数集合状态空间内的随机过程。那么什么是马尔科夫性质呢?
从定义上来说,当一个随机过程在给定现在状态及过去所有状态的情况下,其未来状态的条件概率分布仅依赖于当前状态;换句话说,在给定现在状态时,其过去状态(即该过程的历史路径)是条件独立的。
这个表述比较抽象,我们举个马尔科夫链的例子理解一下:
比如有一只蚂蚁在下图所示的网格内爬行(网格区域无限大),由于墙壁的存在,它只能向前、后、左、右四个防线之一前进,每次前进一步。假设蚂蚁从位置S开始,那么在给定前n步的选择后,当前蚂蚁的所在位置就是知道的(假设在红色点处);那么下一步依然是四个方向之一,即下一步的状态仅依赖与当前状态,且选择随机。同时,之前走过的每一步之间是条件独立的,即上一步走的方向不会影响这一步的方向。
由于存在的选择只有四个,即选择离散,所以我们称这个过程为马尔科夫链。当选择连续时,称为马尔科夫过程(Markov Process)。