「机器学习」概率图模型之隐马尔可夫模型

新用户49272060 2022-07-24 发布于广东

展开全文

1.从马尔科夫链到隐马尔科夫模型

隐马尔科夫模型，他的英文全称是Hidden Markov Model，也就是我们经常看到的HMM模型。隐马尔科夫模型是一种统计模型，他广泛的应用在语音识别、词性自动标注、概率文法等自然语言处理的各个应用领域。

如果我们对马尔科夫链已经了解的话，这里谈到的隐马尔科夫模型与他在名称上可以说是非常接近。其关键差异就在于一个“隐”字，在这个模型中，他首先由一个隐藏的马尔科夫链随机生成一个状态随机序列，再由状态随机序列中的每一个状态对应生成各自的观测，由这些观测组成一个观测随机序列。因此，隐马尔科夫模型中其实伴随着两条“线”，一个是观测随机序列这条“明线”，另一个是隐藏着的状态随机序列这条“暗线”。

2.典型实例：盒子摸球实验

当然，为了更清晰的说明问题，我们举几个生活中实际的例子，作为我们介绍隐马尔科夫模型的引子，让大家更为直观的了解隐马尔科夫模型的组成和要点。

第一个例子是一个耳熟能详的例子：盒子摸球实验。

我们有3个盒子，编号分别为1号盒子，2号盒子，3号盒子，每个盒子里都装着个数不等的黑球和白球，具体情况如下面描述所示：

1号盒子：黑球2个，白球8个 2号盒子：黑球6个，白球4个 3号盒子：黑球4个，白球6个

在这个例子中，整个实验的过程是这样的：

每次先随机出现一个盒子，然后我们从随机出现的盒子中随机摸出一个球，并且记录下球的颜色，最后把球放回盒子。下一次再随机出现一个盒子，我们同样的去摸球并记录球的颜色，我们一边梳理这个过程，一边来系统介绍隐马尔科夫模型中的专业术语。

在试验过程中，我们只能在每次摸出球之后看到被摸出的球的颜色，但无法知道每次随机出现的盒子的编号，这是我们要明确的一个大的前提背景。

因此，随着试验的进行，会依次出现不同编号的盒子，这个盒子的序列就是我们的状态序列，由于我们始终无法观测到盒子的编号，因此也就是一条隐藏的暗线，也称隐含状态序列。而由于我们最终能够观察到的是球的颜色，因此球的颜色序列就是我们的观测序列，也就是我们的明线。例如，试验重复进行7次，其中一种可能的观测序列为： {黑，黑，白，白，白，黑，黑}。

而在整个过程中，我们假定每次盒子随机出现的过程是一个马尔科夫过程，状态集合为 {盒子1，盒子2，盒子3}，。同时，第一次各个盒子出现所满足的概率分布如下：

1号盒子出现的概率：0.3 2号盒子出现的概率：0.5 3号盒子出现的概率：0.2

我们用表示初始状态的概率向量

：，这样我们就拿到了状态的初始概率分布。

同时各个盒子之间相互转换的概率转移图如下图所示：

从上面这幅图中，我们可以提炼出三个盒子随机出现的马尔科夫过程状态转移概率矩阵，将其记作是：。

结合我们之前介绍过的马尔科夫链的基本知识，对上述矩阵进行解释是一件非常简单的事：如果某一次随机出现的盒子是2号盒子，那么下一次随机出现的盒子是1号盒子的概率是0.3，是2号盒子的概率是0.2，是3号盒子的概率是0.5。

那么实验中隐藏的状态序列，也就是三个盒子随机出现的过程我们就讲清楚了，紧接着是从盒子中摸球的过程，比如在1号盒子当中：黑球2个，白球8个，采用的是放回式的摸球试验，这就是最简单的古典概型，因此从1号盒子中摸出黑球的概率：0.2，摸出白球的概率是0.8，也就是所谓的观测概率，也叫输出概率，他是从特定的隐含状态当中生成指定观测的概率。

同样的，我们还可以一起把2号盒子和3号盒子的观测概率都集中在一起，放在同一个矩阵当中，就得到了另一个重要的矩阵：观测概率矩阵。在这其中，观测集合 {黑球，白球}，。