隐马尔科夫模型HMM自学(2)

取自 自然语言处理百科

跳转到: 导航, 搜索
  • 马尔科夫模型也需要改进!

当一个隐士不能通过直接观察天气状态来预测天气时,但他有一些水藻。民间的传说告诉我们水藻的状态与天气有一定的概率关系。也就是说,水藻的状态与天气时紧密相关的。此时,我们就有两组状态:观察状态(水藻的状态)和隐含状态(天气状态)。因此,我们希望得到一个算法可以为隐士通过水藻和马尔科夫过程,在没有直接观察天气的情况下得到天气的变化情况。

更容易理解的一个应用就是语音识别,我们的问题定义就是如何通过给出的语音信号预测出原来的文字信息。在这里,语音信号就是观察状态,识别出的文字就是隐含状态。

这里需要注意的是,在任何一种应用中,观察状态的个数与隐含状态的个数有可能不一样的。下面我们就用隐马尔科夫模型HMM来解决这类问题。

  • HMM

下图是天气例子中两类状态的转移图,我们假设隐状态是由一阶马尔科夫过程描述,因此他们相互连接。

Image:hidden-weather-example.gif

隐状态和观察状态之间的连线表示:在给定的马尔科夫过程中,一个特定的隐状态对应的观察状态的概率。我们同样可以得到一个矩阵:

Image:weather-b-matrix.gif

注意每一行(隐状态对应的所有观察状态)之和为1。

到此,我们可以得到HMM的所有要素:两类状态和三组概率

  • 两类状态:观察状态和隐状态;
  • 三组概率:初始概率、状态转移概率和两态对应概率(confusion matrix)


编者注:隐马尔科夫模型HMM自学系列由崔晓源翻译。

英文原文见:http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html

翻译系列见:http://blogcui.spaces.live.com/blog/cns!46BDB23E24219CE9!144.entry?_c=BlogPart

个人工具
工具箱