隐马尔科夫模型

取自 自然语言处理百科

跳转到: 导航, 搜索

目录

[编辑] 概览

隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。

[编辑] 经典问题

HMM有三个经典(canonical)问题:

  • 已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决.
  • 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决.
  • 已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Reversed Viterbi算法解决.

另外,最近的一些方法使用Junction tree算法来解决这三个问题。

[编辑] HMM应用

  • 语音识别 或 光学字符识别
  • 机器翻译
  • 生物信息学 和 基因组学
  • 还有更多...

[编辑] HMM历史

“隐马尔可夫模型”最初是在20世纪60年代后半期Leonard E. Baum和其它一些作者在一系列的统计学论文中描述的。HMM最初的应用之一是开始于20世纪70年代中期的语音识别。

在20世纪80年代后半期,HMM开始应用到生物序列尤其是DNA的分析中。从那时开始,在生物信息学领域它们已经变得无处不在。

[编辑] 相关文章

个人工具
工具箱