隐马尔科夫模型
取自 自然语言处理百科
目录 |
[编辑] 概览
隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。
在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。
[编辑] 经典问题
HMM有三个经典(canonical)问题:
- 已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决.
- 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决.
- 已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Reversed Viterbi算法解决.
另外,最近的一些方法使用Junction tree算法来解决这三个问题。
[编辑] HMM应用
- 语音识别 或 光学字符识别
- 机器翻译
- 生物信息学 和 基因组学
- 还有更多...
[编辑] HMM历史
“隐马尔可夫模型”最初是在20世纪60年代后半期Leonard E. Baum和其它一些作者在一系列的统计学论文中描述的。HMM最初的应用之一是开始于20世纪70年代中期的语音识别。
在20世纪80年代后半期,HMM开始应用到生物序列尤其是DNA的分析中。从那时开始,在生物信息学领域它们已经变得无处不在。

