隐markov模型的em学习算法(附件)【字数:7351】
目录
第一章 绪论 1
1.1 研究背景 1
1.2本文的主要内容 2
第二章 隐马尔科夫模型的可更新EM算法 3
2.1简介隐马尔可夫模型 3
2.2简介EM算法 4
2.3隐马尔科夫模型的可更新EM算法 5
2.3.1 模型和符号 5
2.3.2 平滑的递归形式 7
2.3.3 可更新的EM 算法 8
2.4 讨论 9
2.4.1与Mongillo and Denève (2008)[7]的算法比较 10
2.4.2执行和数值的复杂性 11
2.5 收敛的一些结果 12
结语 16
致谢 17
参考文献 18
第一章 绪论
1.1 研究背景
隐马尔可夫模型是统计时间序列分析的一个重要概念,在最近的四十年里,它的实际影响很广泛。隐马尔科夫模型(HMMs)在其经典形式(即,当状态变量是有限值)是足以简单的给予有效的推理程序,同时允许各种实际有用的建模。自从Baum and Eagon(1967)[1],以及Baum er al.(1970)[2],的开拓性贡献, EM(最大期望)算法已经成为HMMs参数推理的选择方法。EM算法是一种专用的数值优化程序,旨在最大化(对数)一批观测似然。由于其稳健性和易于实施,往往把
*51今日免费论文网|www.jxszl.com +Q: ¥351916072$
它作为首选。这种作用是专门为HMM模型的参数更新估计,在现有的观测只扫描一次,不存储,允许连续相适应的参数在一个潜在的无限数据流。HMM模型的情况下,更新参数估计是一个具有挑战性的任务,由于观测值之间的并非简单依赖。目前所提出的具有创在性的EM方法已是基于所需的平滑计算的有限记忆近似(Krishnamurthy and Moore,1993[3])或者对数据的对数似然本身有限的记忆近似(Rydén,1997[4])。另一种是使用基于梯度的方法(Le Gland and Meve l,1997[5]),这种方法不直接遵循EM算法。Kantas et al. (2009)[6]提供一个全面的最近审查这些方法,其中包括更先进的方面的模型,需要使用模拟为基础的方法。Mongullo and Denève (2008)[7]最近提出了在状态和观察取有限值的情况下基于HMMs的可更新EM算法。该算法的主要成分是一个递归,这个算法允许EM算法所要求的平滑函数中的递归计算。然而,这个递归似乎是非常具体的,对于HMMs模型更一般类型的应用潜力Mongullo and Denève (2008)[7]并没与指出。
隐马尔可夫模型是同时包含了隐状态和观测值的随机过程模型。其中一个具有马尔可夫性质,但是无法观测到。而另外一个可观测到的,通过输出概率分布和隐过程联系起来。隐过程为离散时间有限状态马尔可夫链的隐马尔可夫模型是其中的一个重要分支。为了便于讨论的进行,通常会对模型进行两个 假设。一,马尔可夫链的时间齐次性;二,观测值在已知对应时刻隐状态的条 件下是相互独立的。在这样的假设之下模型的参数便包含了两部分:马尔可夫链的转移概率矩阵、观测值的输出概率。由于隐状态无法观测到,所以似然函数只能够通过观测值进行计算。隐马尔可夫模型的参数估计一般采用EM算法。 EM算法是对有隐变量的模型计算其极大似然估计的迭代算法。每次迭代包括两个步骤:E步(Expectation)和M步(Maximization)计算在观测值和现有参数估计之下对数似然函数的条件期望,M步则寻找参数使在E步中计算出的条件期望 达到最大,得到的新参数将使用在下一次迭代的E步中。如此求到的参数估计实 际上是参数的局部极大似然估计。EM算法虽然收敛的速度较慢,但是在计算上便于实现。M步的优化结果在某些分布假设下可以得到显式表达。
然而EM算法是一个不便于参数估计更新的算法。即当新的观测值产生时, 为了对参数估计进行更新,EM算法必须对所有数据重新进行迭代计算。这会大大的增加计算量,降低效率。在对高频数据进行建模的过程中,EM算法的这个缺陷将会带来极大的不便。另一方面,如果数据在录入之后无法单独存储下来,那么EM算法将无法对参数估计进行更新。近年来,许多学者为构造可更新 的EM算法做出了贡献。Cappé(2011)[8]在假设马尔可夫链转移概率和观测值输 出概率均服从指数族分布的假设下,利用充分统计量的迭代更新构造出了一个可更新的EM算法。
1.2本文的主要内容
本文组织如下:从第二章开始我们开始分小结简单介绍隐马尔科夫模型以及EM算法,最后专门讨论隐马尔科夫模型的可更新EM算法,特别是,它与以前所提出的理论数值复杂的关联性,还包含有关该方法的收敛性的初步结果。
第二章 隐马尔科夫模型的可更新EM算法
2.1简介隐马尔可夫模型
隐马尔科夫模型是一个包含了两个随机过程的模型。其中隐状态具有马尔可夫性质,记作。另外随机过程是可观测的,记作,其概率分布由马尔可夫过程决定,称作输出概率分布。下面以隐状态时一阶时齐马尔可夫链,且隐状态和观测值都是有限取值的情况为例,对隐马尔科夫模型进行进一步的介绍。此时模型参数如下:
,隐状态个数,隐状态取值为
,观测值个数,观测值取值为
,隐状态的转移概率矩阵,
原文链接:http://www.jxszl.com/jsj/sxtj/78216.html