机器学习:马尔可夫模型
考虑一组随机变量序列XX0X1XtXX0X1Xt,其中XtX_{t}Xt表示时刻ttt的随机变量,并且每个随机变量XtX_{t}Xt的取值集合相同,称为状态空间SSS。SSS可以是离散的,也可以是连续的。假设在时刻000的随机变量X0X_{0}X0遵循概率分布PX0π0PX0π0, 即为初始状态分布。若某个时刻t≥1t\ge1t≥1的随机变量XtX_{t}Xt。
后续遇到合适的案例会再补充
1 马尔可夫模型
马尔可夫模型(Markov Model, MM)是一种统计模型,广泛应用在自然语言处理等领域中。
1.1 数学定义
考虑一组随机变量序列X={X0,X1,…,Xt,… }X=\{X_{0},X_{1},\dots,X_{t},\dots\}X={X0,X1,…,Xt,…},其中XtX_{t}Xt表示时刻ttt的随机变量,并且每个随机变量XtX_{t}Xt的取值集合相同,称为状态空间SSS。SSS可以是离散的,也可以是连续的。
假设在时刻000的随机变量X0X_{0}X0遵循概率分布P(X0)=π(0)P(X_{0})=\pi(0)P(X0)=π(0), 即为初始状态分布。若某个时刻t≥1t\ge1t≥1的随机变量XtX_{t}Xt与前一个时刻的随机变量Xt−1X_{t-1}Xt−1之间有条件分布F(Xt∣Xt−1)F(X_{t}|X_{t-1})F(Xt∣Xt−1),并且XtX_{t}Xt只依赖于Xt−1X_{t-1}Xt−1,而不依赖于过去的随机变量(X0,X1,…,Xt−2)(X_{0},X_{1},\dots,X_{t-2})(X0,X1,…,Xt−2),则XXX具有马尔可夫性质,称为马尔科夫链。即P(Xt∣X0,X1,…,Xt−1)=P(Xt∣Xt−1),t=1,2,…P(X_{t}|X_{0},X_{1},\dots,X_{t-1})=P(X_{t}|X_{t-1}),t=1,2,\dotsP(Xt∣X0,X1,…,Xt−1)=P(Xt∣Xt−1),t=1,2,…其中,P(Xt∣Xt−1)P(X_{t}|X_{t-1})P(Xt∣Xt−1)称为马尔科夫链的转移概率分布。
另外,若条件转移概率分布与时间ttt无关,则称为时间齐次的马尔可夫链。即P(Xt+s∣Xt+s−1)=P(Xt∣Xt+1)P(X_{t+s}|X_{t+s-1})=P(X_{t}|X_{t+1})P(Xt+s∣Xt+s−1)=P(Xt∣Xt+1) 若某个时刻t≥1t\ge1t≥1的随机变量XtX_{t}Xt与前nnn个状态相关,则称为nnn阶马尔可夫链。即P(Xt∣X0…Xt−1)=P(Xt∣Xt−nXt−n+1…Xt−1)P(X_{t}|X_{0}\dots X_{t-1})=P(X_{t}|X_{t-n}X_{t-n+1}\dots X_{t-1})P(Xt∣X0…Xt−1)=P(Xt∣Xt−nXt−n+1…Xt−1)
除了马尔可夫性外,马尔可夫链还可能具有不可约性、常返性、周期性和遍历性。
1.2 两种马尔可夫链
1.2.1 离散马尔可夫链
如果上述随机变量Xt(t=0,1,2,…,)X_{t}(t=0,1,2,\dots,)Xt(t=0,1,2,…,)是定义在离散空间SSS中,则称为离散马尔可夫链,其转移概率分布可以用矩阵表示。若S={1,2,…,n}S=\{1,2,\dots,n\}S={1,2,…,n}则转移概率分布矩阵为:P=[p11p12…p1np21p22…p2n⋮⋮⋯⋮pn1pn2…pnn](1) P=\begin{bmatrix} p_{11} & p_{12} & \dots & p_{1n} \\ p_{21} & p_{22} & \dots & p_{2n} \\ \vdots & \vdots & \cdots & \vdots \\ p_{n1} & p_{n2} & \dots & p_{nn} \end{bmatrix} \tag{1} P=
p11p21⋮pn1p12p22⋮pn2……⋯…p1np2n⋮pnn
(1)其中pij=P(Xt=i∣Xt−1=j)p_{ij}=P(X_{t}=i|X_{t-1}=j)pij=P(Xt=i∣Xt−1=j)为马尔可夫链在t−1t-1t−1时刻从状态jjj转移到时刻ttt的状态iii的概率。pij≥0p_{ij} \ge 0pij≥0且∑ipij=1\sum_{i}p_{ij}=1∑ipij=1。
马尔可夫链在任意时刻ttt的状态分布,可以由在时刻t−1t-1t−1的状态分布及转移概率分布决定,即π(t)=Pπ(t−1)=P⋅Pπ(t−2)\pi(t)=P\pi(t-1)=P\cdot P\pi(t-2)π(t)=Pπ(t−1)=P⋅Pπ(t−2)。依次类推π(t)=Ptπ(0)\pi(t)=P^{t}\pi(0)π(t)=Ptπ(0)
1.2.2 连续马尔可夫链
如果状态空间SSS定义在连续空间,则序列XXX称为连续马尔可夫链。则转移概率分布由概率转移核函数来表示。对任意的x∈S,A∈S)x\in S, A\in S)x∈S,A∈S), 转移概率P(x,A)=∫Ap(x,y)dyP(x,A)=\int_{A} p(x,y)dyP(x,A)=∫Ap(x,y)dy
参考资料
- 《统计学习方法》

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)