分享

马尔可夫链导论

 taotao_2016 2020-01-10

什么是马尔可夫链,何时使用它们,以及它们如何工作

马尔可夫链导论

(Generated from )

马尔可夫链是统计随机过程的一种相当普遍且相对简单的方法。 它们已用于许多不同的领域,从文本生成到财务建模。 一个流行的示例是r / SubredditSimulator,它使用Markov链自动为整个subreddit创建内容。 总体而言,马尔可夫链在概念上非常直观,并且易于获得,因为无需使用任何高级统计或数学概念即可实现它们。 它们是开始学习概率建模和数据科学技术的好方法。

情境

首先,我将以一个非常常见的示例来描述它们:

想象一下,天气可能有两种状态:晴天或多云。您始终可以直接观察当前的天气状态,并保证始终是上述两种状态之一。现在,您决定要能够预测明天的天气情况。直观地,您认为此过程存在固有的过渡,因为当前的天气与第二天的天气有关。因此,作为您的专职人员,您收集了几年的天气数据,并计算出阴天后发生晴天的机会为0.25。您还需要注意的是,由于只有两种可能的状态,因此阴天之后发生阴天的可能性必须为0.75。现在,您可以根据当前情况使用此分布来预测未来几天的天气当时的天气状态。

此示例说明了马尔可夫链的许多关键概念。 马尔可夫链本质上由一组过渡组成,这些过渡由某种概率分布确定,满足马尔可夫性质。

观察在该示例中如何仅通过观察从当天到下一天的转换来获得概率分布。 这说明了马尔可夫特性,它是马尔可夫过程的独特特征,使它们无记忆。 这通常会使他们无法成功产生预期会出现某些潜在趋势的序列。 例如,尽管马尔可夫链可能能够根据词频来模仿作者的写作风格,但由于它们是在更长的文本序列上形成的,因此它无法生成包含深层含义或主题意义的文本。 因此,由于它们无法考虑先前状态的完整链,因此它们缺乏产生上下文相关内容的能力。

马尔可夫链导论

A visualization of the weather example

该模型

形式上,马尔可夫链是一个概率自动机。 状态转移的概率分布通常表示为马尔可夫链的转移矩阵。 如果马尔可夫链具有N个可能的状态,则矩阵将是N x N矩阵,因此条目(I,J)是从状态I转换为状态J的概率。此外,转换矩阵必须是随机矩阵, 一个矩阵,其每一行中的项之和必须恰好为1。这很有意义,因为每一行代表其自己的概率分布。

马尔可夫链导论

General view of a sample Markov chain, with states as circles, and edges as transitions

马尔可夫链导论

Sample transition matrix with 3 possible states

另外,马尔可夫链还具有一个初始状态向量,表示为N x 1矩阵(向量),它描述了从N个可能状态中的每个状态开始的概率分布。 向量的条目I描述了链从状态I开始的概率。

马尔可夫链导论

Initial State Vector with 4 possible states

这两个实体通常是表示马尔可夫链所需的全部。

现在,我们知道如何获得从一种状态过渡到另一种状态的机会,但是如何找到在多个步骤中发生这种过渡的机会呢? 为了对此进行形式化,我们现在要确定经过M步从状态I转移到状态J的概率。 事实证明,这实际上非常简单。 给定一个转换矩阵P,可以通过计算将P提高到M的幂获得的矩阵的项(I,J)的值来确定。对于M的较小值,可以轻松地通过手动乘法来完成 。 但是,对于较大的M值,如果您熟悉简单的线性代数,将矩阵求幂的更有效方法是首先对角矩阵。

结论

既然您已经了解了马尔可夫链的基础知识,那么您现在应该能够轻松地以您选择的语言来实现它们。 如果编码不是您的专长,那么还可以使用马尔可夫链和马尔可夫过程的许多更高级的属性。 我认为,沿着理论路线的自然发展将是向隐马尔可夫过程或MCMC迈进。 简单的马尔可夫链是其他更复杂的建模技术的基石,因此,借助此知识,您现在可以进入主题内的各种技术,例如信念建模和抽样。

(本文翻译自Devin Soni的文章《Introduction to Markov Chains》,参考:https:///introduction-to-markov-chains-50da3645a50d)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多