马尔可夫模型对于理工科的同学来说应该很熟悉了,它可以用来刻画在一组有限状态之间不断转换的系统。马尔可夫模型可以应用于很多领域。我们可以用马尔可夫模型来解释动态现象,例如民主转型、战争升级和药物干预,还可以用于对网页、学术期刊和体育运动队进行排名,甚至可以用来辨别书籍和文章的作者身份。

马尔可夫模型的定义

马尔可夫由一组状态$S$ 和这些状态之间的转移概率构成$P$。每一个状态都可以通过固定的概率转换到另一个状态。

这是一个简单利用文本分析的例子,我们分析这么一句话。

“One fish two fish red fish blue fish”

我们可以来研究前面一个单词以及后面一个单词的转移概率。状态分别是one, two, red, blue, fish, begin, end。 这里one后面一定是fish,fish后面1/4的概率是two、red、blue、end。对于其他单词后面都是固定回到fish,所以概率是1。根据这个模型我们也可以生成“One fish red fish red fish two fish”

当我们获得很多的例子时,我们就可以建立一个比较大的模型,用来生成句子。

马尔可夫模型的应用

如果系统可以通过一系列过渡从任何一个状态转换为任何其他状态,并且不存在简单的循环,那么马尔可夫模型就可以达到唯一的统计均衡。这也叫做佩龙弗罗宾尼斯定理。

在统计均衡中,单个实体可以继续在各种状态之间移动,但是各种状态之间的概率分布仍然是固定的。例如,当一个人处于统计均衡状态时,他在60%的时间内感到高兴,而在40%的时间里感到悲伤。这个人的精神状态可能每小时都会发生变化,但是他在这些精神状态之间的长期分布却不会发生变化。

对于帮助贫困家庭摆脱困境的政策,事实证明,导致社会不平等的那些因素通常不会受到政策干预的影响。马尔可夫模型表明,改变家庭状态的政策干预措施,例如旨在帮助成绩落后的学生的特殊帮扶计划,或者食物募捐活动,只能在短期内带来改善,不会改变长期均衡。相比之下,提供资源和培训,以提高人们保住工作的能力,进而减少失业概率的干预政策则有可能会改变长期结果。当对于系统的状态转移概率进行改变的时候,才可以改变长期均衡。

小结

马尔可夫模型描述了以固定的转移概率在不同状态之间转换的动态系统。根据佩龙弗罗宾尼斯定理,那些试图通过为期只有一两天的活动来激发学生学习兴趣的做法,可能不会产生什么有意义的影响。例如,进入社区“送温暖”、来到公园“捡垃圾”的志愿者也可能无法带来什么长期收益。任何一次性的资金涌入,无论其规模大小,影响都会消失,除非它改变了转移概率。2010年,马克·扎克伯格向新泽西州纽瓦克市的公立学校捐赠了1亿美元,并吸引了不少跟风捐赠者。这种一次性捐赠,尽管摊到每个学生头上达到了大约每人6000美元,但对考试成绩却几乎没有产生任何可衡量的影响。

短期的改变可能会有短期的效果,但是长期来看就又回到了均衡状态。系统性的改变总是很难的,需要持之以恒的改变才能建立新的均衡。