博弈论是研究面对不同情况如何进行对策的科学,在这一篇中将简单的介绍两种博弈形式。

零和博弈

在零和博弈中,每个参与者选择一个行动,并根据自己的行动和对手的行动获得一定的收益,双方的收益总和为0。

例如下图这个两个人选硬币正反的博弈,如果两人的选择结果相同,一个玩家获胜,如果不同那么另一个玩家获胜。

提到决策策略,那么就要提到纳什均衡了。这个是指有一种策略,它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。在这个游戏中,存在一个唯一的均衡策略,那就是,两个博弈参与者都以相同的概率在两个行动之间进行随机化。如果行博弈参与者以1/2的概率选择正面朝上、1/2的概率选择背面朝上,无论他的选择到底是什么,列博弈参与者的收益都为零。正因为如此,随机化是列博弈参与者的最优策略。根据对称性,随机化也是列博弈参与者的最佳选择。

其实这也可以应用在我们玩的石头剪刀布上,如果我们不是随机选择的话,那么任何非随机性都可能会被对手利用。

序贯博弈

在序贯博弈中,博弈参与者按照某个特定的顺序采取行动。由此,可以用一棵博弈树(gametree)来表示一个序贯博弈。博弈树由节点和边组成,每个节点对应于博弈参与者必须采取行动的时刻,该节点的每条边分别表示可以采取的某个行动。在博弈树最末尾的分支上,我们写下相应行动路径的收益。

在市场进入博弈中,有两个博弈参与者:拟进入者和现有企业。如果拟进入者选择不进入市场(博弈树的左侧分支),那么它的收益为零,现有企业的收益为5。如果拟进入者决定进入市场,那么现有企业必须做出选择:是接受新进入者,同时自己的收益从5下降为2,还是发动与新进入者的商战,但这会导致自己的收益变为零,同时令新进入者的收益为负。之所以假设这种情况下新进入者的收益为负,因为它必须为进入市场付出一定的成本。

在序贯博弈中,可以选择子博弈完美均衡来做选择。运用逆向归纳法来求解子博弈均衡:从最末端的节点开始,并在每个节点处选择最优行动。然后沿着博弈树逆向倒推,假设每个博弈参与者会在给定另一个博弈参与者在后续节点上的行动时选择最优行动。例如,在市场进入博弈中,我们从现有企业的末端节点开始推导。它有一个最优行动,即接受对方进入。然后移动到博弈树上面的节点,不难发现拟进入者的最优策略是进入。

小结

博弈论在我们的生活中方方面面,美国总统大选其实就是一种零和博弈,只有一个人会取得最后的胜利。许多个人行动和政策选择至少在一个方面是零和的,我们每天只有这么多的时间可用,这么多钱可花,这么多资源可分配。在这个维度上的零和行动,在另一个维度上可能不是零和的。例如,重新安排预算,在货币的总量这个维度上是零和的,但是就人的幸福感或满足程度这个维度而言,却可能是正和的或负和的。

序贯博弈给我们的建议就是多往前想几步,之后回过头来看如何做出最好的决策。