模型思维(6)--合作博弈模型
当人们在进行合作的时候,我们需要对于每个人的贡献进行分析,从而知道哪一个人对于群体的贡献最大,哪一个最小,以此可以作为分配奖励的标准。然而量化分析这个并不容易,因为当不同人组合在一起时,可能就会产生不同的结果。我们介绍几个与此相关的概念来解决这个问题。
合作博弈
合作博弈由一组博弈参与者和一个价值函数组成。价值函数是指在一项多人合作的项目中,每个可能的联盟(子集)所产生的价值。
在合作博弈中,一个参与者的”最后上车者价值“ (last-on-bus-value)是指当他最后一个加入组织所产生的价值。例如,如果一个桌子四个人才能搬动,搬动的价值是10,那么这四个人每个人的最后上车者价值就是10。如果三个人可以搬动,那个第四个人的最后上车者价值就是0。我们可以看出博弈的总价值不是所有参与者的最后上车者价值之和,如果当价值随着参与者增多递减时,最后上车者价值的总和将小于博弈的总价值。
最后上车者价值并不能很好的刻画每个人的贡献度,夏普利值(Shapley value)则可以。一个博弈参与者的夏普利值,等于他在所有可能加入的联盟的次序下对联盟边际贡献的平均值。对于一个$N$个人参与的博弈,一个有$N!$种可能加入的结果,对于某个参与者$i$, 计算在所有次序中当其加入对于整体的边际贡献的平均值。
我们可以用3个程序员合作写代码作为一例子,一个项目有500行需要写。以下是一个人单独做,两个人合作,以及三个人合作产生的结果。其中C可以看作程序员鼓励师,当一个做的时候结果不多,但是合作时可以大大提高两人的合作成果。
合作 | 价值 |
---|---|
A | 100 |
B | 125 |
C | 50 |
AB | 270 |
BC | 350 |
AC | 375 |
ABC | 500 |
3个人合作的话有6种可能
顺序 | A的贡献 | B的贡献 | C的贡献 |
---|---|---|---|
ABC | 100 | 170 | 230 |
ACB | 100 | 125 | 275 |
BAC | 145 | 125 | 230 |
BCA | 150 | 125 | 225 |
CAB | 325 | 125 | 50 |
CBA | 150 | 300 | 50 |
由此我们可以计算每个人的夏普利值,发现
人 | 夏普利值 |
---|---|
A | 970/6 |
B | 970/6 |
C | 1060/6 |
我们可以看出虽然A和B单独一人对于整个项目的贡献是大大多于C的,但是C在合作中对于整体的贡献是多于A和B的,因此应该在奖金分配上比他们俩多。另外我们发现A和B在个人能力上有差别,但是总体对于项目的贡献是一样的。
在生活中,管理者拿的薪水往往比真正干活的人多。一个优秀的管理者懂得如何带动整个团队完成目标,这部分作用是难以替代的。
夏普利值的应用
如果我们把夏普利值应用在投票里,可以得到夏普利舒比克权力指数,反应出每个人对于投票结果的平均贡献。在投票中,如果其取得了关键性的作用,那么可以体现其权利大。
这里举一个例子,假设有A,B,C,D四个政党,控制的席位为
政党 | 席位 |
---|---|
A | 40 |
B | 39 |
C | 11 |
D | 11 |
这里对于四个政党分别进行讨论
- 如果A第一或最后一个加入,那么当剩下三个组成联盟,他都无法成为决定胜负的政党。如果第二或第三则都可以,所以其权力指数是1/2
- 同理,如果B第一或最后一个加入,其也不能增加价值。如果B在第二位加入,只有当第一个是A才能取胜。如果B在第三位加入,只有当A最后加入才能取胜。所以这两种发生的概率和(权力指数)是1/12
- C和D的分析和B相同,其权力指数是1/12
所以我们可以看出虽然B的席位比C和D多,但是其权力并不比C和D大。拥有少数席位的政党往往拥有与之相比更大的权力来决定最后的结果。
小结
这里我们通过一些对于夏普利值的计算明白了在团队合作中,一个人本身的能力并不能很好反应其对于团队的贡献,通过计算其对于团队的边际贡献才可以更好的表现他对于团队的贡献。
当一个团队已经组织好的时候,”最后上车价值“就是一个很好的描述一个人对于团队的贡献。因为当一个人威胁离开时,其可以从组织获取的最大利益就是”最后上车价值“。大公司就通过扩大规模,创造一个具有很高的总价值,但是个人的”最后上车价值“有很低的机构。这样就可以使得公司不会因为为了挽留某一个人而付出太大的代价,这样也使得现有成员的”最后上车价值“趋于0。