模型思维(17)--博弈论模型

博弈论是研究面对不同情况如何进行对策的科学,在这一篇中将简单的介绍两种博弈形式。 零和博弈 在零和博弈中,每个参与者选择一个行动,并根据自己的行动和对手的行动获得一定的收益,双方的收益总和为0。 例如下图这个两个人选硬币正反的博弈,如果两人的选择结果相同,一个玩家获胜,如果不同那么另一个玩家获胜。 提到决策策略,那么就要提到纳什均衡了。这个是指有一种策略,它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。在这个游戏中,存在一个唯一的均衡策略,那就是,两个博弈参与者都以相同的概率在两个行动之间进行随机化。如果行博弈参与者以1/2的概率选择正面朝上、1/2的概率选择背面朝上,无论他的选择到底是什么,列博弈参与者的收益都为零。正因为如此,随机化是列博弈参与者的最优策略。根据对称性,随机化也是列博弈参与者的最佳选择。 其实这也可以应用在我们玩的石头剪刀布上,如果我们不是随机选择的话,那么任何非随机性都可能会被对手利用。 序贯博弈 在序贯博弈中,博弈参与者按照某个特定的顺序采取行动。由此,可以用一棵博弈树(gametree)来表示一个序贯博弈。博弈树由节点和边组成,每个节点对应于博弈参与者必须采取行动的时刻,该节点的每条边分别表示可以采取的某个行动。在博弈树最末尾的分支上,我们写下相应行动路径的收益。 在市场进入博弈中,有两个博弈参与者:拟进入者和现有企业。如果拟进入者选择不进入市场(博弈树的左侧分支),那么它的收益为零,现有企业的收益为5。如果拟进入者决定进入市场,那么现有企业必须做出选择:是接受新进入者,同时自己的收益从5下降为2,还是发动与新进入者的商战,但这会导致自己的收益变为零,同时令新进入者的收益为负。之所以假设这种情况下新进入者的收益为负,因为它必须为进入市场付出一定的成本。 在序贯博弈中,可以选择子博弈完美均衡来做选择。运用逆向归纳法来求解子博弈均衡:从最末端的节点开始,并在每个节点处选择最优行动。然后沿着博弈树逆向倒推,假设每个博弈参与者会在给定另一个博弈参与者在后续节点上的行动时选择最优行动。例如,在市场进入博弈中,我们从现有企业的末端节点开始推导。它有一个最优行动,即接受对方进入。然后移动到博弈树上面的节点,不难发现拟进入者的最优策略是进入。……

阅读全文

Coursera 幸福课 (3)

在这一篇中我们将讨论一些可以让你变得快乐的方法 重新思考美好的东西 在前面我们提到,我们误以为美好的东西,类似好工作,好成绩,美好的身体可以让我们更开心。但其实当我们拥有的时间越长,我们越容易适应他,也就不会开心了。 所以为了避免这一点,我们可以投资在经历之中,例如旅行、冒险、看电影等等。人们也对此做了实验,发现当人们花钱在体验上,在后来回想以及在认为花钱值不值时,都比花钱在物质上快乐。 当我们在体验过之后,在和其他人讲的时候也更容易得到共鸣,让我们更加快乐。同时体验的经历不好做社会比较。在一个测试中,让朋友听被试关于体验服务消费跟实物消费,之后让他们评价对那个人的总体印象。可以看到结果,其他人对于体验消费的评价比实物消费更好,认为其心理素质也更高。 体验的经历在和别人聊天时也可以让其他人更快乐,有时这种体验能带动别人的情绪。 一些策略:阻挠自己的适应 品味生活(savoring):在经历之外去回看和感激。 可以做的事情: 和其他人将自己感觉很好 和其他人分享自己的快乐 想自己是多么幸运 只在意当下 不要做的事情 专注于未来 提醒自己这个快乐的事情很快会结束 想怎么让这件事更好 告诉自己不值得这个好的事情 否定的可视化(negative visualization):不好的事发生会怎么样 例如:夫妻想想如果他们没有相遇生活会有哪些不同 如果没有得到大学的录取自己现在的生活会如何 把今天当做自己最后一天 当人们意识到自己临近毕业时,会更加珍惜自己生活 感激 每周写5件自己感激的事情 写感谢卡,当面感谢会更好 重设自己的参考点 人们容易把自己的参考点设成最近或者比自己好的,所以这样就导致我们在比较后感觉不开心。有以下的方法可以帮大家解决这个问题:……

阅读全文

每周分享第 64 期

每周分享第 64 期 2020 week 34 你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。 国内经济 【1】韩正强调 深化油气体制改革确保油气市场稳定 为保障国家能源安全作出贡献……

阅读全文

vscode插件开发

vscode是我日常所使用的编辑器,包括在写这篇文章的时候。在编辑markdown文档的时候,总会遇到插入图片的问题。所以我就想实现一个简单的vscode插件,在运行时,可以将剪贴板里的图片上传到aws s3上之后把文件的url插入到vscode里。这样在写文章的时候就会提高效率。 准备工作 首先确认自己的环境有nodejs和npm,之后安装 yeoman npm install -g yo generator-code npm install -g generator-code 实现 首先运行,创建一个新的项目, 选择typescript,之后回答几个问题,就会新建一个项目。……

阅读全文

Coursera 幸福课 (2)

最近我学完了Coursera上有名的课程《The Science of Well-Being》。这门课是耶鲁大学开设的课程,主要就是在研究一个话题,如何变得更加快乐。 这一篇将继续上一篇的话题,讲一讲为什么人们会即使获得了自己认为的好东西后仍然不是那么快乐。 大脑恼人的特点 脑里最强烈的直觉往往不正确 直观的例子就是下面两个桌子的长度是相同的,但是人们的直觉告诉我们左边的更长。 直觉的产生很多情况下是我们的潜意识在帮我们做快速的反应,它们部分来源于我们的以前的经验。有的时候很管用,但有时则是完全错误的。 关于直觉的更多讨论可以看看这个知乎问答……

阅读全文

Coursera 幸福课 (1)

最近我学完了Coursera上有名的课程《The Science of Well-Being》。这门课是耶鲁大学开设的课程,主要就是在研究一个话题,如何变得更加快乐。 课程不长,讲座只有6周,后面4周是训练一项学到的技能。从中还是学到了很多很好的观点,在这里和大家分享一下我的学习心得。 关于快乐的迷思 当我们想到能让自己变得快乐的事情,会觉得以下的事情可以让自己变得很开心和幸福: 好工作 钱 好的事情,真爱,完美的身体和好的成绩 事实上这些对于我们的快乐影响十分有限。通过实验发现,如果将快乐程度0-10,当我们被一个理想的工作拒绝后,被试预计自己的快乐指数会降低2,实际上快乐指数只会降低0.……

阅读全文

模型思维(16)--空间竞争模型与享受竞争模型

这两个模型主要可以用来研究人们在做选择的两种模式,可以用来刻画消费者的选择行为。 我们会将某些属性描述为空间属性,而将其他属性描述为享受属性。空间属性,例如夹克的颜色或一片面包的厚度,没有最优值。每个人都喜欢某种特定“数量”的这类属性:一个购买猪排的消费者有自己喜欢的辣度,一个业余滑雪运动员在滑下斜坡时有自己喜欢的下降角度。产品的属性越接近理想水平,消费者对产品的评价就越高,而且理想水平因人而异:一个人可能比另一个人更喜欢辣一些的猪排。 在享受属性上,更多(或者在某些情况下更少)总是意味着更好。人们喜欢智能手机的待机时间更长一些,房间的面积更大一些,皮鞋的鞋底更耐磨一些,自己的汽车更省油一些。不过,在现实世界中,大多数选择都是“混合型”的:人们既会考虑空间属性,也会考虑享受属性。 空间竞争模型 空间竞争模型假设备选项可以用一组属性来定义,消费者则可以用一系列理想点来定义。假设用户只在一个属性上做选择,可以把用户的兴趣在数轴上做出反应。而提供商品的商家假设只有一个商品,可以满足这个属性的一个值。在下图中a和b可以看作是两个商家,距离a和b越近的用户就会选择他们。所以中间存在一个分界点d,分割不同的用户选择。 一般的空间竞争模型可以包括任意数量的属性。一个物品总是有不同的属性的,比如,沙发可以通过多个物理维度来描述:长度、宽度和深度,结构类型,以及室内装饰类型。消费者从产品中获得的价值(或效用)取决于产品在各个维度上与理想点的距离。我们可以用实际与用户理想点的距离来表现其竞争力。 唐斯空间竞争模型 接下来,我们应用空间竞争模型来分析政治候选人的意识形态立场“定位”。为了便于讨论,假设候选人都是追求投票最大化,也就是说,他们的首要目标是赢得选举。我们可以从一个简单的例子开始考虑,思考候选人的动机。如下图,候选人之间首先有一定的意见差距,获得其选民的选票。为了获得更多的选票,两个候选人都在往中间靠近为了争抢对方的选民支持。在下图中,可以看到两人的意见其实已经很接近了。这也是在美国大选中双方都需要争抢摇摆州的选票的原因。 享受竞争模型 在享受竞争模型中,各备选项(通常是各种产品)也是用属性来表示的。但是,在这种模型中,属性包括了质量、效率或价格,而且更多或者更少总是更受欢迎的。为了刻画每个属性的不同,享受竞争模型允许个体给不同维度赋予不同的权重。……

阅读全文

每周分享第 63 期

每周分享第 63 期 2020 week 33 你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。 珍惜粮食 【1】浪费可耻节约为荣,习近平关切“小米粒”里的“大民生” 人民网北京8月13日电 (万鹏、任一林)中共中央总书记、国家主席、中央军委主席习近平近日对制止餐饮浪费行为作出重要指示。他指出,餐饮浪费现象,触目惊心、令人痛心!尽管我国粮食生产连年丰收,对粮食安全还是始终要有危机意识,今年全球新冠肺炎疫情所带来的影响更是给我们敲响了警钟。……

阅读全文

每周分享第 62 期

每周分享第 62 期 2020 week 32 你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。 这周川普说45天后会封在美国的个人与微信的transaction,没人知道这个transaction的定义是什么。不过从蓬佩奥的净网行动来看,在未来存在中美在互联网上脱钩的可能性。这就带来一个问题,在美国可能用不了国内的任何app,在国内本来也用不了国外的app, 所以我们和国内朋友沟通可能就变麻烦了。。。微信不仅是个聊天工具,也是一个社交工具,看不了朋友圈影响还是很大的。不过想想20年前的人们,没有这么便捷的沟通工具生活和社交也可以过得很好。 以后每周分享依旧会保证在个人网站 study.……

阅读全文

模型思维(15)--基于阈值的模型

基于阈值的模型就是指当外部变量超过或低于特定的阈值时,人们的行为所发生的变化,引起整体的改变。基于阈值的行为很直观,也很容易产生临界点,例如当一个人加入社交活动的决定取决于已经参与了该项活动的人数时,随着越来越多的人参与该活动,参与者的总人数也超过了其他人的阈值,从而导致了参与的人越来越多。 骚乱模型 在基于阈值的模型中,个体根据某个总量变量是否超过阈值而决定采取两种行动中的哪一种。如果变量的值超过阈值,个体就采取一个行动,否则,就会采取另一个行动。 骚乱模型为每个人分配一个阈值。当参加骚乱的人数超过那个阈值时,这个人就会参加骚乱。一开始,只有那些阈值为零的人才会参加骚乱。这里所说的“骚乱”是一般的社会活动而不是暴乱,因此在这种情况下,参加骚乱也仅是指参与聚会。 举个例子:假设第一天,有200个阈值为零的人发动了一场社会活动。第二天,这200人继续参加,于是参与阈值低于200的人也加入了他们的行列。假设第二天新加入的人有500人,那么第三天,阈值低于700的人也会加入。而这可能会涉及好几千人。 那么什么样的群体可以使得参与的人最多呢?聪明的读者可能觉得如果这个群体的平均阈值比较低,那么所有人加入的可能性越大。 对于这个问题,我们可以通过如下三种可能的情形对于此进行分析,假设一共有1000个人可能参与这个活动: 所有人的阈值都是10。 有5个人的阈值为零,10个人的阈值为1,其他人的阈值均为20。 这1000人中每个人都有一个独特的阈值,范围为从0到999。 对于第一种情况,没有人会参与活动,因为无法达到阈值。……

阅读全文