博弈论案例(博弈论案例设计)

本文5174字,预计阅读时间10分钟。读书使人充实,分享使人快乐。文末附有思维导图,帮助你理清脉络的本质。欢迎阅读,你离知识更近了一步。今天的书是博弈论与生活。

本文5174字,预计阅读时间10分钟。

博弈论案例(博弈论案例设计)插图

读书使人充实,分享使人快乐。文末附有思维导图,帮助你理清脉络的本质。欢迎阅读,你离知识更近了一步。

今天的书是博弈论与生活。

莱恩·费舍尔(Len Fisher)是布里斯托尔大学物理学教授,纳米物理和软材料研究所研究员,知名科普作家。他热衷于与公众分享科学界的新事物。他拥有悉尼大学和新南威尔士大学的化学、数学、放射化学、物理、生物科学、哲学等学科的博士和硕士学位。

自20世纪40年代诞生以来,博弈论已被广泛应用于西方商业、经济、军事和社会学领域。博弈论的观点告诉我们,面对利益的相互制约,最好的应对策略不是冲突,而是合作;不是竞争,而是互助。通过跨学科的研究,作者找到了处理科学问题的完整方法,并利用博弈论中的合作策略为日常生活中的问题提供行动指南。

01.囚徒困境

首先,博弈论最著名的命题叫做囚徒困境。《囚徒困境》的名字是普林斯顿大学的艾伯特·塔克。什么是囚徒困境?这是经济学中一个非常著名的概念。

比如你和你的搭档是两个间谍,被警察抓了。你们两个被完全隔离,单独审问。如果你和你的伴侣保守秘密,你将被拘留一年;如果只有你保守秘密,你的伴侣坦白,他会被立即释放,你会被监禁十年;如果只有你坦白,你的伴侣保守秘密,你会被立即释放,你的伴侣会被监禁十年;如果两人都坦白,就要坐牢五年。当然,最好的解决方案是你和你的搭档都保守秘密,但是因为害怕对方坦白,可能导致十年监禁,囚徒困境中最保险的选择就是两个人都坦白。

为什么是两难?因为没有达到所能达到的最佳状态,双方进行了博弈。囚徒困境在生活中太多了,比如追女生。作者说,小时候他和哥哥同时喜欢上了小区里一个新来的女孩,然后两个人都跑到那个小女孩身边说对方坏话。最后两个人都追不上。这也是囚徒困境。

我们先来看一个概念,叫做纳什均衡。纳什意味着博弈中的每个参与者都找到了对方的最佳对策。这个理论是由著名数学家、博弈论创始人约翰·纳什(johnf nash)提出的,所以均衡策略也叫纳什均衡。

比如美国有两大橄榄球联盟,一强一弱。这两个联赛分别组织自己的比赛。强联赛在秋天打,因为秋天的市场最大,但是弱联赛也想在秋天举行比赛,把对手挤到春天。那么,弱旅联盟应该这么做吗?假设秋季有1亿人看足球比赛,而春季只有5000万人看足球比赛。如果两大联赛同时选择一个赛季,强联赛将获得70%的收视率,弱联赛只能获得30%。也就是说,如果两大联赛同时进行秋季赛,只有3000万人观看弱旅联赛的比赛;而如果弱旅联盟继续选择在春季比赛,他们依然会有5000万观众。面对强联盟,弱联盟没有占优策略,它只有均衡选择,即在强联盟暂停期间一直博弈。

也就是说,在各方都选择相同策略的情况下,任何一方单独改变策略都无法获益。此时的策略搭配和后续结果构成纳什均衡。生活中,各种陷阱经常出现。

比如离婚。到最后离婚往往是争夺财产的问题。一开始大家都不这么认为。离婚之初,大家都会说,我不在乎钱。但是最后发现对方真的全拿走了,我就开始生气了,说你为什么这样对我。然后提起诉讼。最后,你会发现大量的钱被用于律师费和社会成本。原因是双方都不退让,不想妥协,最后陷入一个纳什均衡。这就是为什么离婚会是一个非常痛苦的过程。作者说,如果你想在离婚中避免如此大的伤害,就应该各让一半。那应该怎么解决呢?

1.打破囚徒困境

第一步是想办法达成协议;第二步,想办法不让对方改变主意。比如一开始大家约定不招,这是约定;但是后来有人改变了主意,你受不了了。所以要用博弈论来解决这个问题。

2.达成合作

有三种方法可以阻止对方改变主意:

首先,改变你的态度。就是玩游戏不要有“不蒸馒头争口气”的想法。如果能成熟一点,把效用范围做得更广一点,可能更容易达成一致。

第二,求助于善意的权威。就是找一个比较权威,大家都听他的。比如有的家庭有户主,就请户主辩论,听听老人的意见,告诉他们怎么做。这叫诉诸善意的权威人士。

第三,制定能自己操作的策略。就是建立一个可以自行运转的机制,不需要长辈整天出面解决问题。这是博弈论的关键点。因为前两个其实是教育工作,涉及到你的态度。你应该相信他们。最后一个就是不需要学历,跟着学就行了。

交通规则是典型的自运行机制。很多地方不需要警察,只要有摄像头,交通就能畅通。所以重点是如何建立一个可以自己运营的策略。解决囚徒困境,必须解决公平正义问题。

02.如何公平分配?

人对公平正义的需求是天生的感觉,连黑猩猩都能做到这一点。一个动物学家研究黑猩猩,给它们香蕉。他故意给一些黑猩猩少一点,这个两三个,那个一个。实际上,一些黑猩猩扔掉了香蕉,拒绝吃它。它很生气。我们以为只有人会关心公平,但猩猩也会。所以人们对公平正义的需求是一种基本的动物需求。

1.我会削减你的选择。

“我切你选”策略在什么情况下有效?著名数学家、计算机鼻祖冯·诺依曼说过,它只在零和博弈中起作用。零和博弈是指博弈中所有参与者的利益之和为零或者是一个常数,即一方有收益,另一方必然有损失。在零和博弈中,博弈各方是不合作的。比如家庭分财产,我分财产也不能创造更多的价值。要么我有更多,要么你有更多。这叫零和游戏。

在国际社会,如果想到零和博弈,那就是看谁强然后讨论怎么分。但是,如果你可以通过建设来解决问题,获得更多的利润,那么“我来切你的份额”的方法就不一定有效。

比如有一次作者去参加一个晚宴,最后一道菜是甜品。轮到他时,只剩下两块蛋糕,一大一小。他身后有一位女士,然后他表现出绅士风度,把蛋糕递给那位女士,说,你先选。他想看看这位女士会选择哪一块。结果她毫不犹豫的选择了小块。他觉得很奇怪,博弈论不存在吗?他问,你为什么选小块的?女士说:“选大的我觉得有点不好意思。”这是什么?这是一个效用的问题。

什么是效用?比如对于一个正在减肥的女人,或者一个想要表现绅士风度的男人,别人对你的看法,对你的印象可能比你吃了多大的蛋糕更重要。所以虽然她的选择方法不同于其他情况下的假设,但博弈论还是存在的。因为它的效用变了,这种美好的感觉也变成了它效用的一部分,以至于淑女还是自私的。

2.有争议的部分分裂法

遇到更复杂的情况,无法通过简单的“分蛋糕”解决,该怎么办?那就是用有争议的部分二分法。有争议的部分二分法是什么?

比如大房和二房要分财产,大房坚持我要分全部财产;房利美和房地美认为我应该得到至少一半的财产。那么,按照我们古代的智慧,他们应该分享多少呢?答案是否定的,大房75%,二房25%。你认为这是为什么?过程很简单。首先看有争议的部分。有争议的部分是一半,因为房利美和房地美只索赔一半;另一半无可争议。如果没有争议,先分给大房间,剩下的一半,所以大房间75%,二房间25%。人类历史上大量分割问题的解决都来源于这个公式。

3.调整赢家法则。

调整后的收益法的基本原理是,不同的人可能对同一项资产设定不同的价值。如果双方想分所有权,可以做一些事情,让双方都觉得自己拿到了一半以上的所有权,实现双赢。而且可以应用在任何场合。这就是所谓的调整赢家法,这是一个双赢的局面。双赢是怎么来的?这是大脑产生的幻觉。

03.如何突破困境?

那么,我们如何让一项战略独自发挥作用呢?作者说,我们解决这些困境并让策略自行发挥作用的最经典方法是石头、布、剪刀。

1.石头、剪刀和布

剪刀和布在美国被称为Ro-Sham-Bo,翻译过来就是Rochambeau。罗尚博是法国与英国作战时的法国元帅。那你为什么用法国元帅的名字来命名石头剪刀布?在美国与英法开战后,双方将签署和平协议,双方教练进入帐篷签署和平协议。但是谁是第一个呢?这是一个问题。我尊重你,你先进;我不尊重你,我是第一个。谁不尊重谁?我该怎么办?双方开始猜拳,用石头剪刀布解决问题。后来有人讨论,大概提出这个建议的人是法国主帅罗尚博,于是美国就叫石头剪刀布,罗尚博。

剪刀和布之所以有效,其实是自然规律。它有其科学的存在性和随机性。很多案子都是通过它解决的,猜拳是最简单的方法。

比如一个日本人想拍卖一幅画,苏富比和佳士得都想要。如何选择?双方都提出了很多方案,竞争能力相当,所以这个老板很苦恼。他女儿劝他让他们有石头剪刀布,终于解决了。

2.通过沟通协商建立联盟。

通过沟通协商建立联盟才是解决博弈问题最本质的东西。只有当我们真正相互信任时,所有的困难才能解决。前提是真正的信任,真正的结盟。

比如鲱鱼,这种鱼的交流方式就是放屁。它在水里有节奏地放屁。通过这种节奏,它们约定哪里游泳,哪里有食物,哪里有危险。他说即使是鲱鱼也知道放屁来解决沟通问题。蜜蜂的发现以8字舞的路线为代表,8字舞是蜜蜂的语言。

人类最简单的交流方式,或者说给我们带来很多伤害的交流方式,就是威胁和回报。作者说有一次在印度购物,他说印度人把威胁和奖励用到了极致。他花80元买了衣服。他们很老实,给人一百,给了之后发现不给找零。他也不跟你吵架。他说你应该再选二十个。他们觉得太生气了,然后这两个英国人学会了给50,如果对方说那件衣服是80。对方说还差三十块钱,我不给。如果你不想卖,给我五十美元,我就走。最后,他们发现这招经常奏效,就是用威胁和奖励来解决问题。当然,要建立联盟,关键在于信任。如果能产生信任,问题就解决了。

比如作者小时候过圣诞节,爷爷奶奶给他和弟弟送礼物,打开盒子才发现礼物送反了。然后说,你们俩为什么不交换一下呢?但是他们之间没有信任,所以双方不舍,兄弟不舍,兄弟不舍。我给你了。如果你不给我呢?于是双方陷入僵局,拿着对方的礼物却不想要,又不愿意送给对方。怎么解决?这时,父亲站了出来,成为一个值得信赖的人。父亲说,如果你们两个都不放弃,这两件礼物都不会给任何人。他们一听这话,就相信了父亲,放弃了交换。

一旦你有了信任,你会发现这个联盟很容易建立。如果他们两个不合作,他们两个都会有巨大的损失。这就是游戏引入第三方的好处。一旦引入第三方,联盟关系发生变化,问题就解决了。这就是所谓的通过谈判建立联盟的过程。

如果能形成这样的联盟,最终的解决方案叫做帕累托最优。帕累托最优是最省力最有效率的状态。在帕累托最优的这些参与者中,没有人有改变当前博弈结果的动力,从而形成短暂的帕累托最优。每个人都可以按照这种方式,遵循一套规则。当然,如果外部条件在变化,引入新的玩家,格局也会发生变化。

3.建立有效的信任机制。

如何才能让博弈双方有一个可信的承诺?首先,反悔是极其昂贵的。例如,我们所有人都是20年的朋友。我们都是校友,都是一个学校的。我们一起认识的至少有200多人。这个时候,你骗了我。成本高吗?你骗了我之后,虽然没有房贷,但我只需要说出这个故事,你所有的人脉就没了。这就是为什么生活中很容易相信熟人。他的代价更大。

但是你还是要小心。我也见过一个人把自己几百亿的财产委托给一个人打理。最后那个人带着钱跑了。他量了一下,我的名声全没了,但是我受够了,几十亿。所以你要想,这两个要平衡。

其次,对方不可能改变主意。比如德川家康取得日本政权后,让所有的名人来东京建房,把东京所有名人的财产都拿到手,让你没钱造反,只要有钱就可以建房,东京发展得很快。你必须生活在我的眼皮底下。如果你反抗,我会先杀了你。他善于用这种“不变的心”解决问题。

然后就是仪式的使用。比如古人喜欢为联盟而流血。有直接的信任,很有效。就是你先付出,你直接树立了信任的榜样。笔者认为,能够信任别人的人,愿意承受一些损失的人,不那么斤斤计较的人,往往能够在博弈的过程中得到一个比较好的结果。当然不傻。

曾经有人用电脑做过博弈研究,分析什么样的奖励策略能给你带来最大的收益。结论是“以直报怨,以德报德”。什么叫以眼还眼?第一件事是推己及人,第二件事是学会以牙还牙。我们每个人都要先保证自己先好,我会说话算数的。如果对方背叛,我会改变策略,我也会背叛。玩游戏的有效方法是不吃醋,不第一个背叛。感恩,报复,不要自作聪明。这是最有效的合作方式。所以人要学会做一个有底线、正直的好人。这是我们在游戏中可以获得最高利润的方向。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/153586.html

发表回复

登录后才能评论