您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页博弈论复习题及答案

博弈论复习题及答案

来源:意榕旅游网
博弈论复习题及答案----37cecea6-6eac-11ec-a744-7cb59b590d7d

一、名词解释(每题7分,共28分)

1.逆向选择:逆向选择源于先验信息不对称。经典的例子是“柠檬市场”——二手车市场,它使市场资源逐渐流向劣质产品或要素,最终形成劣质商品驱逐良品的局面。这种现象被称为“逆向选择”。

2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3.纳什均衡:对于参与者而言,相互最优的策略选择是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。

5.博弈论:它研究人们如何做出决策,以及这些决策如何达到均衡(合理策略)。在决定采取什么行动时,每个参与者不仅要根据自己的利益和目的行事,还要考虑他决策行为对他人的可能影响以及他人反应行为的可能后果,并通过选择最佳行动计划寻求收入或效用的最大化。

二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?

答:游戏的基本要素包括五个要素:参与者、策略、动作顺序、信息和收入。博弈的基本特征是尽可能多地考虑对方的决策选择及其对自身的影响,为自己选择最有利的方案决策,以最大限度地发挥其效益和效用。2.什么是性别战争游戏?问纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是相互沟通和协调,因为只有合作才能捕捉到想要的猎物。 -1-

4.什么是道德风险?有没有办法解决道德风险问题?答:道德风险是指在委托代理框架下,委托人不能直接观察代理人的行为,导致信息不对称,代理人的选择不利于委托人行为的现象;解决道德风险的途径可以是签订合同、派人监督、用激励解决、约束和激励机制。3、 计算题(16分)

1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 N

f2b2f15,20,0h

答案:根据上面的矩阵,我们可以得出游戏中有两个纳什均衡:h-选择F1和n-选择F2,以及h-选择B1和n-选择B2

2、a、b两者博弈:a首先行动,可以选择“左”或者“右”的行动;b后行动,有“l”和“r”的行动,其收益如下:当a选左,b选l时,a的收益为2,b的收益为3;当a选左,b选r时,a的收益为1,b的收益为4;当a选右,b选l时,a的收益为3,b的收益为1;当a选右,b选r时,a的收益为0,b的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。 四、 讨论问题(16分)

1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方法可以建立可信的策略行动。

答:每一项战略行动都面临信誉问题。人们不一定相信战略行动的支持者会实施其行动。因此,提案人必须做一些辅助工作,使人们相信他将实施他在第二阶段宣布的内容。 比如,工作中管理者对员工上班时间玩游戏的态度有所 -2-

不同。一些管理者对员工很宽容,并不惩罚玩游戏的员工。另一些管理者则十分严厉,会处罚玩游戏的员工。一些管理者虽然说了会处罚的承诺,但禁不住员工的好话及其它员工的求情,就原谅了员工。从博弈论角度分析,假设三种管理者手下的员工各方面都相同,哪一种管理者将得到最高的支付呢?管理者对玩游戏的态度可以是“处罚”或“原谅”,员工可以“玩游戏”或“不玩游戏”,如下表所示:员工玩游戏不玩游戏处罚1,13,2管理者原谅2,44,3管理者并不希望自己不近人情,故他们最好的结果就是(4,3),最不好的结果就是(1,1);余下的两个策略,因管理者希望员工不玩游戏,故(3,2)好于(2,4)。员工最喜欢(4,3),最不好的结果也是(1,1),余下的,员工(2,4)好于(3,2)。在此博弈中,若同时行动,或者是管理者后行动,与处罚带来的1和3的支付相比,原谅能带来2和4,是占优策略。此时,员工则会选择玩游戏。最终,均衡的结果是(2,4)。而如果管理者一开始就承诺“处罚”的话,员工会发现不玩游戏会更好,于是管理者得到了支付3。但是如果有员工曾被管理者原谅,可能他就会认为管理者心软,不相信管理者做出的“处罚”承诺,从而玩游戏。此时,就会得到一个最坏的结果,即(处罚,玩游戏),其支付仅为(1,1)。

通过采取一些行动和改变游戏来获得更好的结果,这就是战略行动。战略行动分为承诺、威胁和承诺。这三个战略行动中最重要的是让游戏中的其他参与者相信,战略行动的提议者确实会按照他在第一阶段和第二阶段宣布的去做。在这方面,每一项战略行动都面临信誉问题。人们不一定相信战略行动的支持者会实施其行动。所以仅仅宣布是不够的。在第一阶段,提案人必须做一些辅助工作,使人们相信他会做第二阶段宣布的事情。上述

游戏涉及管理者对玩游戏的员工的“惩罚”态度的承诺。在这种情况下,为了从战略行动中受益,经理做出的承诺不能同时采取行动 -3-

博弈的均衡策略是相同的,因此管理者选择“惩罚”的承诺,这改变了员工的期望和行为。一旦员工相信这一承诺,他们就不会玩游戏并获得(3,2)的报酬。如果员工尝试玩一次游戏,经理可能会原谅他们“只玩一次”。有一种诱惑,就是不把战略行动付诸实施,这会降低承诺的可信度。如果员工和经理都认为他们将不再受到惩罚(1,1),那么如果他们只是玩游戏,他们将不再受到惩罚。这就是为什么经理们心狠手辣的原因。因为他知道破例原谅员工一次的危险。因此,管理者需要做一些事情来建立其战略行动的可信度,也就是说,让其他参与者相信,如果他们的行动违反了你的承诺,你会付诸实践,而不是因为人类的诱导而放弃。通常只有一种方法可以避免危险,那就是永远不要穿越雷区。管理者需要找到一些方法,使他们的拒绝合理可信,并提高其战略行动的可信度。首先,通过减少未来行动的自由度和消除诱因行动,我们只能实施战略行动中确定的行动。例如,管理者可以用规章制度或工作纪律作为盾牌。一旦制定了这些制度和纪律,个别经理在任何特殊情况下都不能例外。这样做,等于将“宽恕”的行为从他们的选择组合中移除,因此他只能实现“惩罚”的承诺。规则的存在使员工相信管理者再也不能改变他们的想法,因此管理者对“惩罚”的承诺在此时是可信的。第二,改变未来支付方式,减少诱导行为的支付,使战略行为的实施成为最佳行为。管理者可以通过几次不妥协的惩罚来建立一个严重的声誉。尽管不妥协的惩罚可能不是一件愉快的事情,也可能违背管理者的初衷,但在长期的工作生涯中,这是有益的。因为如果一个经理被认为是非常严格的,没有员工愿意用借口搪塞他,他会减少拒绝员工的不快。如果经理在一场比赛中未能履行承诺,他的声誉将受到损害,这将导致其他比赛的低报酬。从这个角度来看,提高战略行动的可信度将有助于提高在战略游戏中获得的报酬。因此,学会使用坚持原则、提高声誉等方法来提高我们行为的可信度,可以帮助我们在未来的生活中选择最好的行为,并获得更高的收益。 -4-

2.中国的外交始终坚持和平外交。因此,中国一直在不断裁军,但中国也拥有一定数量的核武器。请用博弈论来分析这一现象。

答:以博弈论著名的案例“囚徒困境”为例:抓到两个纵火案犯罪嫌疑人,然后将它们隔离关押起来,并要求他们坦白交代。假定:如果两人都承认纵火,每人将被判刑3年;如果都不承认,每人将被判刑1年;如果一个不承认而另一个坦白并作证,那么抵赖者将被判刑5年,坦白者将被释放。这两个囚徒将做出怎样的选择呢?显然,在以上假定中,最好的结果是双方都选择抵赖,结果是大家都只被判刑1年。但是,由于两个囚徒在理论上都是从利已的目的出发进行决策的所谓“理性行为者”,在无法获取对方的完全信息并给予对方充分信任的情况下,每一个概都会选择似乎对自己最有利的策略,即选择坦白。出现了个体理性(都选择坦白,各被判3年)与集体理性(都不承认,各被判1年)的冲突。

国家间的军事扩张和裁军也是这样一种“囚徒困境”。如果双方信息沟通不畅,双方将无法达成合作。一个国家的个体理性导致了国家之间的集体非理性,并没有实现彼此利益的最大化。

我国一贯坚持和平外交,同时拥有一定数量的核武器,并且承诺不首先使用核武器,这就避免为了达到先发制人的目的,而不得不投巨资花大钱在军备上以确保己方克敌制胜的能力。我国这样的核战略,一方面降低了我国在其他核大国眼中威胁,另一方面保证我们可以把更多的钱用在社会经济建设和综合国力提升上。

在最低核威慑战略(一份报告对另一份报告的最佳战略)的保障下,通过充分的信息交流,我们可以打破国家间军备竞赛中的囚徒困境。以中国、美国、中国和俄罗斯为例,我们主动释放善意,继续裁军。同时,我们努力提高中国的综合国力,加强中美、中俄之间的经济、社会、文化和军事交流,使游戏双方都能实现游戏的一切可能结果,超越“生死”原则 -5-

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务