《经济博弈论》期末考试复习解析

发布时间:2018-10-31   来源:文档文库   
字号:
《经济博弈论》期末考试复习资料
第一章 导论
1.博弈的概念:
博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:
博弈模型有下列要素:(1博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:
合作博弈允许存在有约束力协议的博弈;非合作博弈不允许存在有约束力协议的博弈。主要区:人们的行为互相作用时,当事人能否达成一个具有约束力的协议
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平)
非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:
个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:245 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1博弈方,即博弈中进行决策并承担结果的参与者;(2策略(空间,即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5信息结构,即博弈方相互对其他博弈方行为或最终利益 1 / 15

的了解程度;(6行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。
4.“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。
“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。
现实中“囚徒的困境”类型的问题是很多的。例如厂商之问的价格战、恶性的广告竞争,初等、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。
5.博弈有哪些分类方法,有哪些主要的类型?
首先,可根据博弈方的行为逻辑,是否允许存在有约束力协议分为非合作博弈和合作博弈两大类。 其次,可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。
第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。
第四是根据博弈问题的信息结构根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信自、动态博弈和不完全信息动态博弈几类。
第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。
第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。 第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。
第二章 完全信息静态博弈
1.纳什均衡的实质
给定你的策略,我的策略是最优的,给定我的策略,你的策略也是最优的。 2.纳什均衡的一致预测性质
如果所有博弈方都预测特定的博弈结果会出现,那么所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离预测结果的愿望,因此预测结果最终真会成为博弈的结果。正是由于纳什均衡是一致预测,因此各博弈方可以预测它,可以预测他们的对手会预测它,还可以预测他们的对手会预测自己会预测它……预测博弈结果是非纳什均衡,意味着要么各博弈方的预测不同,要么预期至少一个博弈方会“犯错误”会选择错误的策略或者在实施策略时会出现差错。因为只有纳什均衡才具有一致预测的性质,因此一致预测性是纳什均衡的本质属性。一致预测性是保证纳什均衡价值的两个重要性质之一。
3.帕累托上策均衡
根据帕累托效率意义上的优劣关系选择出来的纳什均衡,就是帕累托上策均衡。 4.风险上策均衡
如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是风险上策均衡。
2 / 15

5.防共谋均衡
定义:满足下列要求的均衡策略组合称为防共谋均衡 1)没有任何单个博弈方的串通会改变博弈的结果。
2给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果。 3)依次类推,直到所有博弈方都参加的串通也不会改变博弈的结果 目标:排除共谋问题给博弈结果带来的不稳定性和问题。 防共谋均衡是非合作博弈的均衡概念,而不是合作博弈的概念 6.反应函数
每个博弈方针对其他博弈方所有策略的最佳反应构成的函数。而各个博弈方反应函数的交点(如果有的话)就是纳什均衡。
7.纯策略纳什均衡与混合策略纳什均衡的计算 纯策略纳什均衡:划线法、箭头法
混合策略纳什均衡:自己的策略选择不能被另一方预知或猜到,即在决策时利用随机性。选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。
8.古诺的寡头模型中个体收益最大化和集体收益最大化的差异及现实意义。
与个体收益最大化相比,追求集体收益最大化时总产量较小,而总利润较高。从两厂商总体来看,根据集体利润最大化确定产量效率更高,两厂商考虑合作,联合起来决定产量,定出使集体利益最大的产量后各自生产一半,比只考虑个体收益的独立决策行为得到的利益要高。
在独立决策、缺乏协调机制的两个企业间,考虑集体收益最大化的合作并不容易实现,即使实现了也是不稳定的。主要原因是各自生产一半实现最大总利润总产量的产量组合不是纳什均衡策略组合。
第二章课后题:1269 1.上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是各博弈方相对最优策略的组合。因此上策均衡是比纳什均衡要求更高,更严格的均衡概念。上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡。对于同一个博弈来说,上策均衡的集合是纳什均衡集合的子集,但不一定是真子集。
严格下策反复消去法与上策均衡分别对应两种有二定相对性的决策分析思路:严格下策反复消去法对应排除法,即排除绝对最差策略的分析方法;上策均衡对应选择法,即选择绝对最优策略的均衡概念。严格下策反复消去法和上策均衡之间并不矛盾,甚至可以相互补充,因为严格下策反复消去法不会消去任何上策均衡,但却可以简化博弈。
严格下策反复消去法与纳什均衡也是相容和补充的,因为严格下策反复消去法把严格下策消去时不会消去纳什均衡,但却能简化博弈,使纳什均衡分析更加容易。
2.为什么说纳什均衡是博弈分析中最重要的概念? 之所以说纳什均衡是博弈分析(非合作博弈分析最重要的概念,主要原因是纳什均衡与其他博弈分析概念和分析方法相比,具有两方面的优秀性质。
第一是一致预测性质。一致预测性是保证纳什均衡具有内在稳定性,能做出可靠的预测的根本基础。 3 / 15

而且只有纳什均衡才有这种性质,其他均衡概念要么不具有一致预测性,要么本身也是纳什均衡,是纳什均衡的组成部分,因此一致预测性是纳什均衡的本质属性。
第二是普遍存在性。纳什定理及其他相关定理保证在允许采用混合策略的情况下,在我们关心的所有类型博弈中都存在纳什均衡。这意味着纳什均衡分析方法具有普遍适用性。相比之下,其他各种均衡概念和分析方法,如上策均衡、严格下策反复消去法、严格上策均衡等,则可能在许多博弈中不存在,从而限制了它们的作用和价值。
纳什均衡是惟一同时具有上述两大性质的博弈分析概念,而且它也是其他各种博弈分析方法和均衡概念的基础,因此纳什均衡是博弈分析中最重要、作用最大的概念。
6.求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

根据计算混合策略纳什均衡的一般方法,设博弈方1采用T策略的概率为p,则采用B策略的概率1-p;再设博弈方2采用策略L的概率为q,那么采用策略R的概率是1-q。根据上述概率分别计算两个博弈方采用各自两个纯策略的期望得益,并令它们相等:

解上述两个方程,得p = 2/3 q = 3/4即该博弈的混合策略纳什均衡为:博弈方1以概率分布2/31/3TB中随机选择;博弈方2以概率分布3/41/4LR中随机选择。
9.两寡头古诺模型.P(Q = aQ等与上题相同,但两个厂商的边际成本不同,分别为c1c2如果0,问纳什均衡产且各为多少?如果c1 ,但2c2 > a + c1,则.纳什均衡产,又为多少? (1 两个厂商的利润函数为:
将利润函数对产量求导并令其为。得:

解得两个厂商的反应函数为:

或具体写成: 4 / 15



(2 0时,根据上述两个厂商的反应函数,直接求出两个厂商的纳什均衡产量分别为:
(3 c1,但2c2> a + c1时,根据反应函数求出来的厂商2产量q2 < 0。这意味着厂商2不会生产,这时厂商1成了垄断厂商,厂商1的最优产量选择是利润最大化的垄断产量

第三章 完全且完美信息动态博弈
1.可信性问题
由于动态博弈中博弈方的策略是多阶段的行动计划,实施起来有一个过程,而且又没有强制力,此博弈方完全可以在博奔过程中改变计划。我们称这种问题为“相机选择”问题。相机选择的存在使得动态博弈中各博弈方策略设定的行为选择的“可信性”有了疑问。各个博弈方是否会真正、始终按照自己的策略所设定的方案行为,还是可能临时改变自己的行动方案?纳什均衡不能解决这种可信性问题,无法排除博弈方策略中不可信的行为设定,因此在动态博弈中不是真正稳定的。动态博弈分析中具有真正稳定性的均衡概念是子博弈完美纳什均衡
2.逆推归纳法
从动态博弈的最后一个阶段开始,逐个阶段向前面的阶段倒推分析博弈方行为选择的动态博弈分析方法,称为“逆推归纳法”。逆推归纳法的逻辑基础是理性的先行为博弈方,在前面阶段选择行为时必然合考虑后行为博弈方在后面阶段的行为选择,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方才能直接做出明确选择,当后面阶段博弈方的选择确定以后,前一阶段博弈方的选择就可以确定了。逆推归纳法是动态博弈分析,也就是子博奔完美纳什均衡分桥最重要的基本方法。
3.子博弈完美纳什均衡
如果在一个完美信息的动态博弈中,一个策略组合满足在整个动态博弈及它所有的子博弈中都构成纳什均衡。那么该策略组合称为—个“子博弈完美纳什均衡”。因为要求在所有子博弈中都构成纳什均衡,因此子博弈完美纳什均衡能够排除均衡策略中不可信的行为(威胁或承诺因此具有真正的稳定性。非子博弈完美的纳什均衡不能做到这一点。子博弈完美纳什均衡是动态博弈分析的核心均衡概念。子博弈完美纳什均衡本身也是纳什均衡,是比纳什均衡更强的均衡概念。
5 / 15

4.古诺模型与寡占的斯塔克博格模型区别及现实意义
斯塔克博格模型与古诺模型相比,唯一的不同是前者有一个选择的次序问题(两厂商所处地位具有不对称性),其他如博弈方、策略空间和得益函数等完全都是相同的。斯塔克博格模型的产量大于古诺模型,价格低于古诺模型,总利润小于古诺模型。
在信息不对称的博弈中,信息较多的博弈方不一定能得到较多的利益。 5.委托人—代理人博弈模型分析(4种) 详细内容见课本150162 无不确定性的委托人—代理人模型



6 / 15

有不确定性但可监督的委托人—代理人博弈
有不确定性且不可监督的委托人—代理人博弈
选择报酬和连续努力水平的委托人—代理人博弈



7 / 15

第三章课后题:1469 1.动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是什么关系? 子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合:它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。
在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于,动态博弈中各个博弈方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能在博弈过程中改变均衡策略设定的行为,从而使得均衡策略存在可信性问题,而且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。
子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一个子集。
4.如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中ab的数值不确定。试讨论本博弈有哪几种可能的结果。若要本博弈中的“威胁”和“承诺”是可信的,ab应满足什么条件?
括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,b表示甲的得益。
在第三阶段,如果a < 0,则乙会选择不打官司。这时逆推回第二阶段,甲会选择不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益。比不借的最终得益1小。
在第三阶段,如果a > 0,则乙轮到选择的时候会选择打官司,此时双方得益是(a b。逆推回第二阶段,如果b>2,则甲在第二阶段仍然选择不分,这时一候双方得益为(a b。在这种情况下再逆推回第一阶段,那么当a < 1时乙会选择不借,双方得益(l 0,当a > 1时乙肯定会选择借,最后双方得益(a b。在第二阶段如果b<2,则甲会选择分,此时双方得益为(2 2。再逆推回第一阶段,乙肯定选择借,因为借的得益2大于不借的得益1,最后双方的得益(2 2. 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1a<0,此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方得益(10,不管这时候b的值是多;(20b>2,此时博弈的结果仍然是乙在第一阶段选择不借,结束博弈,双方得益(1 0;(3 a>1b>2、此时博弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a b; (4 a > 0b<2,此时乙在第一阶段会选择借,甲在第二阶段会选择分,双方得益(2 2. 要本博弈的“威胁”,即“打”是可信的,条件是a > 0。要本博弈的“承诺”,即“分”是可信的, 8 / 15

条件是a > 0b<2. 注意上面的讨论中没有考虑a=0 a=1 b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。
6.三寡头市场需求函数P=100-Q其中Q是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2先同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 首先,设三个厂商的产量分别为q1q2:q3。三个厂商的利润函数为:
根据逆推归纳法,先分析第二阶段是厂商3的选择。将厂商1的利润函数对其产量求偏导数并令其0:
因此厂商3的反应函数为:
再分析第一阶段是厂商1和厂商2的决策。
先把厂商3的反应函数代入厂商1和厂商2的利润函数得:
分别对q1q2求偏导数并令为0,得:
联立两个方程可解得q1=q2=98/3 再代入厂商3的反应函数得:

9 / 15

把三个厂商的产量代入各自的利润函数,可得三个厂商的利润分别为4802/9 4802/92 401/9. 9.根据3.4.4中对店主和店员之间委托人一代理人关系的分析. 讨论在信息不完全的情况下,“基本工资+提成奖金”式的工资制度和租赁、承包制相比,哪种方式更能使雇员或承祖、承包人的利益,与雇主或出租、发包人的利益一致,使代理人的行为更加符合委托人的利益?工资加奖金制度与租赁、承包制度各有什么优缺点? 根据3.4.4中对店主和店员之间委托人一代理人关系的分析,不难清楚在信息不完全的情况下,赁、承包制显然比“基本工资+提成奖金”式的工资制度,更能使雇员或承租、承包人的利益,与雇主或出租、发包人的利益一致,使代理人的行为更符合委托人的利益。理由是在这个委托人一代理人关系博弈中,同时满足参与约束和激励相容约束的惟一子博弈完美纳什均衡解,就是一种固定租金或承包费的承包或租赁经营制。
租赁、承包制度的最大优点就是上述出租、发包人与租赁、承包之间的利益一致性。但这有一定前提,那就是租赁、承包的条件、合同是合理的。此外,在租赁、承包制下所有的不确定性风险实际上都是由代理人而不是委托人承担。由于通常代理人在风险类型方面总是比委托人更偏向风险厌恶而不是风险偏好,与租赁、承包制的风险安排正好矛盾,因此承包制和固定租金租赁制不一定能采用或合理。
工资奖金制度的优点是代理人所承担的风险比较小,委托人和代理人双方分担不确定性的风险,对于代理人比较厌恶风险,每单位带风险的期望得益价值较小的情况是较好的制度安排。工资奖金制度的缺点是在信息不完全的情况下,委托人和代理人在利益方面的某种不一致性无法完全避免,无法使代理人的行为完全符合委托人的利益。
第四章 重复博弈
1.有限次重复的囚徒困境博弈与无限次重复的囚徒困境式博弈的子博弈完美纳什均衡 有限次重复的囚徒困境博弈:各博弈方在每个阶段都采用原博弈的纳什均衡策略。 无限次重复的囚徒困境式博弈:触发策略(贴现因素) 2.触发策略
重复博弈中博弈方首先试探合作,一旦发觉对方不合作则用不合作报复的策略,称为“触发策略”(trigger strategy。触发策略的报复机制本身必须构成纳什均衡,否则触发策略就不是子博弈完美纳什均衡:触发策略是重复博奔中实现合作和提高均衡效率的关键机制,是重复博弈分析中构造子博弈完美纳什均衡的基本“构件”之一。触发策略在现实中有很多例证。触发策略也可能存在可信性的问题,因为触发策略在报复其他博弈方的时候,也可能对报复者自己造成损害,在重复博弈分析时必须注意这个问题。
3.民间定理
有限次重复博弈民间定理设原博弈的一次性博弈有均衡得益数组优于各博弈方在一次性博弈中最差均衡得益构成的得益数组,那么在多次重复博弈中,所有不小于个体理性得益(1ndividual rationality Payoff,即博弈方保证能获得的得益可实现得益(feasible payoff,博弈中所有纯策略组合得益的加权平均数组.都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。这个定理在有人正式证明并发表之前就是博弈理论界众所周知和认为当然成立的,因此称“民间定理”
10 / 15

无限次重复博弈民间定理:设G是一个完全信息的静态博弈。用(e1,…,enG的纳什均衡的得益。用(xl,…,xn表示G的任意可实现得益。如果xiei对任意博弈方i都成立,而 足够接近1那么无限次重复博弈 中一定存在一个子博弈完美纳什均衡各博弈方平均得益是(xl…,xn。这个无限次重复博弈的民间定理是弗里德曼(Fried-man1971年提出的,也称为民间定理是因为它与有限次重复博弈民间定理的相似性。
4.重复博弈得益的计算
有限次重复博弈:各博弈方在GT)中的总得益为在G中得益的T
无限次重复博弈:各博弈方在G(∞、δ中的“得益”等于各阶段得益的现在值 贴现系数:δ 1/(1+γ,其中γ为以一阶段为期限的市场利率。 给定贴现系数δ,若无限次重复博弈一路径的某博弈方各阶段的收益为

则该博弈方在该无限次重复博弈中的总收益为各阶段博弈中得益的“现在值”:
123t1t
2t1注意:重复次数较多的有限次重复博弈也要考虑得益的时间价值差别,方法与无限次重复博弈一致。 5.无限次重复博弈的效率工资模型
有效工资率无限次重复博弈模型是关于工资率决定和劳动激励的众多博弈模型之一。这个模型揭示了企业经营者不能只是以压低雇员工资为目标,必须考虑用适当的高工资激励员工努力,应该在考虑到工人对工资率反应的情况下确定最有效率的工资率。这个博弈模型在现代经济学中有非常重要的作用。

一次性博弈的结局:在厂商必须支付工资w条件下,工人将选择偷懒;此时厂商的收益(pyw可能是负值(概率p很小),因此其支付的工资w很低(w0,工人将选择个体户。
触发策略:
厂商:第一阶段支付较高的工资率w*如果在前t1阶段产量都为y那么第t阶段继续支付;否则解雇w0
工人:如果工资率高于w0则接受。如果在前t1阶段工资率都为w*t阶段继续努力工作;否则偷懒。
ww0ee(1(1p
为了促使工人努力工作,除了要提供补偿从事个体户的机会成本w0和努力工作的成本e以外,还 11 / 15

要提供一个促进效率的工资e(1δ/δ(1p。其值大小与工人努力工作付出的成本e、贴现系数δ的大小、偷懒也可以获得高产量的概率p有关。
第四章课后题:24 2.举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。
火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。
4.若三次重复2. 3. 1的古诺模型,子博弈完美纳什均衡是什么? 2. 3. 1的古诺模型是一个典型的囚徒的困境型博弈,有惟一的纯策略纳什均衡。根据关于有惟一纯策略纳什均衡的有限次重复博弈的定理,这个二次重复博弈的子博弈完美纳什均衡是,两个厂商在每次重复时都会采用一次性博弈的纳什均衡,也就是2单位的古诺产量。
一、判断题
1.囚徒困境说明个人的理性选择不一定是集体的理性选择。(√ 2.子博弈精炼纳什均衡不是一个纳什均衡。(×
3.若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。(×) 4.博弈中知道越多的一方越有利。 ×) 5.纳什均衡一定是上策均衡。 (× 6.上策均衡一定是纳什均衡。 (√)
7.在一个博弈中只可能存在一个纳什均衡。 (×) 8.在一个博弈中博弈方可以有很多个。 (√)
9.在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ 10.在博弈中纳什均衡是博弈双方能获得的最好结果。 (×
11.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。 (× 12上策均衡是帕累托最优的均衡。 (×)
13.因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。(×) 14.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
15.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。(×)
16.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√
17.不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共 12 / 15

同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√
18.多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√
19.如果阶段博弈G={A1, A2,,An; u1, u2,,un具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T的子博弈完美均衡结局,其中对于任意的tt阶段的结局并不是GNash均衡。(√ (或:如果阶段博弈G={A1, A2,,An; u1, u2,,un具有多重Nash均衡,那么该重复博弈G(T的子博弈完美均衡结局,对于任意的t,在t阶段的结局一定是GNash均衡。
20.零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(√ (或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×)
21.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。(√
22.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√ (或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×)
23.根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game和动态博弈(dynamic game
24.如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T重复博弈G(T有唯一的子博弈完美结局:在每一阶段取GNash均衡策略。(√
二、计算分析题
1、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益)
小猪 等待 大猪 51 44 等待 9-1 00 求纳什均衡。

在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选 13 / 15

择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)
论述题:解释“囚犯困境”,并举商业案例说明。
囚徒困境是博弈论里最著名的例子之一,几乎所有的博弈论著作中都要讨论这个例子。这个例子是这样的:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚徒可以期望被从轻发落入狱2年;另一方面,如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。表6-2给出了囚徒困境的策略式表述。这里,每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。(注意,这里的得益是负值。
6-2

坦白 不坦白
囚徒困境
囚徒乙 坦白
囚徒甲
不坦白
-5 -5 -1 -10 -10 -1 -2 -2 在囚徒困境这个模型中,纳什均衡就是双方都坦白,给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策(dominant strategy均衡,即不论对方如何选择,个人的最优选择是坦白。因为如果乙不坦白,甲坦白的话就被轻判1年,不坦白的话就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的话判5年,不坦白的话判10年,所以,坦白仍然比不坦白要好。这样,坦白就是甲的上策,当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。
寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。
解释“智猪博弈(boxed pigs”,并举商业案例说明。
智猪博弈的例子讲的是:猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按扭,控制着猪食的供应。每按一下按扭会有10个单位的猪食进槽,但谁按按扭谁就要付2个单位的成本并且晚到猪食槽。若大猪先到猪食槽,大猪吃到9个单位,小猪只能吃到1个单位;若小猪先到猪食槽,大猪吃到6个单位,小猪吃4个单位;若同时到,大猪吃到7个单位,小猪只能吃3个单位。表6-3列出了对应于不同策略组合的得益水平。例如,表中第一格表示大猪小猪同时按按扭,从而同时走到猪食槽,大猪吃7个,小猪吃3个,除去2个单位成本,得益分别为51
6-3 智猪博弈

大猪
不按
5 1 9 -1 小猪
不按 4 4 0 0 从表6-3可以看到,对于小猪来说,如果大猪按,它则不按更好;如果大猪不按,它不按也更好,所以,不论大猪按还是不按,它的最优策略都是不按。给定小猪不按,大猪的最优选择只能是按。所以,纳什均衡就是大猪按,小猪不按,各得4个单位猪食。
市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研究与开发,为新产品做广告,而对小企业来说这些工作可能得不偿失。所以,小企业可能把精力花在模仿上,或等待大企业用广告打开市场后再出售廉价产品。
14 / 15

本文来源:https://www.2haoxitong.net/k/doc/3af5ba47fbd6195f312b3169a45177232f60e40e.html

《《经济博弈论》期末考试复习解析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式