博弈论66个经典例子之六

发布时间:   来源:文档文库   
字号:

博弈论经典例子



















、囚徒困境
故事讲的是, 两个嫌疑犯作案后被警察 抓住,分别关在不同的屋子里接受审 讯。警察知道两人有罪, 但缺乏足够的 据。警察告诉每个人: 如果两人都抵 赖,各判刑一年;如果两人都坦白, 判八年;如果两人中一个坦白而另一个
赖,坦白的放出去,抵赖的判十年。 是,每个囚徒都面临两种选择: 坦白 抵赖。 然而,不管同伙选择什么, 囚徒的最优选择是坦白: 如果同伙抵 赖、自己坦白的话放出去, 不坦白的话 判一年, 坦白比不坦白好; 如果同伙坦 白、自己坦白的话判八年, 不坦白的话 判十年,坦白还是比不坦白好。结果, 个嫌疑犯都选择坦白,各判刑八年。 如果两人都抵赖, 各判一年, 显然这个 结果好。 但这个帕累托改进办不到, 为它不能满足人类的理性要求。 囚徒困 境所反映出的深刻问题是, 人类的个人 理性有时能导致集体的非理性——聪 明的人类会因自己的聪明而作茧自缚。
二、旅行者困境
两个旅行者从一个以出产细瓷花瓶著称的 地方旅行回来,他们都买了花瓶。提取行李的 时候,发现花瓶被摔坏了,于是他们向航空公 司索赔。航空公司知道花瓶的价格大概在八九
十元的价位浮动,但是不
知道两位旅客买的时 候的确切价格是多少。于是,航空公司请两位 旅客在 100 元以内自己写下花瓶的价格。如果 两人写的一样,航空公司将认为他们讲真话, 就按照他们写的数额赔偿;如果两人写的不一 样,航空公司就认定写得低的旅客讲的是真话, 并且原则上按这个低的价格赔偿,同时,航空 公司对讲真话的旅客奖励 2 元,对讲假话的旅 客罚款 2 元。 为了获取最大赔偿而言,本来 甲乙双方最好的策略,就是都写 100 元,这样 两人都能够获赔 100 元。可是不,甲很聪明, 他想:如果我少写 1 元变成 99 元,而乙会写 100 元,这样我将得到 101 元。何乐而不为?所以 他准备写 99 元。可是乙更聪明,他算计到甲要 算计他写 99 元,于是他准备写 98元。想不到 甲还要更聪明一个层次, 估计到乙要写 98 坑他,于是他准备写 97 ⋯⋯大家知道,下象 的时候,不是说要多“看”几步吗, “看”得 远,胜算越大。 你多看两步,我比你更强多 看三步,你多看四步,我比你更老谋深算多看 五步。在花瓶索赔的例子中, 如果两个人都 “彻 底理性”,都能看透十几步甚至几十步上百步, 那么上面那样“精明比赛”的结果,最后落到 每个人都只写一两元的地步。事实上,在彻底
理性的假设之下,这个博弈唯一
的纳什均衡, 是两人都写 0
三、 竞争也是劫持
费城西区有两个互为敌手的商店——纽约 廉价品商店和美国廉价品商店.他們正好紧挨 , 两店的老板是死敌 , 他們一直进行着没完 没了的价格战.出售爱尔兰亚麻床单 , 甚至连有 鹰一般眼睛的贝蒂·瑞珀女士都不能找出任何 疵点 , 不信请问她;而這床单的价格又低得可笑 , 只需6美元50美分".当一个店的橱窗里出 现這样的手写告示时每位顾客都会习惯地等另 家廉价品商店的回音. 果然, 大约过了两小时 , 另一家商店的橱窗里出现了這样的告示 : "瑞 珀女士该配副近视眼镜了 , 我的床单质量一流 , 只需5美元95美分".价格大战的一天就這 样开始了.除了贴告示以外 , 两店的老板还经常 站在店外尖声对骂 , 经常发展到拳脚相加 , 后总有一方的老板在這场价格战中停止争斗 , 价格不再下降.骂那个人是疯子 , 這就意味着那 方胜利了. 這时, 围观的、路过的、还有附近 一个人都会拥入获胜的廉价品商店 , 將床单和 其他物品抢购一空.在這个地区 , 這两个店的争 吵是最激烈的 , 也是持续时间最长的 , 因此竟 很有名声 , 住在
附近的每个人都从他們的争斗 中获益不少 , 买到了各式各样的"精美"商 品.突然有一天 , 一个店的老板死了 , 几天以后 , 另一个店的老板声称去外地办货 , 這两家商店 都停业了.过了几个星期 , 两个商店分别來了新 老板.他們各自对两个商店前任老板的财产进 行了详细的调查. 一天检查时 , 他們发现两店之 间有条秘密通道 , 并且在两商店的楼上两老板 住过的套房里发现了一扇连接两套房子的 门.新老板很奇怪 , 來一了解才知道 , 這两个 死对头竟是兄弟俩.原來 , 所有的诅咒、谩骂、 威胁以及一切相互间的人身攻击全是在演戏 , 每场价格战都是装出來的 , 不管谁战胜 , 后还是把另一位的一切库存商品与自己的一起 卖给顾客.真是绝妙的骗局。


四、 酒吧博弈问题( bar problem
酒吧博弈问题是美国人 W. B.Arthur1994 年在 《美国经济评论》发表的题为《归纳论证和有 界理性》一问中提出的,然后他又从 1999 年的 《科学》杂志上发表的《复杂性和经济学》一 文中阐述了这个博弈。 '' 该博弈是说:有一群人, 例如 n100,每个周末,均要决定是去一酒吧 活动还是呆在家里。酒吧的容量是有限的,假 定是 60 人。如果某人预测去酒吧的人超过 60 人,那么他决定去还是不去? 每个参与者或
决策者面临的信息只是以前去酒吧的人数,只 能根据以前的人数的信息来归纳出策略来。这 是一个典型的动态博弈问题。 ........... 通过计算机的 模型实验,阿瑟得出了一个有意思的结果:不 同的行动者是根据自己的归纳来行动的, 并且, 去酒吧的人数没有一个固定的规律,然而,经 过一段时间以后,去的平均人数总是趋于 60 阿瑟说,预测者自组织到一个均衡系统中去和 不去的人群,或形成一个生态稳定系统。 ................................. 这就是酒吧问题。 酒吧问题所反映的是这样
一个社会
现象,正象阿瑟教授说的那样,我们 在许多行动中,要猜测别人的行动,然而我们 没有更多关于他人的信息,我们只有通过分析
过去的历史来预测未来。





五、 枪手博弈
今天,我讲一个有关博弈论的经典故事。 此痛恨的甲、乙、丙三个枪手准备决斗。甲枪 法最好,十发八中;乙枪法次之,十发六中; 丙枪法最差,十发四中。 先提第一个问题: 如果三人同时开枪,并且每人只发一枪;第一 轮枪战后,谁活下来的机会大一些? 一般人 认为甲的枪法好,活下来的可能性大一些。但 合乎推理的结论是,枪法最糟糕的丙活下来的 率最大。 我们来分析一下各个枪手的策略。 枪手甲一定要对枪手乙先开枪。因为乙对甲的 威胁要比丙对甲的威胁更大,甲应该首先干掉 乙,这是甲的最佳策略。 同样
的道理,枪手 乙的最佳策略是第一枪瞄准甲。乙一旦将甲干 掉,乙和丙进行对决,乙胜算的概率自然大很 多。 枪手丙的最佳策略也是先对甲开枪。乙 的枪法毕竟比甲差一些,丙先把甲干掉再与乙 进行对决,丙的存活概率还是要高一些。 们计算一下三个枪手在上述情况下的存活几 率: 甲:24%(被乙丙合射
40% X 60% = 24% 乙:20%(被甲射 100% - 80% = 20%
丙:100% (无人射丙) 通过概率分析,我们发现枪法 最差的丙存活的几率最大,枪法好于丙的甲和 乙的存活几率远低于丙的存活几率。 但是, 上面的例子隐含一个假定,那就是甲乙丙三人 都清楚地了解对手打枪的命中率。但现实生活 中,因为信息不对称,比如枪手甲伪装自己, 让枪手乙和丙认为甲的枪法最差,在这种情况 下,最终的幸存者一定是甲。所以,无论是历 史,还是现实,那些城府很深的奸雄往往能成 为最后的胜利者。这样的例子,对你的职场生 涯或者官场生涯是否很有启发呢? 我们继续 假定,甲乙丙三人互相不了解对手的枪法水平。 在这种情况下,甲被乙射、甲被丙射、甲被乙 丙射及甲不被乙丙射的机率各为 25%,按贝氏
Bayes定理计算甲的存活率: 甲活率:
31%
被乙射: 25% X 40% = 10% + 丙射:
25% X 60% = 15% + 乙丙射: 25% X 40% X 60% = 6%)。 乙活率:23%被甲射:25% X 20% = 5% + 被丙射: 25% X 60% = 15% + 甲丙射: 25%X20%X60% = 3%)。 丙活率: 17%被甲 射:25% X 20% = 5% +
射:25% X 40% = 10% + 被甲乙射:
25% X 20% X 40% = 2%)。 在枪
手互相不知道对手命中率的信息的情况下,这 时命中率最高的枪手甲存活的几率最大,枪法 最差的丙存活的可能性最小。 我们现在回 甲乙丙都知道对手命中率的情形,进行第二轮 枪战的分析。 在第一轮枪战后,丙有可能面 对甲,也可能面对乙,甚至同时面对甲与乙, 除非第一轮中甲乙皆死。尽管第一轮结束后, 丙极有可能获胜(即甲乙双亡) ,但是第二轮开 始,丙就一定处于劣势,因为不论甲或乙, 们的命中率都比丙的命中率为高。 这就是枪 手丙的悲哀。能力不行的丙玩些花样虽然能在 第一轮枪战中暂时获胜。但是,如果甲乙在第 一轮枪战中没有双亡的话,在第二轮枪战结束 后,丙的存活的几率就一定比甲或乙为低。 二轮枪战中甲乙丙存活的几率粗算如下:

(1 假设甲丙对决:甲的存活率为 60%,丙的存活 率为 20% (2 假设乙丙对决: 乙的存活率为 60%,丙的存活率为 40% 这似乎说明, 能力 差的人在竞争中耍弄手腕能赢一时,但最终往 往不能成事。我们现在用严格的概率方法计算 一下两轮枪战后,甲乙丙各自的存活的几率。
(1 第一轮: 甲射乙,乙射甲,丙射甲。 的活率为 24%(40% X 60%,乙的活率为 20%(100% - 80% 丙的活率为 100%(无人射 (2 第二轮:
情况 1:甲活乙死( 24% X 80% = 19.2% 甲射丙,丙射甲──甲的活 率为 60%,丙的活率为 20% 2:乙活甲 (20% X 76% = 15.2% 乙射丙,丙射乙─ ─乙的活率为 60%,丙的活率为 40% 情况
3 甲乙皆活( 24% X 20% = 4.8% 重复第一轮。
4:甲乙皆死( 76% X 80% = 60.8% 枪战 结束。 甲的活率为
12.672% (19.2% X 60% + (4.8% X 24% = 12.672% 乙的活率为 10.08% (15.2% X 60% + (4.8% X 20% = 10.08% 的活 率为 75.52% (19.2% X 20% + (15.2% X 40% + (4.8% X 100% + (60.8% X 100% = 75.52%
对两轮枪战的详细概率计算,我们仍然发现枪
法最差的丙存活的
几率最大,枪法较好的甲和 乙的存活几率仍远低于丙的存活几率。 对于 这样的例子,有人会发出“英雄创造历史,庸 人繁衍子孙”的感叹。 我们现在改变游戏规 则,假定甲乙丙不是同时开枪,而是他们轮流 开一枪。在这个例子中,我们发现丙的机会好 于他的实力,丙不会被第一枪干掉,并且他可 能极有机会在下一轮中先开枪。 先假定开枪 的顺序是甲、乙、丙,甲一枪将乙干掉( 80% 的几率,就轮到丙开枪,丙有 40%的几率一 将甲干掉。即使乙躲过甲的第一枪,轮到乙开 枪,乙还是会瞄准枪法最好的甲开枪,即使乙 这一枪干掉了甲,下一轮仍然是轮到丙开枪。 无论是甲或者乙先开枪,乙都有在下一轮先开 枪的优势。 如果是丙先开枪, 情况又如何呢? 丙可以向甲先开枪,即使丙打不中甲,甲的最 佳策略仍然是向乙开枪。但是,如果丙打中了 甲,下一轮可就是乙开枪打丙了。因此,丙的 最佳策略是胡乱开一枪,只要丙不打中甲或者 乙,在下一轮射击中他就处于有利的形势。 们通过这个例子,可以理解人们在博弈中能否 获胜,不单纯取决于他们的实力,更重要的是 取决于博弈方实力对比所形成的关系。 在上 面的例子中,乙和丙实际上是一种联盟关系, 先把甲干掉,他们的生存几率都上升了。我们 现在来判断一下,乙和丙之中,谁更有可能背 叛,谁更可能忠诚?
任何一
个联盟的成员都 会时刻权衡利弊,一旦背叛的好处大于忠诚的 好处,联盟就会破裂。在乙和丙的联盟中,乙 最忠诚的。这不是因为乙本身具有更加忠诚 的品质,而是利益关系使然。只要甲不死,乙 的枪口就一定会瞄准甲。但丙就不是这样了, 丙不瞄准甲而胡乱开一枪显然违背了联盟关 系,丙这样做的结果,将使乙处于更危险的境 地。 合作才能对抗强敌。只有乙丙合作,才 能把甲先干掉。如果,乙丙不和,乙或丙单独 对甲都不占优,必然被甲先后解决。

六、 智猪博弈
猪圈里有两头猪, 一头大猪,一头小猪。 猪圈 的一边有个踏板,每踩一下踏板,在远离踏板 的猪圈的另一边的投食口就会落下少量的食 物。如果有一只猪去踩踏
板,另一只猪就有机 会抢先吃到另一边落下的食物。当小猪踩动踏 板时,大猪会在小猪跑到食槽之前刚好吃光 有的食物;若是大猪踩动了踏板,则还有机会 在小猪吃完落下的食物之前跑到食槽,争吃到 另一半残羹。 么,两只猪各会采取什么策 略?答案是:小猪将选择“搭便车”策略,也 就是舒舒服服地等在食槽边;而大猪则为一点 残羹不知疲倦地奔忙于踏板和食槽之间。
因何在?因为,小猪踩踏板将一无所获,不踩 踏板反而能吃上食物。对小猪而言,无论大猪 是否踩动踏板,不踩踏板总是好的选择。反观 大猪,已明知小猪是不会去踩动踏板的,自己 亲自去踩踏板总比不踩强吧,所以只好亲历亲 为了。 改变方案一:减量方案。投食仅原来 的一半分量。结果是小猪大猪都不去踩踏板了。 小猪去踩,大猪将会把食物吃完;大猪去踩, 小猪将也会把食物吃完。谁去踩踏板,就意味 着为对方贡献食物,所以谁也不会有踩踏板的 动力了。 如果目的是想让猪们去多踩踏板, 这个游戏规则的设计显然是失败的。 改变方 案二:增量方案。投食为原来的一倍分量。结 果是小猪、大猪都会去踩踏板。谁想吃,谁就 会去踩踏板。反正对方不会一次把食物吃完。 小猪和大猪相当于生活在物质相对丰富的“共 产主义"社会,所以竞争意识却不会
很强。
于游戏规则的设计者来说,这个规则的成本相 当高(每次提供双份的食物);而且因为竞争不 强烈,想让猪们去多踩踏板的效果并不好。

变方案三:减量加移位方案。投食仅原来的一 半分量,但同时将投食口移到踏板附近。结果
呢,小猪和大猪都在拼命地抢着踩踏板。等待 者不得食,而多劳者多得。每次的收获刚好消 费完。 对于游戏设计者,这是一个最好的方 案。成本不高,但收获最大。 许多人并未读 过“智猪博弈”的故事,但是却在自觉地使用 小猪的策略。股市上等待庄家抬轿的散户;等 待产业市场中出现具有赢利能力新产品、继而 大举仿制牟取暴利的游资;公司里不创造效益 但分享成果的人,等等。比如,公司的激励制 度设计,奖励力度太大,又是持股,又是期权, 公司职员个个都成了百万富翁,成本高不说, 员工的积极性并不一定很高。这相当于“智 博弈”增量方案所描述的情形。但是如果奖励 力度不大,而且见者有份(不劳动的“小猪” 也有),一度十分努力的大猪也不会有动力了 ------------------- 就象“智猪博弈”减量方案一所描述的情形。 最好的激励机制设计就象改变方案三 -------------- 减量加 移位的办法,奖励并非人人有份,而是直接针
对个人
(如业务按比例提成) ,既节约了成本(对 公司而言),又消除了“搭便车”现象,能实现 有效的激励。 而从整个社会来讲,自身需求 大的群体往往才是社会生产力推动的主力。换 句话说,要迅速提高整个社会的生产力水平, 就需要有一个自身具有很大消费需求的群体, 并且需要给他们一定程度的奖励。第三种改变 方案反映的就是这种情况,方案中降低了取食 的成本,在现实中,也可以等同于增加了对取 食者的奖励。

本文来源:https://www.2haoxitong.net/k/doc/c1fe811d6d1aff00bed5b9f3f90f76c660374ce2.html

《博弈论66个经典例子之六.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式