完全信息静态博弈

发布时间:2019-12-07 09:06:55   来源:文档文库   
字号:

第七讲 完全信息静态博弈

即使是在不久以前,好事者仍将经济计量学与博弈论比作日本和阿根廷。在20世纪40年代晚期,这两门学科都有远大前程,而这两个国家也都充满了希望,准备高歌猛进,对世界产生深远的影响。日本和阿根廷经济随后发生了什么已是众所周知。而对这两门学科来说,经济计量学成了经济学中必不可少的一部分,博弈论则萎缩成一门子学科。他只对博弈论专家来说乐趣无穷,却为整个经济学界所遗忘。这些博弈论专家一般都是数学家。他们更关注定义与证明,而非将这一方法运用于经济问题。他们为自己的理论能在众多学科中运用而倍感自豪,但没有一门学科将博弈论作为自身不可分割的一部分。

但是到了70年代,再将博弈论比作阿根廷就不恰当了。正但阿根廷迎回其前独裁者胡安.庇隆之时,经济学家发现博弈论与复杂的经济问题结合起来可能会得到的结果。理论与应用方面的创新对于分析非对称信息和动态行为尤为有用。在80年代,博弈论迅速成为主流经济学的重要组成部分。事实上,他几乎吞没了整个微观经济学,即如同经济计量学吞没了经验经济学一样。

博弈论与现代经济学

传统经济学:新古典范式或阿罗-德布鲁体系:研究资源的有效配置。在市场完全的假设下,认为市场(价格)能使资源得到最合理的配置,因而,又称为价格理论。

现代经济学;1980年代以后的经济学:研究人的理性行为。在现代经济学看来,人的行为至少有两个特点:信息不完全或不对称;人的行为相互影响。而传统经济学将人的决策行为概括为约束条件下的最大化。假设不存在信息行为,而其他人的行为的影响被总结在环境参数。

而现代经济学进一步对人与人的相互影响建模。而目前人们找到的研究人与人之间的相互影响的行为(策略行为)的合适工具就是博弈论。

博弈论(game theory)是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的一个分析工具。

第一节博弈论的基本概念

例:房地产开发博弈

两个房地产商A,B准备在某地段开发一栋房产,投入资金为1亿元。

如果市场上有两栋楼出售,需求大时,每栋楼售价1.4亿元,需求小时每栋楼售价为0.7亿元;

如果市场上只有一栋楼出售,需求大时,每栋楼售价1.8亿元,需求小时每栋楼售价为1.1亿元。

假定双方同时决策,每一方决策时不知道对方的决策。

如果市场需求已知,如何决策?

三、4.2过程,知道所有参与人的占优策略组合就是一个占优策略组合________________________________________________________________________________________________a、市场需求大时?

b、市场需求小时?

如果市场需求不知,如何决策?

博弈论的基本概念:

1参与人player:指的是一个博弈中的决策主体,其目的是通过选择行动策略以最大化自己的支付(效用)水平

自然”是虚拟参与人(pseudo-player),他在博弈的特定时点上以特定的概率选择随机行动。例如,自然随机选择市场需求的大小。

2行动:参与人i的行动以ai表示,是他所能做的某一选择。

参与人i行动集action setAi={ai},是其可以采取的全部行动的集合。

例如:AA={开发,不开发}AB={开发,不开发}

一个行动组合action profile)是一个由博弈中的n个参与人每人选择一个行动而组成的有序集,a={ai),(i=1,...,n).

例:a=(开发,开发)表示A选择开发,B也选择开发。

行动的顺序

3信息:是参与人有关博弈的知识,如自然的选择,其他参与人的特征和行动等知识。

4、参与人的策略strategysi参与人在给定信息集下的行动规则,他规定参与人在每一时点选择何种行动。si表示参与人i的一个特定策略。

参与人的策略集strategy set;strategy space)或策略空间Si={si}是其可行策略的集合。

策略组合(strategy profile)s(s1,s2,...,sn)是由博弈的n个参与人每人选择一个策略的集合

例:博弈条件为参与人B在不知道市场需求的情况下先行动,A在得知B的行动后再选择自己的行动。

自然

B B

开发 不开发

A

开发 不开发 开发 不开发

B的策略为:SB={开发,不开发},即B的策略是如果市场需求大就开发,否则不开发。

A的策略是:Sa={(开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发)}x,yx对应b开发时的a的行动,y对应b不开发时a的行动.

*策略不同于行动。请分析上例中A的行动?

*策略必须是完备的。比如,上例中如果市场需求大,那么A可以肯定B会开发,但也必须在策略集中给出B不开发的情况。这是因一个人的策略会影响另一个人的行动。

比如:红军对付白军的策略是:人不犯我,我不犯人;人若犯我,我必犯人。这个策略使白军不敢犯我。但是策略必须包括人若犯我的情况。否则,就不能保证敌人不犯我。

5支付/收益payoff:是指在一个特定的策略组合下参与人得到的确定效用水平(收益),或指参与人得到的期望效用水平(收益)。

u=(u1,u2,...ui,...un)n个参与人的支付组合payoff profile

参与人i的支付是所有参与人的策略的函数:

ui=ui(s1,...si,...sn)

6、一个博弈(分析)的结果outcome是博弈分析者所感兴趣的所有东西,如均衡策略组合,均衡行动组合,均衡支付组合等等,取决于博弈分析者的到底需要什么。

7均衡是所有参与人的最优策略的组合:

s*=(s1*,...si*,...,sn*)

其中si*表示第i个参与人在均衡条件下的最优策略:

ui(si*,s-i)ui(si',s-i)对任意的si'si*.

例:如果两开发商同时行动,

如果需求大,则均衡是(开发,开发);

如果需求小,则存在两个均衡(开发,不开发),(不开发开发)

第二节 策略博弈与占优博弈

完全信息:根据博弈的各方参与人是否了解自己和其他参与人在每种结果(策略组合)下的收益情况,可以将博弈分为完全信息和不完全信息。

如果各个博弈参与人都完全了解所有博弈参与人在各种情况下的支付,这种博弈就是完全信息博弈。否则就是不完全信息博弈。

例:囚徒困境,每个囚徒对于自己每种策略(抵赖,坦白)的支付都是清楚的。

在房地产博弈中,如果参与人对市场需求不了解,那么他们并不能确定他们进入或不进入策略的支付,因而是不完全信息。

静态博弈:各个参与人同时决策(不一定是时间上同时决策,只要求每一个参与人在决策之前不知道其他参与人的决策,例如也许对每个囚徒的审讯有前有后,但只要后审讯的囚徒不知道前面囚徒的决策就可以认为它们是同时决策的。)

一、博弈的策略式表述

一般用策略式(strategic form representation)表述法描述静态博弈,而用扩展式表述(extensive form representation)描述动态博弈。

策略式表述一般要给出博弈的参与人,每个参与人的策略集和支付函数。

一个博弈如果1、参与人的个数是有限的;2、每个参与人的策略也是有限的,则是有限博弈,两人(有时三人博弈可以用策略式表述)。

例:囚徒困境

二、占优策略均衡

分析囚徒困境中的(坦白,坦白)策略组合。。。

如果,不管其他参与人的策略是什么,某个参与人的某个策略都严格优于其它策略,并且其他参与人也同样有一个策略严格由于其它策略并不受其他参与人的影响,那么,所有参与人的占优策略组合就是一个占优策略均衡。

参与人在任何情况下都会选择这个占优策略组合,这样的占优策略组合就称为占优策略均衡(dominant strategy equilibrium)。

如果一个博弈中,每一个参与人都存在占优策略,那么均衡一定是占优策略均衡。

重复删除的占优均衡

例:智猪博弈

“重复剔除劣策略”解题思路:1、找出参与人的劣策略,把这个劣策略剔除掉;2、在剩下的博弈中重复第一步:剔除劣策略;3、继续这个过程,直到只剩下唯一的策略组合为止,这个(均衡)策略组合就是重复剔除的占优策略。

2.1.4划线法

例:囚徒困境

解题思路:针对对方的每一个策略找出其最优的策略,并在其对应的支付下划线;对另一个参与人也是如此。两个支付下面都划了线的策略组合就是均衡策略。

练习:1、智猪博弈

2、猜硬币博弈

3、性别战

第三节 纳什均衡

前面用划线法求出的具有稳定性的均衡策略组合,不管是否唯一,都有一个共同的特点,就是每一个博弈参与人的策略都是其他参与人的策略的最佳对策。具有这种性质的均衡策略组合被称为纳什均衡。

定义:在博弈G={S1,...,Sn;u1,...,un}中,如果策略组合中,任意参与人的策略都是针对其余参与人的策略组合的最佳策略,即:

则称为博弈G的一个纳什均衡(Nash Equilibrim)。

在纳什均衡中由于每一个参与人都选择的是针对其他参与人的策略的最佳策略,因而每一个参与人都没有激励改变其初始决策(策略),因而纳什均衡是稳定的。

性别战(多重纳什均衡)

猜硬币博弈(不存在纳什均衡)。

每一个占优策略均衡、重复剔除的占优均衡都是纳什均衡,

第四节 混合策略与混合策略纳什均衡

一、混合策略

混合策略博弈和混合策略纳什均衡

分析猜硬币博弈。盖硬币一方必须:1、保证自己的策略选择不能被猜硬币一方预先知道;2、如果博弈多次进行,那么盖硬币一方的策略必须是无规律的。3、正面和反面的概率必须是0.5。对于猜硬币方也是如此。

猜硬币游戏中,两个参与人的最佳策略都是以0.5的概率选择正面,0.5的概率选择反面。这种参与人以一定的概率分布在可选策略中随机选择的决策方式称为“混合博弈”(mixed strategies),相应的前面分析中参与人只选择特定的策略的博弈称为“纯策略”

例:猜硬币博弈,双方都以0.5的概率选择正面和反面时的期望效用函数:

猜硬币方1u1(0.5,0.5)=0.5*[1*0.5+(-1*0.5)]+0.5*[(-1*0.5+1*0.5]

给定对方的混合策略,参与人的最优混合策略是使其期望效用函数最大化的混合策略。所有参与人的最优混合策略的组合即混合策略纳什均衡。

定义混合策略纳什均衡:n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i12...n下式成立:

也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略

解混合策略纳什均衡的方法

1、最大化支付法:即最大化各个参与人的效用函数。

2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。

二、社会福利博弈

解法1、最大化期望效用函数法:

假定政府的混合策略是,流浪汉的混合策略是:

政府的期望效用函数为:

求导得最优化一阶条件:

同理,最大化流浪汉效用函数得政府救济的概率是:

解法二:期望支付相等法

假设流浪汉的混合策略为(r,1-r),政府选择纯策略救济的期望支付是:

选择纯策略不救济的期望支付是:

4r-1=-r r*=0.2

同理可得政府救济的概率为:

政府的行动是:

流浪汉的行动:

画图即得反应对应:

r

1

0.2 NE

0 0.5 1 θ

三、多重均衡博弈与混合策略

一、性别战

期望支付相等法:

妻子的混合策略(w,1-w)应该使丈夫看足球与时装表演的期望支付相同:

w*1+(1-w)*0=w*0+(1-w)*3

w0.25

丈夫的混合策略应使妻子的期望支付相等:

h*2+(1-h)*0=h*0+(1-h)*1

h*=1/3

在混合策略纳什均衡((1323),(0.750.25))下,妻子的期望支付是:

w*h*2+(1-h)*0+(1-w)[h*0+(1-h)*1]=0.67

丈夫的期望支付是:

h[w*1+(1-w)*0]+(1-h)[ w*0+(1-w)*3]=0.75

都小于双方协商沟通时得到的支付。

本可以用那些和他们一起抱怨人生的时间,来读一篇有趣的小说,或者玩一个你喜欢的游戏。

  渐渐的,你不再像以往那样开心快乐,曾经的梦想湮灭在每日回荡在耳边的抱怨中。你也会发现,尽管你很努力了,可就是无法让你的朋友或是闺蜜变得更开心一些。

  这就不可避免地产生一个问题:你会怀疑自己的能力,怀疑自己一贯坚持的信念。

  我们要有所警惕和分辨,不要让身边的人消耗了你,让你不能前进。

  这些人正在消耗你。

  01. 不守承诺的人

  承诺了的事,就应该努力地去做到。

  倘若做不到,就别轻易许诺。这类人的特点就是时常许诺,然而做到的事却是很少。于是,他的人生信用便会大大降低,到最后,也许还会成为一种欺诈。如果发现身边有这样的人,应该警惕,否则到最后吃苦的还是自己。

  02. 不守时间的人

  俗话说浪费别人的时间就等于谋财害命,所以不守时间也就意味着是浪费别人的时间。与这种人交往的话,不仅把自己的时间花掉了,还会带来意想不到的麻烦。

  03. 时常抱怨的人

  生活之事十有八九是不如意的,这些都是正常的。

  我们应该看到生活前进的方向,努力前进。而不是在自怨自艾,同时还把消极的思想传递给别人。这样的人呢,一遇到困难便停滞不前,巴不得别人来帮他一把。本来你是积极向上的,可是如果受到这种人的影响,那么你也很有可能会变成这样的人,所以应该警惕。

  04. 斤斤计较的人

  凡事都斤斤计较的人,看不到远方的大前途,一味把精力放在小事上。比如两个人去吃饭,前提是AA制。然后饭吃好后他多付了5毛,最后他说我多付了5毛,你抽空给我吧。如此计较的人,失去了知己,也不会有很大的前途。

  05. 不会感恩的人

  你善心地帮助了他,可是他却不以为然,而且还想当然的认为这是应当的。多次地帮助,换来的没有一句感谢的话语,更有甚者,还在背后说别人的坏话,真是吃力不讨好。

  06. 自私自利的人

  以自我为中心,不会考虑别人的感受,想怎样就是怎样,也不会考虑大局,只为自己的感受。这种人,为了达到自己的私利会不择手段。

  如果看完以上的描述,你的脑海里冒出一张张熟悉的脸,显然,你正在被人日复一日地消耗着。这种消耗绝对可以毁你于无形之中。

  这些方法带来阳光

  那么,如何给自己搭建一个严严实实的保护网,让自己始终正能量爆棚,每一分钟都是恣意的阳光呢?跟着我们下面这五步做吧!

他们继续往前走。走到了沃野,他们决定停下。

  被打巴掌的那位差点淹死,幸好被朋友救过来了。

  被救起后,他拿了一把小剑在石头上刻了:“今天我的好朋友救了我一命。”

  一旁好奇的朋友问到:

  “为什么我打了你以后你要写在沙子上,而现在要刻在石头上呢?”

  另一个笑笑回答说:“当被一个朋友伤害时,要写在易忘的地方,风会负责抹去它;

  相反的如果被帮助,我们要把它刻在心灵的深处,任何风都抹不去的。”

  朋友之间相处,伤害往往是无心的,帮助却是真心的。

  在日常生活中,就算最要好的朋友也会有摩擦,也会因为这些摩擦产生误会,以至于成为陌路。

  友情的深浅,不仅在于朋友对你的才能钦佩到什么程度,更在于他对你的弱点容忍到什么程度。

  学会将伤害丢在风里,将感动铭记心底,才可以让我们的友谊历久弥新!

  友谊是我们哀伤时的缓和剂,激情时的舒解剂;

  是我们压力时的流泻口,是我们灾难时的庇护所;

  是我们犹豫时的商议者,是我们脑子的清新剂。

  但最重要的一点是,我们大家都要牢记的:

  “切不可苛求朋友给你同样的回报,宽容一点,对自己也是对朋友。”

  爱因斯坦说:“世间最美好的东西,莫过于有几个头脑和心地都很正直的朋友。”

本文来源:https://www.2haoxitong.net/k/doc/c6799a88d6d8d15abe23482fb4daa58da0111cd2.html

《完全信息静态博弈.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式