还剩3页未读,继续阅读
文本内容:
博弈论的假定与博弈分类博弈论是啥第二章博弈论的假定与博弈分类:第节博弈的定义及构成要素先看一个例子1例囚徒困境两个共同作案偷窃的小偷被警察抓住,被带进警察局单独关押他们面临的政策是坦白从宽,抗拒从严,具体的政策是如果一方与警方合2-
1..作,招认并供出自己与对方以前所做违法之事,而对方不招认,招认方无罪释放,“”“”不招认的另一方则会被判重刑年;如果双方都与警方合作共同招认,各被判刑年;而如果双方均不承认有罪,因警察找不到他们以前违法的证据,只能对他们10的小偷行为进行惩戒,各被判刑个月这两个小偷如何作出选择5这个博弈便称为囚徒困境博弈()普遍认为,囚徒困境最先3是由普林斯顿大学的塔克()教授于世纪年代提出的这个博prisoners’dilemma弈模型是一类现实原型的抽象,该博弈被广泛地讨论;在后面我们将详细地分析alberttucker2050它上述直观的博弈表述方式被称为支付矩阵,用之可表示人博弈该矩阵为诺贝尔奖获得者托马斯谢林最先使用的,该发明对于博弈论的普及意义重大2我们说过,一个博弈是其收益相关的两个或两个以上的参与人的策略互动在博弈•的标准式表示中,每个参与人同时选择一个策略,所有参与人选择策略的组合决定每个参与人的收益形式地,一个博弈可定义为定义在一个人博弈的标准式中,一个博弈可定义为,,,,,,,其中,,,为参与人的策略空间;,,,为参与人
2.
1.n g={s1s2„sn;u1的收益函数u2„un}s1s2„sn u1u2„un因此,简单地说,一个博弈涉及第一,两个或两个以上的参与人;第二,参与人的策略空间;第三,收益对于以上述形式描述或定义的博弈,其解是什么为了得到解概念,我们得先给出博弈论基本假定“”“”第节博弈论中的基本假定基本假定在博弈中每个参与人是理性的是博弈参与人之间的公共知识2这里涉及两个问题第一,什么是理性;第二,什么是公共知识我们先回答第二个问题我们说一个命题是公共知识是指,每个人知道,且每个人知道,每个人都知道,或者是公共知识指,每个人知道且每个人p p知道是公共知识在下面的章节中我们会详细地讨论这个概念p p„„p pp但对于第一个问题什么是理性的,我们很难给出准确回答理性本指推理要符合逻辑规则在决策中,这里的逻辑规则是广义的,它不仅包括形式逻辑的推理要“”求,而且包括决策规则对之,迈尔森说如果一个决策者在追逐其目标时能够前后一致地做决策,我们就称他是理性的()这样,理性意味着逻辑一致性或无矛盾性同时他“说在基于rational”决策理论的基本结论而建立起来的博弈论中,我们假设每个局中人的目标是追求其“个人期望支付值的最大化,支付则是用某个效用尺度来度量的()这样,理性决策者应该按使自己的期望支付最大化的方式去做决策”p2由于一个博弈涉及多个理性主体,由此,博弈论是研究交互理性()第节参与人的目标最大化期望效用interactiverationality人们采取行动是为了获得收益,在不同行动进行权衡其目的在于获得最大收益我3们如何刻画收益呢我们往往用效用来刻画收益效用是某个物品或行动结果给主体所带来的满足程度这个满足程度与物品的量或刻画行动结果的参数之间是一个函数关系,这便是效用函数然而,我们所采取的行动与结果及效用之间往往是不确定性关系我进行房产投资,是否能够从房价上涨中获益,这是不确定的;我将钱存入银行,获得本金及利息的确定性稍高,但没人能够保证这种确定是百分之百如何刻画这种不确定性决策参与人决策的类型确定性决策与不确定性决策从上世纪年代开始,拉姆齐()、萨维奇()萨维奇和冯诺依曼等人发展了决策的期望效用理20论在确定性条件下,参与人的目标是效用最大化;在不确定性条件下决策者的目f.ramsey savage标是期望效用最大化博弈论的逻辑基础是贝叶斯决策理论,或主观主义决策理论贝叶斯决策理论认为,理性决策者的行为被认为是对某个物品或结果的效用值与实现这个效用者的盖然性之间乘积的盘算这里理性决策者所盘算或考虑的便是期望效用这里,所涉及的两个概念效用与概率都是对主体的主观行为的度量,它们是主观值我们说它们是主观的,指的是不同的人对同样的物品的效用评价及对同一个事件的发生盖然性能够是不同的效用与货币支付不成线性比例帮助我们理解效用概念的两个决策悖论圣彼得堡悖论与交换悖论例圣彼得堡悖论你和庄家进行这样一个投掷硬币的赌博你给予庄家一定数量的赌金以进行如下赌博若第一次硬币出现反面,游戏终止,你无所得,而若出
2.
2.现正面,庄家输元给你,且赌博投继续进行;若第二次投掷硬币,硬币出现反面,游戏终止;而若出2现正面,则庄家输给你元,游戏继续进行似乎是,对你而言,预先付给庄家任何数量的金钱进行这样的游戏,均是合算14„„的因为m是吗u1=2×1/2+4×1/4+„n×1/n+„=∞m例他人的钱包总是诱人的任何一个赌博都至少与一个不确定事件相关一个公平的赌博是一个可交换位置
2.
3.的赌博由于不同的人对于同一个不确定事件的配置的概率不同,对于一个人是确1定性事件,对于另外一个人是不确定事件的赌博不可能是公平的存在这样的情况,对两个人而言都有利的赌博人们可通过设计涉及多个不确定事件的赌博而从中获利有两个钱包,甲乙知道,其中一个人钱包中的钱的数量是另外一个的两倍;并且他们已知道,钱的范围为元老师将钱包分给了甲和乙甲和乙打开钱包后看到了自己钱包中钱数(看不到对方钱包中的钱的多少),假定甲钱包中的数量为5-160元;乙钱包中的钱包中的数量为元老师说现在允许你们进行交换问甲、乙交换合算还是不交换合算2040分析对于甲,对方钱包中为的概率为,为的概率为因此,若交换的话获得因此,交换是合理的401/2101/2对于乙若交换,因此,交换是合理的40×1/2+10×1/2=2520但是,他们钱包中的总数是一定的,不可能通过交换双方的收益增加了80×1/2+20×1/2=
5040.定义占优与被占优对于两个策略、,如果,采取的效用在任意一个可能状态下都不低于采取的策略的效用,那么,我们说与相比,是占优策s s’s略,为被占优策略“”s’s s’s严格占优与严格被占优如果采取的效用在任意一个可能状态下都大于采取s’的策略的效用,那么,我们说与相比,是严格占优策略,为严格被占优策s“”s’略s s’s s’例子相对于是严格被占优策略,相对于是严格占优策略s1s2s2s1注意()某策略是占优的或被占优的是相对于另外一个策略而言的;因此占优策略或被占优策略是相对的()该定义不要求策略下的效用是可计算的,但要1求效用是可比较的(可计算的当然是可比较的,反之不成立)2定理理性人是不会采取严格被占优策略的这样,在决策中我们可以剔除或偿付剔除严格被占优策略来进行理性选择在实际中我们常用策略排序法来进行策略选择,这与剔除严格被占优策略是一致我们通常说,两害相权取其轻,两利相权取其重便是策略决策法《孙子兵“”法》中所体现的背后的决策原则也是策略排序法如孙子曰上兵伐谋,其次伐“”交,其次发兵,其下攻城,再比如百战百胜非善之善者也,不战而屈人之兵,善“之善者也等,体现了孙子的从多种可选的策略中尽可能地确定上策”“第节多标准下的博弈分类”根据不同的标准,博弈分为静态与动态;完全信息与非完全信息;合作与非合作博4弈零和与非零和静态博弈和动态博弈静态博弈指参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动动态博弈指参与人的行动有先后顺序,并且后采取行动的人在行动决策时可以观察到先采取行动的人所采取的行动合作性博弈和非合作性博弈根据参与人能否形成约束性的协议、以便集体行动,博弈可分合作性博弈和非合作性博弈纳什等博弈论专家研究得更多的是非合作性博弈所谓合作性博弈是指参与人从自己的利益出发与其他参与人谈判达成协议或形成联盟,其结果对联盟形成方均有利;而非合作性博弈是指参与人在行动选择时无法或没有达成约束性的协议企业的形成、政治联盟的构建等都是合作性的博弈,而囚徒困境以及本书后面所讨论的公共资源悲剧都是非合作性的博弈从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈信息是博弈分析所要涉及到的重要的内容完全信息博弈指参与人对所有参与人的策略空间及策略组合下的支付有完全的了解,否则是不完全信息博弈严格地讲,完全信息博弈是指这样的博弈,参与人的策略空间及策略组合下的支付是博弈中所有参与人的“”公共知识,否则是不完全信息博弈零和博弈与非零和博弈所谓零和博弈是指,博弈各方在各种可能性下的得益之“”和均为一常数零;常和博弈是指,博弈各方在各种可能性下的所得之和为一个非零“”常数;而变和博弈指的是博弈各方在不同情况下的所得之和为变数或变量思考题“”给出一个身边的博弈,给出它的博弈要素
1.分别给出动态博弈与静态博弈、零和博弈与非零和博弈、合作与非合作的博弈例子
2.。