纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略( 三 )


最常见混和策略就是猜硬币游戏 。比如在足球比赛开场 , 裁判将手中的硬币抛掷到空中 , 让双方队长猜硬币落下的正反面 。由于硬币落下是正是反是随机的 , 概率应该都是1/2 。那么 , 猜硬币游戏的参与者都是1/2的概率选择正与反 , 这时博弈达到混和策略纳什均衡 。
再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡 , 对每个小孩来说 , 自己采取出“剪”、“布”、还是“锤”的策略应当是随机的 。一旦一方知道另一方出其中某个策略的可能性增大 , 那么这个对弈者在游戏中输的可能性就增大 。因此 , 每个小孩的最优混合策略是采取每个策略的可能性是l/3 。在这样的博弈中 , 每个小孩各取三个策略的1/3是纳什均衡 。
由此可见 , 纯策略是参与者一次性选取的 , 并且坚持他选取的策略 。而混合策略是参与者在各种备选策略中采取随机方式选取的 。
在博弈中 , 参与者可以改变他的策略 , 而使得他的策略选取满足一定的概率 。当博弈是零和博弈时 , 即一方所得是另外一方的所失时 , 此时只有混合策略均衡 。对于任何一方来说 , 此时不可能有纯策略的占优策略.
?通过了一学期的博弈论学习, 在日常生活中 , 知道可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题.日常生活中的一切 , 均可从博弈得到解释 , 大到美日贸易战 , 小到今天早上你突然生病 。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化 , 参与博弈的博弈者正是为了自身效用的最大化而互相争斗 。参与博弈的各方形成相互竞争相互对抗的关系 , 以争得效用的多少决定胜负 , 一定的外部条件又决定了竞争和对抗的具体形式 , 这就形成了博弈 。
孙子兵法》上说:“知己知彼 , 百战百胜 。”可见竞争对抗还有博弈各方拥有信息的特征 。比如上一个例子中 , 博弈双方都明白对方的策略 , 从博弈理论来说 , 更拗口的说法是一方知道另一方知道自己的策略 , 反之另一方亦然 , 这种句法我们可以一直这么用下去 , 一直用到打“……” , 而这正是博弈双方所掌握的公共信息 。
因此我们可以了解到 , 形成一个博弈有4个要素:
1.博弈要有2个或2个以上的参与者(Player) 。在博弈中存在一个必须的因素 , 那就是不是一个人在一个毫无干扰的真空里做出决策 。比如一个单身汉 , 就不可能存在夫妻吵架的博弈 , 更不存在是否送花讨太太欢心的困扰 。
从经济学的角度来看 , 如果是一个人做决策而不受到他人干扰的话 , 那就是一个传统经济学或管理学中最经常研究的最优化问题 , 也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题 。
任何理论与方法都不是万能的 。博弈论亦然 , 它不可能包治百病 。
Q5:什么是纳什均衡理论?纳什均衡又称非合作博弈均衡 , 是博弈论中的一个重要术语 , 以约翰·纳什的名字命名 。在博弈过程中 , 无论对方的战略选择是什么 , 一方都会选择一定的战略 , 这就叫主导战略 。如果两个博弈者的战略组合构成各自的主导战略 , 则该组合被定义为纳什均衡 。
当每个球员的平衡策略是达到其预期收益的最大值时 , 一个策略组合被称为纳什均衡 , 同时 , 所有其他球员遵循这一策略 。
扩展资料;
纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡 。
要解释纯策略纳什均衡和混合策略纳什均衡 , 首先要解释纯策略和混合策略 。
所谓纯策略 , 就是为玩家提供一个完整的游戏定义 。特别是 , 纯粹的策略决定了在任何情况下都要进行的运动 , 策略集合是玩家可以执行的纯策略集合 。
混合策略是通过给每一个纯策略分配一个概率而形成的策略 , 混合策略允许玩家随机选择纯策略 , 在混合策略博弈的均衡中 , 由于每个策略都是随机的 , 当达到一定的概率时 , 就可以得到最优支付 。由于概率是连续的 , 即使策略集是有限的 , 也会有无限的混合策略 。


推荐阅读