纳什均衡博弈方拥有占优策略(博弈之纳什均衡)(1)

图片来源网络

为何均衡前冠纳什之名?

纳什均衡是这样的一种博弈状态:对博弈参与人来说,针对对手选定的一个策略,则我选择的某个策略一定比选其他的策略好。即各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这么一个结果称为均衡。这个概念是由普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。

对于多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在于他天才性地提出了纳什均衡的基本概念,为更加普遍的博弈问题找到了解答。

纳什的好友,普林斯顿大学经济学教授迪克西特曾说:“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”

什么是纳什均衡?

简单说就是,一策略组合中,所有的参与者面临这样的一种情况: 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”, 这是唯一稳定的结果。

有些博弈的纳什均衡点不止一个,其最后结果难以预测。纳什均衡给我们的一个启示就是现实生活中经常存在这样一种情况:当你的利益与他人的利益发生冲突时,你要学会设法对其进行协调。如果现实不允许你最大限度地满足自己的利益,那么退而求次,总比让双方什么都得不到要强得多。而且你在这次博弈中所失的,可能会在下次博弈中获得补偿。

需要强调的是:均衡不一定是博弈的最优结果。在囚徒困境中,唯一的均衡是一起招认,站在群体的角度,这是最坏的结果。均衡只是博弈的最稳定结果,或者说是最可能出现的结果。

,