通俗解释博弈论（博弈论究竟是什么①）

《博弈论究竟是什么》是我执行“51工程”阅读的第一本书，博弈论也是我最近在思考的新算法，这本书很薄，但是内容很多，由于我是第一次接触博弈论，所以理解博弈论有一些困难为了更深入理解博弈论，我又找到《博弈与社会》，可是这本书对我来说更复杂，我只好又看了两遍《博弈论究竟是什么》，我来为大家科普一下关于通俗解释博弈论?以下内容希望对你有帮助!

通俗解释博弈论

《博弈论究竟是什么》是我执行“51工程”阅读的第一本书，博弈论也是我最近在思考的新算法，这本书很薄，但是内容很多，由于我是第一次接触博弈论，所以理解博弈论有一些困难。为了更深入理解博弈论，我又找到《博弈与社会》，可是这本书对我来说更复杂，我只好又看了两遍《博弈论究竟是什么》。

《博弈论究竟是什么》有非常多的概念，这篇文章我想把这些概念整理出来，方便我自己应用，所以这篇文章还是为我自己写的，如果你想了解更多博弈论，最好还是去阅读《博弈论究竟是什么》和《博弈与社会》。

概念一：何谓博弈论

博弈论研究如果你想要的东西别人也想要，你们在这件事上有冲突，那你应该怎么办才能让自己在这个东西的利益最大化？

博弈论研究的决策不是情绪化的，而是由利益格局决定的。

博弈论研究有对手情况下的决策。

博弈论研究理性人之间的博弈。

博弈论能帮助我们理解长期存在的各种现象，如果你观察到社会上有很多不合理的现象，而这些现象长期存在，博弈论会帮助你考察现象背后的博弈规则。

博弈论最重要的作用是告诉我们如何改变不好的局面。

下面我们通过一个小案例，理解博弈论。

很多人都有这样的经历——景区的饭菜不仅贵而且很难吃。

为什么景区的饭不能做得既实惠又可口？

因为这里有一个单次博弈概念。

我们去过一个景区，可能这辈子就不会再去，所以景区的饭店和我们只交易一次，这就是单次博弈，既然我们以后不会再来，饭店会尽可能在我们身上获取最大收益，在这种情况下，景区的饭菜既贵又难吃。

和单次博弈对应的是重复博弈。

你家楼下的小饭店做的就是重复博弈，他希望你每天都来，所以饭菜既实惠又好吃。

当我们和别人交易时，我们要考虑是一锤子买卖还是长期合作，如果是一锤子买卖我们被骗的可能性比较高，所以我们需要一些方法保护我们的利益，比如签合同。

以前我们可能认为博弈论是非常高大上的东西，国家和国家之间才会有博弈，实际博弈论就在我们身边，我们每天都在参与各种各样的博弈，只是因为之前我们缺乏这方面的知识，没有发现博弈的存在。

概念二——博弈论三个基本概念：帕累托最优、压倒性策略、纳什均衡

帕累托最优

帕累托改进的意思是这个改进在不伤害任何一个人利益的同时，使至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地，这个局面就是帕累托最优。

比如一条一百米的步行街要开两家奶茶店，而这两家奶茶店开在什么样的位置才是帕累托最优？

第一家奶茶店在步行街的25米处，第二家在步行街的75米处，这样两家奶茶店都能辐射50米距离，这就是帕累托最优。

因为帕累托最优是不稳定的，总有一家奶茶店想往中间（50米）移动，因为这样可以辐射整条步行街，当第一家奶茶店开始移动，第二家也会移动，最终两家奶茶店都会集中在中间。

这样就会形成扎堆现象，我们生活中有很多扎堆现象，比如麦当劳和肯德基、中石油和中石化，所有的服装店都聚集在一起，所有的饭店也聚集在一起，当一个热点新闻出现后所有的媒体都在报道。

压倒性策略

在谈压倒性策略之前，我们需要知道囚徒困境概念。

两个罪犯被抓到，但是警察没有直接证据，只能通过口供才能定罪。如果两个都招供，各判3年；如果一个不招供，一个招供，招供的有戴罪立功表现，释放，不招供的就会判5年；两个人都不招供，警方因证据不足，各判1年。

在囚徒困境中，我们看到，对两个罪犯最好的策略是都不招供，各判1年，这就是帕累托最优，可是帕累托最优是不稳定的，因为在做决策的时候，我们还要考虑对方。

如果罪犯A选择不招供，但是罪犯B选择招供，结果罪犯A判5年，罪犯B无罪释放，这显然对罪犯A不利。

如果罪犯A选择招供，但是罪犯B不招供，结果是罪犯A无罪释放，罪犯B判5年，这是对罪犯A最好的选择。

基于这个因素，无论罪犯B怎么选，罪犯A最好的选择都是招供。

这就是压倒性策略，不管对手怎么选，这个选择对你来说都是最好的。

与压倒性策略对应的是被压倒性策略，不管别人怎么做，你这么做都是对你最不好的。

作为理性人，如果博弈中有压倒性策略，就一定要选它。任何情况下都不要选被压倒性策略。

纳什均衡

纳什均衡是博弈论中最重要的概念。

何谓纳什均衡，我们再回到囚徒困境。

罪犯A最好的策略是招供，罪犯B最好的策略也是招供，结果两个人各判3年，这肯定不是帕累托最优，但这是纳什均衡。

纳什均衡指的是这样的一种局面：在这个策略组合里，没有任何一方愿意单方面改变自己的策略。

不招供是最好的选择，但是要变大家要一起变，但是每个人都不愿意先变，最终这个局面就不变了。

如果一种现象能够在社会中长期稳定存在，它对参与的各方来说一定是纳什均衡。

纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好，他必须得让每个参与者都不愿单方面改变才行。

理想青年喜欢帕累托最优，理性青年寻找纳什均衡。

可能有些人觉得纳什均衡难以理解，我们再举一个简单案例。

我们国家的交通规则是右侧通行，这实际就是一个纳什均衡。

如果你逆向而行，轻则开罚单，重则造成车祸，所以没有人愿意单方面违反这条规则。

还有一个案例可能更生动，前段时间，很多教育股大跌，我没有关注具体情况，但是教育股涉及一个问题——补课，补课实际就是一个纳什均衡，而且还是一个多人囚徒困境。

如果学生每天都在有限的时间内学习，并且保证一定的休息和玩耍时间，大学的录取名额还是这么多。

但是现在很多学生花费了更多时间去补课，但是大学的录取名额并没有增加。

如果别人都在复习，而你不复习就会吃亏，所以你不可能单方面改变这个局面。

纳什均衡是一个美丽概念，它能解释很多现象，能让我们迅速破解各种博弈局面，更能给我们设计博弈机制提供约束条件。

未完，待续……

通俗解释博弈论（博弈论究竟是什么①）

最新推荐

热门推荐