《博弈论究竟是什么》是我执行“51工程”阅读的第一本书,博弈论也是我最近在思考的新算法,这本书很薄,但是内容很多,由于我是第一次接触博弈论,所以理解博弈论有一些困难为了更深入理解博弈论,我又找到《博弈与社会》,可是这本书对我来说更复杂,我只好又看了两遍《博弈论究竟是什么》,我来为大家科普一下关于通俗解释博弈论?以下内容希望对你有帮助!

通俗解释博弈论(博弈论究竟是什么①)

通俗解释博弈论

《博弈论究竟是什么》是我执行“51工程”阅读的第一本书,博弈论也是我最近在思考的新算法,这本书很薄,但是内容很多,由于我是第一次接触博弈论,所以理解博弈论有一些困难。为了更深入理解博弈论,我又找到《博弈与社会》,可是这本书对我来说更复杂,我只好又看了两遍《博弈论究竟是什么》。

《博弈论究竟是什么》有非常多的概念,这篇文章我想把这些概念整理出来,方便我自己应用,所以这篇文章还是为我自己写的,如果你想了解更多博弈论,最好还是去阅读《博弈论究竟是什么》和《博弈与社会》。

概念一:何谓博弈论

博弈论研究如果你想要的东西别人也想要,你们在这件事上有冲突,那你应该怎么办才能让自己在这个东西的利益最大化?

博弈论研究的决策不是情绪化的,而是由利益格局决定的。

博弈论研究有对手情况下的决策。

博弈论研究理性人之间的博弈。

博弈论能帮助我们理解长期存在的各种现象,如果你观察到社会上有很多不合理的现象,而这些现象长期存在,博弈论会帮助你考察现象背后的博弈规则。

博弈论最重要的作用是告诉我们如何改变不好的局面。

下面我们通过一个小案例,理解博弈论。

很多人都有这样的经历——景区的饭菜不仅贵而且很难吃。

为什么景区的饭不能做得既实惠又可口?

因为这里有一个单次博弈概念。

我们去过一个景区,可能这辈子就不会再去,所以景区的饭店和我们只交易一次,这就是单次博弈,既然我们以后不会再来,饭店会尽可能在我们身上获取最大收益,在这种情况下,景区的饭菜既贵又难吃。

和单次博弈对应的是重复博弈。

你家楼下的小饭店做的就是重复博弈,他希望你每天都来,所以饭菜既实惠又好吃。

当我们和别人交易时,我们要考虑是一锤子买卖还是长期合作,如果是一锤子买卖我们被骗的可能性比较高,所以我们需要一些方法保护我们的利益,比如签合同。

以前我们可能认为博弈论是非常高大上的东西,国家和国家之间才会有博弈,实际博弈论就在我们身边,我们每天都在参与各种各样的博弈,只是因为之前我们缺乏这方面的知识,没有发现博弈的存在。

概念二——博弈论三个基本概念:帕累托最优、压倒性策略、纳什均衡

帕累托最优

帕累托改进的意思是这个改进在不伤害任何一个人利益的同时,使至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地,这个局面就是帕累托最优。

比如一条一百米的步行街要开两家奶茶店,而这两家奶茶店开在什么样的位置才是帕累托最优?

第一家奶茶店在步行街的25米处,第二家在步行街的75米处,这样两家奶茶店都能辐射50米距离,这就是帕累托最优。

因为帕累托最优是不稳定的,总有一家奶茶店想往中间(50米)移动,因为这样可以辐射整条步行街,当第一家奶茶店开始移动,第二家也会移动,最终两家奶茶店都会集中在中间。

这样就会形成扎堆现象,我们生活中有很多扎堆现象,比如麦当劳和肯德基、中石油和中石化,所有的服装店都聚集在一起,所有的饭店也聚集在一起,当一个热点新闻出现后所有的媒体都在报道。

压倒性策略

在谈压倒性策略之前,我们需要知道囚徒困境概念。

两个罪犯被抓到,但是警察没有直接证据,只能通过口供才能定罪。如果两个都招供,各判3年;如果一个不招供,一个招供,招供的有戴罪立功表现,释放,不招供的就会判5年;两个人都不招供,警方因证据不足,各判1年。

在囚徒困境中,我们看到,对两个罪犯最好的策略是都不招供,各判1年,这就是帕累托最优,可是帕累托最优是不稳定的,因为在做决策的时候,我们还要考虑对方。

如果罪犯A选择不招供,但是罪犯B选择招供,结果罪犯A判5年,罪犯B无罪释放,这显然对罪犯A不利。

如果罪犯A选择招供,但是罪犯B不招供,结果是罪犯A无罪释放,罪犯B判5年,这是对罪犯A最好的选择。

基于这个因素,无论罪犯B怎么选,罪犯A最好的选择都是招供。

这就是压倒性策略,不管对手怎么选,这个选择对你来说都是最好的。

与压倒性策略对应的是被压倒性策略,不管别人怎么做,你这么做都是对你最不好的。

作为理性人,如果博弈中有压倒性策略,就一定要选它。任何情况下都不要选被压倒性策略。

纳什均衡

纳什均衡是博弈论中最重要的概念。

何谓纳什均衡,我们再回到囚徒困境。

罪犯A最好的策略是招供,罪犯B最好的策略也是招供,结果两个人各判3年,这肯定不是帕累托最优,但这是纳什均衡。

纳什均衡指的是这样的一种局面:在这个策略组合里,没有任何一方愿意单方面改变自己的策略。

不招供是最好的选择,但是要变大家要一起变,但是每个人都不愿意先变,最终这个局面就不变了。

如果一种现象能够在社会中长期稳定存在,它对参与的各方来说一定是纳什均衡。

纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好,他必须得让每个参与者都不愿单方面改变才行。

理想青年喜欢帕累托最优,理性青年寻找纳什均衡。

可能有些人觉得纳什均衡难以理解,我们再举一个简单案例。

我们国家的交通规则是右侧通行,这实际就是一个纳什均衡。

如果你逆向而行,轻则开罚单,重则造成车祸,所以没有人愿意单方面违反这条规则。

还有一个案例可能更生动,前段时间,很多教育股大跌,我没有关注具体情况,但是教育股涉及一个问题——补课,补课实际就是一个纳什均衡,而且还是一个多人囚徒困境。

如果学生每天都在有限的时间内学习,并且保证一定的休息和玩耍时间,大学的录取名额还是这么多。

但是现在很多学生花费了更多时间去补课,但是大学的录取名额并没有增加。

如果别人都在复习,而你不复习就会吃亏,所以你不可能单方面改变这个局面。

纳什均衡是一个美丽概念,它能解释很多现象,能让我们迅速破解各种博弈局面,更能给我们设计博弈机制提供约束条件。

未完,待续……

备注:这篇文章参考了很多《博弈论究竟是什么》的内容。