《博弈论究竟是什么》是我执行“51工程”阅读的第一本书,博弈论也是我最近在思考的新算法,这本书很薄,但是内容很多,由于我是第一次接触博弈论,所以理解博弈论有一些困难为了更深入理解博弈论,我又找到《博弈与社会》,可是这本书对我来说更复杂,我只好又看了两遍《博弈论究竟是什么》,我来为大家科普一下关于通俗解释博弈论?以下内容希望对你有帮助!
通俗解释博弈论
《博弈论究竟是什么》是我执行“51工程”阅读的第一本书,博弈论也是我最近在思考的新算法,这本书很薄,但是内容很多,由于我是第一次接触博弈论,所以理解博弈论有一些困难。为了更深入理解博弈论,我又找到《博弈与社会》,可是这本书对我来说更复杂,我只好又看了两遍《博弈论究竟是什么》。
《博弈论究竟是什么》有非常多的概念,这篇文章我想把这些概念整理出来,方便我自己应用,所以这篇文章还是为我自己写的,如果你想了解更多博弈论,最好还是去阅读《博弈论究竟是什么》和《博弈与社会》。
概念一:何谓博弈论
博弈论研究如果你想要的东西别人也想要,你们在这件事上有冲突,那你应该怎么办才能让自己在这个东西的利益最大化?
博弈论研究的决策不是情绪化的,而是由利益格局决定的。
博弈论研究有对手情况下的决策。
博弈论研究理性人之间的博弈。
博弈论能帮助我们理解长期存在的各种现象,如果你观察到社会上有很多不合理的现象,而这些现象长期存在,博弈论会帮助你考察现象背后的博弈规则。
博弈论最重要的作用是告诉我们如何改变不好的局面。
下面我们通过一个小案例,理解博弈论。
很多人都有这样的经历——景区的饭菜不仅贵而且很难吃。
为什么景区的饭不能做得既实惠又可口?
因为这里有一个单次博弈概念。
我们去过一个景区,可能这辈子就不会再去,所以景区的饭店和我们只交易一次,这就是单次博弈,既然我们以后不会再来,饭店会尽可能在我们身上获取最大收益,在这种情况下,景区的饭菜既贵又难吃。
和单次博弈对应的是重复博弈。
你家楼下的小饭店做的就是重复博弈,他希望你每天都来,所以饭菜既实惠又好吃。
当我们和别人交易时,我们要考虑是一锤子买卖还是长期合作,如果是一锤子买卖我们被骗的可能性比较高,所以我们需要一些方法保护我们的利益,比如签合同。
以前我们可能认为博弈论是非常高大上的东西,国家和国家之间才会有博弈,实际博弈论就在我们身边,我们每天都在参与各种各样的博弈,只是因为之前我们缺乏这方面的知识,没有发现博弈的存在。
概念二——博弈论三个基本概念:帕累托最优、压倒性策略、纳什均衡
帕累托最优
帕累托改进的意思是这个改进在不伤害任何一个人利益的同时,使至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地,这个局面就是帕累托最优。
比如一条一百米的步行街要开两家奶茶店,而这两家奶茶店开在什么样的位置才是帕累托最优?
第一家奶茶店在步行街的25米处,第二家在步行街的75米处,这样两家奶茶店都能辐射50米距离,这就是帕累托最优。
因为帕累托最优是不稳定的,总有一家奶茶店想往中间(50米)移动,因为这样可以辐射整条步行街,当第一家奶茶店开始移动,第二家也会移动,最终两家奶茶店都会集中在中间。
这样就会形成扎堆现象,我们生活中有很多扎堆现象,比如麦当劳和肯德基、中石油和中石化,所有的服装店都聚集在一起,所有的饭店也聚集在一起,当一个热点新闻出现后所有的媒体都在报道。
压倒性策略
在谈压倒性策略之前,我们需要知道囚徒困境概念。
两个罪犯被抓到,但是警察没有直接证据,只能通过口供才能定罪。如果两个都招供,各判3年;如果一个不招供,一个招供,招供的有戴罪立功表现,释放,不招供的就会判5年;两个人都不招供,警方因证据不足,各判1年。
在囚徒困境中,我们看到,对两个罪犯最好的策略是都不招供,各判1年,这就是帕累托最优,可是帕累托最优是不稳定的,因为在做决策的时候,我们还要考虑对方。
如果罪犯A选择不招供,但是罪犯B选择招供,结果罪犯A判5年,罪犯B无罪释放,这显然对罪犯A不利。
如果罪犯A选择招供,但是罪犯B不招供,结果是罪犯A无罪释放,罪犯B判5年,这是对罪犯A最好的选择。
基于这个因素,无论罪犯B怎么选,罪犯A最好的选择都是招供。
这就是压倒性策略,不管对手怎么选,这个选择对你来说都是最好的。
与压倒性策略对应的是被压倒性策略,不管别人怎么做,你这么做都是对你最不好的。
作为理性人,如果博弈中有压倒性策略,就一定要选它。任何情况下都不要选被压倒性策略。
纳什均衡
纳什均衡是博弈论中最重要的概念。
何谓纳什均衡,我们再回到囚徒困境。
罪犯A最好的策略是招供,罪犯B最好的策略也是招供,结果两个人各判3年,这肯定不是帕累托最优,但这是纳什均衡。
纳什均衡指的是这样的一种局面:在这个策略组合里,没有任何一方愿意单方面改变自己的策略。
不招供是最好的选择,但是要变大家要一起变,但是每个人都不愿意先变,最终这个局面就不变了。
如果一种现象能够在社会中长期稳定存在,它对参与的各方来说一定是纳什均衡。
纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好,他必须得让每个参与者都不愿单方面改变才行。
理想青年喜欢帕累托最优,理性青年寻找纳什均衡。
可能有些人觉得纳什均衡难以理解,我们再举一个简单案例。
我们国家的交通规则是右侧通行,这实际就是一个纳什均衡。
如果你逆向而行,轻则开罚单,重则造成车祸,所以没有人愿意单方面违反这条规则。
还有一个案例可能更生动,前段时间,很多教育股大跌,我没有关注具体情况,但是教育股涉及一个问题——补课,补课实际就是一个纳什均衡,而且还是一个多人囚徒困境。
如果学生每天都在有限的时间内学习,并且保证一定的休息和玩耍时间,大学的录取名额还是这么多。
但是现在很多学生花费了更多时间去补课,但是大学的录取名额并没有增加。
如果别人都在复习,而你不复习就会吃亏,所以你不可能单方面改变这个局面。
纳什均衡是一个美丽概念,它能解释很多现象,能让我们迅速破解各种博弈局面,更能给我们设计博弈机制提供约束条件。
未完,待续……
备注:这篇文章参考了很多《博弈论究竟是什么》的内容。