金融市场的量化密码系列文章(16)
男孩女孩的悖论
作者:Michael Zhang 麦教授
如果世界中的事件完全不可预测地随机发生, 则我们的生活是无法忍受的。 而与此相反, 如果每一件事都是确定的、完全可以预测的, 则我们的生活是无趣的。
——统计学家C.R.Rao
虽然很多概率论问题的推导可以很复杂,但是对概率的理解其实只要抓住一点就可以,那就是从所有可能的结果中数清楚各个事件发生的比例。听上去很简单,但是其实并不简单。我们来测试一下:如果记录连续投掷10次硬币的过程,下面哪个记录出现的概率更大一些?
记录一:正,正,正,正,正,正,正,正,正,正
记录二:正,反,反,正,正,反,正,反,反,正
很多人会说是记录二,然而两个记录出现的概率是一样的。记录二可能看上去更可信一些,但是两个记录都是每次这一面出现的概率是1/2,连续投掷了10次,它们出现的概率都是1024分之一。换句话说,“所有可能的结果”一共有1024种,而这两个记录都是1024种结果中的一种,它们出现的概率是相同的。
有个非常反直觉的概率问题叫做两孩问题(two-children problem,也叫男孩女孩悖论,Boy or Girl paradox)。如果不是对概率论深刻理解了,两孩问题会是个非常困扰人的悖论。
这个问题最早是在1959年10月版的《科学美国人》数学游戏专栏中提出的。问题的内容是:
- 我两个孩子,老大是个男孩,两个孩子都是男孩的概率是多少?
- 我有两个孩子,其中至少有一个是男孩,那么两个孩子都是男孩的概率是多少?
第一个问题很简单,这两个孩子的出生是独立的,所以第二个孩子可能是男孩也可能是女孩,所以第二个孩子是男孩的概率是1/2,于是两个孩子都是男孩的概率就是1/2。
第二个问题初看和第一个问题一样,告诉我们其中至少一个是男孩,两个小孩的出生应该是独立的,所以另外一个小孩可能是男孩,也可能是女孩,概率难道不是和之前一样是1/2吗?
然而正确答案其实是1/3。
这道题的解答需要对概率的定义深刻理解,也就是之前费马和帕斯卡探讨的概率最简朴的意义:从所有可能的结果中数清楚各个事件发生的比例。
我们先把第一个问题的所有情况列出来:(女,女;女,男;男,女;男,男)括号里用分号表示不同的情况,用逗号分开老大和老二。
可以看到,已知老大是女孩,所以第三和第四种情况都可以排除了,问题变成(女,女;女,男)第一和第二种情况各占一半的机会,所以老二是女孩的概率是1/2。
下面看第二个问题:(女,女;女,男;男,女;男,男),但是已知至少有一个是男孩,所以(女,女)是不存在的,问题变成(女,男;男,女;男,男)。
在剩下的三种情况中,有一种是两个都是男孩的情况,所以从概率上讲,发生这件事的概率是1/3。同理,老李的孩子是一男一女的概率也不是50%,而是2/3。
每被问到“有两个孩子,其中至少有一个是男孩”这个问题时,人们基本的直觉就会引导人们得出另一个孩子是男孩或女孩的概率是50%,因为另一个孩子可能是男孩或女孩(基于存在两种同样可能的结果的假设)。然而,这并没有“从所有可能的结果中数清楚各个事件发生的比例”。
这个问题也可以换一种方式来理解(用频率学派的思想)。想象100个家庭,每个家庭有两个孩子,那么我们会遇到的三种情况是:
A) 25个家庭有两个女孩
B) 25个家庭有两个男孩
C) 50个家庭有一男一女
由于我们被告知他们中至少有一个是男孩,我们就要把两个都是女孩的情况先排除。这样我们的“所有可能的结果”中就只有75个家庭(25 50),其中只有25个家庭的两个孩子都是男孩。因此,有两个男孩的家庭的概率为25/75=1/3。
下面我们来看看是否真的理解了什么是“所有可能的结果”。
继续推演,假设老李改口说“我有两个孩子,至少有一个是男孩,他名叫小明”,那么两个孩子都是男孩的概率是多少?和问题二相比,只是多了个名字,难道会改变结果吗?
还真的可以改变。
首先像之前一样排除两个女孩的情况,然后写出所有可能的结果:(小明,男;男,小明;女,小明;小明,女)。这里排除了两个男生都叫小明的情况,可以看到,现在另一个孩子有2种情况是女孩,另外2种情况是男孩,所以另一个孩子是男孩的概率就是50%了(而不再是1/3)。
我们还可以继续推演,这次老李说:“我有两个孩子,其中至少一个是男孩,他是星期二出生的”,那么两个孩子都是男孩的概率是多少?和问题二相比,只是多了这个男孩是星期二出生的,难道会改变结果吗?
非常诡异的是,还真的可以改变。而答案是你绝对猜不到的13/27。
直觉上,人们可能会说另一个孩子是男孩的几率是1/2或者是1/3,因为直觉上不应该根据出生日期有任何变化。
然而,假设一个孩子在一周中任何一天出生的可能性都是一样的,这就导致了以下27种同样可能的孩子出生方式:
男2女1, 男2女2, 男2女3, 男2女4, 男2女5, 男2女6, 男2女7,
女1男2, 女2男2, 女3男2, 女4男2, 女5男2, 女4男2, 女7男2,
男1男2, 男2男2, 男3男2, 男4男2, 男5男2, 男6男2, 男7男2
男2男1, 男2男3, 男2男4, 男2男5, 男2男6, 男2男7
上面的列表中我们把星期几表示为1、2、3.... 7(1为周一,2为周二,以此类推),也就是说,周二出生的男孩表示为“男2”,周一出生的女孩表示为“女1”。
27种可能里,前两行(有14种情况)包括一个女孩。而后两行(有13种情况)是有两个男孩的情况,所以两个都是男孩的概率变成了13/27。
可以看到,要想计算正确,首先要像费马和帕斯卡一样,需要在“所有可能的结果中数清楚各个事件发生的比例”。
这个问题还可以继续推演,老李还可以说:“我有两个孩子,其中至少一个是男孩,他是元旦出生的”,“我有两个孩子,其中至少一个是男孩,他是2月29号出生的” 。。。
我们可以得出一个结论:老李这个老头子坏得很,这样的叙述方法下,两个孩子都是男孩的概率总归都不是50%。
▼金融市场的量化密码系列文章▼
金融市场之投资与随机变量
金融市场之概率起源
他是一个有缺点的伟人,如果没有这些缺点,他将是完美的怪人
博和弈:围棋、轮盘赌与股票投资
量化交易的三个必要条件
人工智能的三个必要条件
投资、投机与套利
金融的不确定性(1929年)
科学里的不确定性:上帝掷骰子吗?
从印象派画作说起,如何理解艺术里的“不确定性”
获得真知的第一步,是走向未知
金融市场无限的未知里,有着无限的可能
从不同的角度思考和解决问题,真理也会成为假命题
如何用两维思维方式解读苏格拉底悖论
不可能发生的事(1987年)
《金融市场的量化密码》系列专栏——前言
▼往期精选▼
一篇文章讲明白:SPAC上市热潮
有骨气的基金经理都跳楼了
一篇文章讲明白:女版巴菲特和她的ARK基金
一篇文章讲明白:150亿爆仓风波
,