天气预报又要有大暴雨了。你心头一惊,城区必定大堵车,堵车原因是因为积水排不出去,排不出去是因为下水系统不行。

但是市政部门的解释,市政系统下水道按照五十年一遇的标准建造的,是很高的标准,只是暴雨太大了。

可是™的都连续两年被被水淹没了。五十年一遇是骗人的吧。

如果市政部门解释没有骗人,那么我们就来看看泊松分布吧。

  • 泊松分布的公式及意义

首先,定位一下这个问题,50年一遇,是在很长很长的时间范围里面,这样的暴雨平均50年发生一次。那么问题是会不会每隔50年发生一次了,未必。有可能在两百年之间是这样的,前四年发生了一次,之后的196年一次没发生。

-

真正问题是,我们知道50年一遇是长期整体概率,但我们想知道的是,任何一段具体的,有限的时间内,比如5年之内,发生一次大暴雨的概率是多少?发生2次大暴雨概率是多少?发生3,4次了?任何你想知道大暴雨的次数,他们的概率分别是多少?

-

这个问题其实是这样的,抽象一下,我们知道一个随机事件发生的概率符合正态分布之后,那么在某一段事件或者空间间隔内,这个随机事件发生的次数的概率分布是什么?不是求整体发生率,而是求发生次数概率

大数学家泊松就发现了这个公式:

概率分布图解(概率论学习笔记)(1)

泊松分布的公式

用语言表达就是:随机事件发生K次的概率,等于lambda的k次方除以k的阶乘,在乘以自然底数e的负lambda次方--据说这个公式可以进最美数学公司排行榜的前十名。

lambda:是整体概率与要求解问题匹配之后对应的数值,这个数值是跟我们的问题联动变化的。整体概率是50年一次,也就是1/50,如果我们想知道接下来50年这个时间段暴雨次数的概率分布,那么lambda就是1,如果我们想知道100年,那么lambda那就是1/50*100,相应就变成了2.如果是5年,那么就是1/50*5,这个数值就是0.1

如果k=0,那就是接下里50年,1次暴雨不发生概率是带入公式计算之后的37%;k=1,也是37%;k=2,概率是18%。

接下来我们关心的是:50年发生2次和2次以上50年一遇大暴雨概率是多少,也就是1减去发生0次的概率和发生1次的概率,1减去37%,再减去37%,答案是26%。

这么一看市政部门的解释是合理的。

  • 泊松分布的数学性质

数学性质一:泊松分布是正态分布的一种微观视角,是正太分布的另一种面具。

如果我们不断计算各种事件间隔和大暴雨不同 发生次数的概率,画在一起泊松分布的曲线就越来越像正态分布。分别计算,50年,100年,200年,300年发生“50年一遇暴雨的情形,看起来就是正太分布了。

数学性质二:泊松分布间隔是无记忆性的。

不是说泊松分布是无记忆行动,而是泊松分布的间隔无记忆。无记忆就是之前的情况对之后的情况没影响,间隔的无记忆就是指的,前一间隔中随机事件是否发生对后一间隔中随机事件是否发生没有影响。在大暴雨这个例子中,如果去年发生一次大暴雨,那么今年发生大暴雨概率会变成多少?我们直觉是,刚发生了一次,接下来不会发生了,但是其实不是这样的。他们是相互独立的。

  • 打开统计推断的大门

统计推断是什么意思?

如果我们城市两年都发生大暴雨不是一个小概率事件,那么我们城市建造是没问题,问题在哪里,就是数据太少我们没有1000年的降雨资料,就算是1000年也很少。于是我们就要换一个思路。

物理学家解决放射性物质半衰期,不是盯着一个原子看,因为时间太长了,数据太少,一个完整半衰期也没有,怎么办?假设半衰期服从正太分布,那么怎么验证了?(半衰期服从正太分布,完全理解不了啊)

找一堆原子,统计一下在几个确定时间间隔中,这堆原子发生了多少次衰变,只要这个数字服从泊松分布,反过来就证明原子的衰变服从正太分布。

--是不是很难理解。恩,我也觉得。统计数据和概率论中概率分布的结合。

概率研究是未发生的随机事件,统计描述已发生的现实,最开始只有描述统计,但是没有推断统计,泊松分布开启了推断统计的大门。

  • 写在后面的话

其实难点在于还是不全面,很多概念其实没有理清楚,现在回想一下,到底什么是随机了?

,