想想明天要过国庆节了,好好的节假日怎么能不偷懒呢?所以,放水的内容得留着明天写,今天还是弄点正经的吧

如何用excel做一个正态分布图(Excel数据分析泊松分布)(1)

泊松分布,在很多介绍的文章里都会把它和二项分布放在一起比较,因为它们有点像,对于这个观点,我是不会脑抽到为了标新立异而去刻意反对的

先放出Excel中的公式:

=POISSON(X,平均数,FALSE)

其中X的定义和二项分布中一样,是一件事情发生的次数,要求是个大于等于0的整数(你放个带小数点的数字进去它也不会报错,就是自动给你向下取整罢了),不同的地方是X的取值没有设上线(二项分布中要求X的大小需要小于总的实验次数N)

既然不能不提到二项分布,那干脆列出来再比较下:

=BINOMDIST(X,N,P, FALSE)

有没有发现参数的个数不一样?嗯,泊松分布要求的输入比二项分布少一点,但是就意义上来说差别却不是很大,为什么这么说呢?

泊松分布中的参数"平均值"一定程度上相当于二项分布的总实验次数N*先验概率P

咱还是举猜拳这个例子(没错,人家和硬币杠上,我是和猜拳杠上了)

二项分布中,比方咱们假设和一个不认识的家伙猜了30次拳(够无聊的啊),咱赢的先验概率是1/3,放到二项分布那就是=BINOMDIST(X,30,1/3, FALSE)

但要是放到泊松分布,它的理解方式大概是这样的,我们比方说是在10分钟里和对方猜完了30次拳,正常来说平均的赢面1/3也就是平均值30/3=赢10次,那么咱们在下个10分钟里和对方再猜30次拳,请估计下比较可能赢多少次呢?

公式就变成了这样:=POISSON(X,10,FALSE)

我们把X从0到31都代进去看看:

如何用excel做一个正态分布图(Excel数据分析泊松分布)(2)

首先可以看到右下角二项分布的最后一个数,由于X=31超出了总次数30,所以直接报错,而泊松分布虽然没有次数限制,但是当X取值大于平均值很多很多的时候,它计算出的概率已然是0了,即使不报错,再计算下去也不会有意义

所谓字不如表,表不如图,咱看下用这些计算结果画出来的图:

如何用excel做一个正态分布图(Excel数据分析泊松分布)(3)

虽然有点差距,但整个图形还是有点像的

根据有些介绍文章上的推论,当二项分布取的实验次数足够大的时候,和泊松分布近似相等,人家数学能力高端,可以像模像样用公式推导求极限什么的来证明,我就比较粗糙了,实践出真知,不就是把数值放大么,做一个呗

咱现在在这个例子上放大100倍,这样的话,公式就变成了:

二项分布=BINOMDIST(X,3000,1/3, FALSE)

泊松分布=POISSON(X,1000,FALSE)

结果就不列表了,直接上图:

(前后端的0值略有点多啊,我就截当中一段吧)

如何用excel做一个正态分布图(Excel数据分析泊松分布)(4)

感觉曲线最高点的位置好像是近了一丢丢,但是高度上还是有点差别

听说先验概率P越小,这两货也会越接近,那我再捯饬下看看?

概率P缩小到1/10时

二项分布=BINOMDIST(X,3000,1/10, FALSE)

泊松分布=POISSON(X,300,FALSE)

如何用excel做一个正态分布图(Excel数据分析泊松分布)(5)

嗯,感觉那些推导公式的家伙应该没有蒙人,看着是接近点了呢~~~~

,