机器学习是实现人工智能的重要技术之一。在学习机器学习的过程中,必须要掌握一些基础的数学与统计知识。之前的一篇分享了中心极限定理的详细概念,今天我们来谈谈另一个重要的定理——大数定律。大数定律反应的是偶然到必然的关系, 一般来说,大数定律可以分为:伯努利大数定律、辛钦大数定律、柯尔莫哥洛夫强大数定律和重对数定律四种。本篇文章主要介绍伯努利大数定律,将从大数定律的概念、案例、代码实现、总结四个方面来详细进行说明。

一、 概念

伯努利大数定律是指在N重伯努利实验中,在实验次数足够大的条件下,其中某一事件发生的频率n/N可无限接近其发生的概率,因此可用频率近似估计来代替概率。在这个定义中必须注意伯努利实验蕴含着只有两个相互独立的事件发生,并且发生的概率是不变的。现实生活中的抛硬币是典型的伯努利实验。

山顶洞人会什么技术(山顶洞人学机器学习之)(1)

伯努利

概率论主要的目标是研究不确定性。正如我们抛掷一枚硬币,我们在进行实验之前根本不知道究竟是正面朝上还是反面朝上,它是不确定性事件,但是我们可以估计出正面朝上还是反面朝上的概率值,估计概率值的方法就是用大数定律,即在大量重复实验的过程中,用事件发生的频率去近似估计它的概率。

山顶洞人会什么技术(山顶洞人学机器学习之)(2)

抛硬币

二、 案例

见过输光的赌徒,没有见过亏损的赌场

前一阵著名的赌王何鸿燊去世了,但他给他的子女留下了巨额的资产。据估计,何鸿燊的资产接近5000亿,这意味着假如你活到100岁,从出生那天开始中,你每天中1369万, 直到你死亡。那么究竟他为什么会能赚这么多的钱?背后其实就是大数定律!

人们总是认为赌博靠的是运气,但其实不然。赌场一般会设置一定的游戏的规则,比如将赌场赢的规则设置为“51.5%或者52.5%”,而将赌徒的概率设置为“47.5%或者48.5%”。看似它们之间的概率值差不多,但其实大有学问。一方面,这样的设计会让玩家相信自己靠的是运气,会让玩家觉得这样的设计是很公平的,于是玩家深陷其中以至于无法自拔。另一方面,将自己赢的概率设置的稍微高一点,在面临很多的玩家的时候,最终的结果都是赌场会赢。因为大数定律告诉我们,在n足够大的时候,也就是赌徒玩家足够多的时候,你赢的次数的频率就是它所发生的概率。所以让你输的不是你的运气,而是这个叫伯努利的数学家。

山顶洞人会什么技术(山顶洞人学机器学习之)(3)

十赌九输

三、 代码实现

我们利用R代码来实现

  1. 我们从0和1当中进行随机抽样,然后计算结果为1的频率

山顶洞人会什么技术(山顶洞人学机器学习之)(4)

代码

  1. 我们分别进行5次、 10次、100次、1000次......实验,发现它的值越来越接近0.5,即接近它发生的概率值。

山顶洞人会什么技术(山顶洞人学机器学习之)(5)

输出结果

3. 我们也可以通过这个动图直观的理解(投骰子)

山顶洞人会什么技术(山顶洞人学机器学习之)(6)

投骰子动态演示图

四、总结

伯努利大数定律是指在进行多次重复的实验中,某一个事件发生的频率可以近似估计为它的概率,既可以用频率来估计概率。

最后,我想通过这个例子劝大家远离赌博,因为你赢不了数学家。

欢迎大家在评论区留言讨论。 #机器学习# #大数定律# #人工智能# #科技新星创作营# #科技新星创造营#

,