百度百科上解释概率为“或然率”,它是反映随机事件出现的可能性大小。看着这个解释,初看觉得还能明白,但是凑近了看,还有一个专有名词“随机事件”,接着还得看随机事件的解释,有时候就会搞的一头雾水。数学不仅仅是逻辑的产物,更是为了解决我们生活中遇到的问题,对现实世界的问题加以抽象理解和解决以及其中孕育的思想,才是数学真正的魅力。
什么是概率呢
就拿百度百科的定义来说,概率是反映随机事件出现的可能性大小。这个定义看有两个关键词,一个是“随机事件”,另一个是“可能性大小”。我们先看第一个名词叫“随机事件”,在概率论中也简称“事件”,就是任何你、我或者其他人关心的事情,在设定条件的前提下,从可能性的角度出发,对发生结果进行陈述。
第一个限定词叫“限定条件”,只有在限定的条件下才能计算可能性的大小,才能计算概率,才能给我们生产生活不同的参考信息和知道行动以及决策。比如:连续2次掷骰子均掷出3的“连续2次掷”,今年你村里大壮娶媳妇的“今年”,都是限定条件。你不能不加限定地说“人类登上火星的概率”,这就没法计算,而“人类在2050年登上火星的概率”,加上时间设定“2050年”,就可以计算概率了。
第二点个限定语句是“从可能性的视角出发”。不管是这件事还没发生,还是单纯的我不知道,只要是我还不确定结果,就可以从可能性的视角提出问题,度量它的概率。
一是这事儿还没发生,比如“明天下雨的概率是多少”,明天还没到,我们只能从可能性的角度提问。二是这件事已经发生了,但我还不知道,比如“现在我家地底下有石油的概率”,现在我家地底下有没有石油,这是个客观事实,只是我不知道,也可以预测概率。
第三个限定是“对某个发生结果的陈述”。我们要陈述的必须是一个随机的结果,而不是不确定性。总结起来就是,概率是对随机事件发生可能性大小的定量描述。只要按照上面三个设定表达任何事情都可以变成随机事件。通过对随机事件的解释,我们其实就可以对生活中很多打着概率的名义的各种文案、广告宣传、金融诈骗进行筛选了。
概率是随机事件在样本空间的比率
我们中学时学习概率,最头疼的就是各种复杂计算,计算虽然复杂,但它们背后的思路却是一致的,就是计算随机事件在样本空间的比率。这又有了一个新概念——样本空间。其实很简单,一件事儿可能发生的所有结果,就是这件事儿的样本空间。
比如抛硬币,结果不是正面就是反面,那么“结果是正面”和“结果是反面”就构成了抛硬币这件事的样本空间。再比如,每届世界杯有32支球队参赛,虽然我们不知道谁会夺冠,但夺冠的队伍无外乎就这32支,这32个结果就构成了世界杯冠军这件事的样本空间。
“随机事件”和“样本空间”的关系就是子集和全集的关系。换句话说,随机事件就是样本空间的一个子集;反过来也成立,样本空间里的每一个子集,也都是一个随机事件。而子集和全集的比率,也就是随机事件占样本空间的比率,就是这个随机事件发生的概率。
所以我们计算概率的前提是保证样本空间的完备性,也就是说,要找到所有可能发生的结果,如果样本空间压根不完备,那你算出的概率一定是错的。样本空间的完备性是一个幽灵,很难获得。而如果样本空间不完备,我们计算的概率就会有偏差,决策就会出错。
明白了这一点,你就会理解很多现实问题。比如经济领域中的“黑天鹅事件”的本质是什么,本质就在于我们完全不知道它,它压根不在我们的样本空间里,所以没法计算它的概率。只有它发生过了,我们知道它可能发生了,它才会进入我们的样本空间,它的概率才能被计算。
参考资料:
得到app《刘嘉·概率论22讲》《吴军·数学通识50讲》。
(关注、点赞、转发)(全网同名,书童寒不冷)
写在最后:
(说来惭愧,当我打开电脑看到上一篇文章起草时间是6月1日的时候,完全懵了,也就是我整整2个月零10天没有自己写点东西了,稍不注意自己就懈怠了。最可怕的是我以为其实没几天,但是不知不觉已经2个多月了。这也是第一次如此感觉时间流逝的可怕速度,同时也欣慰感到时间积累的意义。感谢您的不离不弃,咱们还是得重拾行囊,继续出发,认识世界也认识自己。)
,