先从几个有关联的定义说起:
1.随机试验(简称试验)
对随机事件的观察称之为随机试验,随机试验具有三个特点:1.可重复性,2.可观察性,3.随机性
2.随机事件(简称事件)
在随机试验中,我们观察的不仅仅是试验的过程,更关心试验结果是不是具有一定的可观察的特征,例如,扔骰子试验我们观察点数为偶数或点数为奇数的出现次数等等。
3.可能性,频率,概率
以买为例,买可能会中奖,也可能不中奖,这就是可能性,若不以严格的数学定义来区别,概率是可计算出来的,是接近确定的数值,频率是统计出来的,两者的关联在于概率是频率的稳定值,即进行n次扔硬币的试验,当每次的实验次数达到一定数量时,n次试验中正面朝上的频率就接近于概率,频率可以作为概率的估计,但并不等价于概率,概率是理想值,有时候会与实际发生有差别,很多题目中会出现“用频率来表示概率这种话”,因此买有两个可能性,中或者不中,这里的50%指的是可能性,买十次中奖的频率为0次不代表中奖的概率为0,当试验次数趋近于无穷时,中奖的频率等价于概率。
4.随机变量、随机变量的分布
在一个随机变量中,人们除了对特定事件发生的概率感兴趣之外,还会关心某个与随机试验结果相联系的变量,由于这一变量的取值依赖于试验结果,而试验结果不确定,因此这一变量的取值也不是不确定的,这种变量叫做随机变量,对于随机变量,人们无法准确预知确切值,但人们可以研究取值的统计规律性,对一个随机变量的统计规律性的完整描述被称为随机变量的分布。
5.离散型,连续型随机变量及其分布
离散型随机变量的全部可能取值只有有限个或可数无穷多个,类似于古典概型的事件总数,表示的所有随机变量取值时所对应的概率分布,类似于一种点的分布,连续型随机变量的取值类似于一种区间,因为连续型随机变量取得某个特定值时的概率可能为零,因此更关心的是取值落在某个范围上的概率,而不关心在某个点出的概率。
6.平均值和期望
平均值是对现有样本的一个统计量,期望是概率论中的一个特征,因为概率是频率随样本趋于无穷的极限 ,期望就是平均数随样本趋于无穷的极限,期望是一种加权平均数。
例如扔骰子6次,所出现的点数分别为2,3,3,4,1,5,则点数的平均数是3,但根据各自点数出现的概率1/6计算来的期望并不是3,即执行n次试验,当n无穷多时,每次试验的平均数再求平均值就接近于期望,简言之均值对现有情况进行统计分析,期望是对未来情况的概率估计。
以上无聊的概念有助于理解高中数学中常见的分布列。
一.高中阶段常见的离散型分布列
1.两点分布
2.二项分布
关于上述两种分布先了解什么是伯努利试验,如下:
伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生。
特点是事件A在每次试验中发生的概率均为p,且不受其他各次试验中A是否发生的影响,即每次试验结果均具有相互独立性。
进行一次伯努利试验的随机变量的分布即为两点分布,课本中对此类问题的描述不够全面,可以扩展为一类特殊的随机变量有n个不同的取值,且每个取值的可能性均相同,在这里没必要细说。
二项分布是高考中考查最多的分布类型,很多人分不清它与超几何分布的区别,先看下面课本上对二项分布的描述:
这里的“二项”可理解为两层含义,一是只有两个结果,成功失败,善恶,美丑等等,二是其符合二项式(p q)^n展开式通项公式的形式。
二项分布中的变量为n,p,当n无穷多且p接近0.5时,二项分布的概率函数接近于正态分布,在二项分布中我们需要一个已知的事件发生的概率,如果不知道概率,很多题目中会注明可把频率当概率,上面提到了频率和概率的差别,因此若没有对应的字眼,则就不属于二项分布。
另外二项分布是一种放回的试验,因为放回,样本总数不发生变化,事件A发生的概率也没有变化,这是与超几何分布最大的区别,超几何分布是一种不放回的试验,每做一次,样本总数发生变化,事件A发生的概率每次都不同。
关于二项分布分布需要注意n次试验中恰好发生k次以及恰好第k次发生的区别。
因此一个完整的二项分布的流程如下:
1.确定出做某项事情的次数n,例如相亲10次。
2.两个确定的结果,看对眼或看不上,不存在养鱼的情况
3.每次成功的概率相同,结合自身的颜值财力等等确定出每次相亲成功的概率为20%
4.求n次试验中成功的次数,即10次相亲能有几次会让自己脱单?
3.超几何分布
超几何分布是一种不放回一次性抽取的随机变量分布类型,常伴随任取XX个的字眼,书上关于超几何分布的描述如下:
从定义中能看出如下两点:
1.变量为N(样本总数),M(次品总数),n(抽取的件数),与次品率无关
2.仅抽取一次做试验,例如n=3件,逐个确定是否为次品,因此每次都影响剩余的次品率,隐藏的p每次都变化,有一个例子最能描述超几何分布概率的变化,即俄罗斯轮盘赌,第一个人和第二个人中枪的概率绝对不同。
以上内容就能大致判断出二项分布和超几何分布的区别,由于此类问题的出题背景千差万别,因此不给出具体的案例,几乎每套试题中都会出现相应的题目,平时多留意多注意区别即可,给出一个基础性的案例,如下:
1.8个题目中甲能答对6个题目,从8个题目中任选4个进行作答,用X表示甲能答对题目的个数,求出随机变量X的数学期望。
2.这8个题目中乙也能答对6个,每次取一个题目,取出放回,以答对的频率来估计答对的概率,若连续取4次,求乙答对个数X的数学期望。
具体的不过不再给出,仔细理解其中的差别即可,这种题目无论是哪种分布都需要根据实际问题确定出所有的随机变量X的取值,不可遗漏。
至于高中阶段常见的连续型分布列的代表正态分布,考查的次数并不多,近期看有没有比较有新意的正态分布题目,攒够了再分析出来。
,