总体假设检验的方法(假设检验HypothesisTest)(1)

一、假设检验(Hypothesis Test)的原假设设定

我们在建立假设检验的很重要的一个步骤就是根据问题的实际,确定原假设(H0)和备择假设(H1)。在假设检验后得出的主要输出就是我们可以“拒绝”或“无法拒绝”原假设(H0)。也就是说假设检验后我们只有这两种结论,不会再有第三种结论。因此,对于我们来讲建立一个假设的原则就是:我们通常把希望的假设放在对立假设中。这是因为,“拒绝”是相对有力度的,“无法拒绝”是没有力度的!如何理解上面的原则呢?我们可以采用一个例子来跟大家一同分析。

法院对一个被告在判定是否有罪的时候,法官会怎样做出判定呢?他是需要判断有罪才是最有力度的,所以他会把“有罪”作为对立假设(备择假设)中。审判中,我们需要的就是找到“有罪”的证据,我们就能推翻“无罪”的原假设。但是如果法官把两个假设对调一下,原假设是被告“有罪”,备择假设是“无罪”。这时,法官拒绝原假设会变得非常简单,如果要找到原告“无罪”的证据我们随处都可以找到,这样,我们拒绝原假设“有罪”的力度则会大大减轻了。这样是无法判断出被告“有罪”的。因为找不到证据,我们不能说他一定“无罪”。

所以说在我们研究假设检验的时候,一定要将我们希望的假设作为对立假设(备择假设)中,这样做我们才能通过数据的统计分析去有力地证明我们对原假设的拒绝或不能拒绝是有力度的!

二、假设检验(Hypothesis Test)对于数据的要求及如何验证

对于假设检验,我们是需要通过不同的数据组进行统计分析得出差异显著性的结论的。因此,我们如果需要得到正确的假设检验的结论,除了需要使用正确的统计方法和计算,还要一个重点就是来自过程的数据的要求。这个数据的要求也是我们今天重点要介绍的:数据的随机性、代表性和独立性。

关于随机性的解释是:如果一个事件的结果不是确定的(必然或不可能)那这个事件就是随机的,也就是说随机等价于“不确定”。

对于数据随机性的检验我们可以通过控制图进行判定,大家想一想控制图为什么可以作为随机性的验证工具呢?随机代表着不确定,那么如果把一组数据完成控制图,那么,如果数据均未判异,说明数据的波动仅是偶然因素导致的,没有异常因素,也就没有规律可循。这样我们就可以认为这组数据的产生是随机的

数据的代表性:顾名思义,就是样本对总体的代表程度,或者说样本结构与总体结构的相似性。狭义上讲,就是要求总体中的每一个样品都具有同样被抽中的概率。既然如此,我们要确保每一个样本数据被抽中的概率相等,就需要有科学的取样方法。这些方法在国标中均有要求,不再赘述!

关于数据的独立性也是在判定结果中非常重要的。数据的独立性就是在抽样时,取得的每一个抽样值均不受其它抽样值的影响。我们通常使用游程检验来判定数据的独立性。独立性的游程检验的原假设是“数据是互相独立的”,备择假设就是“数据不独立”。

在实施的项目中涉及到假设检验,通常情况下大家都认为数据是有代表性的、随机性的和独立性的,同时假定数据是符合正态分布的。大多形成习惯,在假设检验的时候忽略了数据的相关验证。

但是,从项目的严谨性的角度考虑,还是需要对以上提及的数据要求进验证,这样数据得出的结论才具有说服力!

,