用于无序分类资料的相关系数包括如下:∅系数、Cramer V系数、Pearson列联系数是基于卡方统计量而计算的;λ系数是基于类别判断错误而计算的;Q系数是基于一致和不一致的对子数而计算的,下面我们就来说一说关于统计相关系数题?我们一起去了解并探讨一下这个问题吧!

统计相关系数题(白话统计阅读笔记)

统计相关系数题

用于无序分类资料的相关系数包括如下:∅系数、Cramer V系数、Pearson列联系数是基于卡方统计量而计算的;λ系数是基于类别判断错误而计算的;Q系数是基于一致和不一致的对子数而计算的。

∅系数

首先需要了解一个规律,如果列联表中各个格子的比例保持不变,则卡方值与例数N是呈正比的,也就是说如果格子中的数据呈比例扩大后的卡方值也呈比例扩大,所以∅系数是基于这一思想提出来的,当两个变量毫无关系时,∅系数为0,当两个变量存在完全关系时,∅系数为1。

Cramer V系数

当行和列数大于2时,∅系数的取值可能大于1,这对于相关的描述是无法接受的,所以Cramer V系数用来描述在行和列大于2的列联表中两个变量的相关关系。

Pearson列联系数

该系数的也是为了避免∅系数最大取值大于1这种情形而产生的,它采用了另一种变换方式,保证了∅系数不超过1。

λ系数

其思路为假定有AXB的一张列联表,其中A作为分组变量(自变量),B作为结局变量(因变量),比如,如果吸烟与心肌梗死完全独立,那么根据一个人吸烟与否是无法判断去是否患有心肌梗死的,但如果吸烟与心肌梗死不是独立的,而是有关联的,如吸烟发生心肌梗死的概率更高,那么当已知一个人患有心肌梗死时,我们可能会倾向于判断他吸烟。λ系数反映了判断误差减少的比例,如果A和B无关,那么根据A来判断B就会有很大误差,因为你根本不知道该如何判断,而如果A和B有关,那么根据A来判断B的误差就会较小,也就是说A和B的 相关性越强,根据A来判断B的误差就越小,此时λ系数也就越大。

Q系数

当四格表中任意一个格子中的频数为0时,Q系数为1或-1,这一点与∅系数不同,在这种情况下,使用Q系数要谨慎,因为只有一个格子的频数为0并不意味着完全正相关或完全负相关。

Q系数只能用于四格表,不能用于行或列大于2的列联表。

Ref: 《白话统计》 冯国双著

,