在写这篇文章时,正好看到《庆余年》中范闲作诗的剧集,那就以范闲抄袭的杜甫的《登高》开始。
配对设卡方检验
之前案例中的配对样本T检验,同样是配对检验,两者的不同在哪里?配对样本T检验针对的是连续数据资料,而配对设计卡方检验针对是频数数据,也就是计数数据。如果是两组概率(百分数)之间的比较,设计类型是配对设计,则就要使用配对设计卡方检验,具体使用场景如下:
(1) 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同
(2) 分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同
一致性检验诊断试验的一致性检验经常用在下列两种情况中:
(1) 一种是评价待评价的诊断实验方法与标准的一致性;
(2) 另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作出的诊断的一致性等等。
Kappa值即内部一致性系数(inter-rater, coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。
- Kappa≥0.75两者一致性较好;
- 0.75>Kappa≥0.4两者一致性一般;
- Kappa<0.4两者一致性较差。
在配对设计卡方检验与一致性检验的数据中,行变量和列变量代表的是一个事物的同一属性,只是对这个属性的判断方法不同而已。行和列均指的是患者是否患有癌症,所不同的是一个是A方法,另一个是B方法。这种列联表最大的特点是行和列数目永远都是一样的。
为什么同一配对设计计数资料咋还有两种检验方法呢?其实这两种方法各有侧重:
- Kappa检验旨在评价两种方法是否存在一致性;配对χ2检验主要确定两种方法诊断结果是否有差别;
- Kappa检验会利用列联表的全部数据,而配对χ2检验只利用“不一致“数据;
- Kappa检验可计算Kappa值用于评价一致性大小,而配对χ2检验只能给出两种方法差别是否具有统计学意义的判断。
示例1:现有175份临床标本同时接种甲、乙两种培养基,培养结果如下所示。比较两种培养基的培养效果(阳性率)是否有差异。
1. 数据录入:
- 在SPSS的“变量视图”中设置三个变量,row_乙代表乙培养基(1-阳性,2-阴性);col_甲代表甲培养基(1-阳性,2-阴性);Freq代表各类别频数。
2. 建立假设:建立检验假设,确定检验水准 α
- H0: μ1= μ2 ,即两种培养基阳性率相同
- H1: μ1 μ2,即两种培养基阳性率不同
- α = 0.05,即置信区间为95%
3. 配对卡方检验与一致性简要
(1) 打开 数据—个案加权
- 因不是原始表,仅是频率表,所以先进行加权,用 Freq 进行加权
- 将 freq 加入 频率变量,点击 确定
(2) 选择 分析--描述性分析—交叉分析
(3) 参数选择
- 在主页面上,将 row_乙 选入行,将 col_甲 选入 列,然后点击 统计。
- 在 单元格 页面中,默认选择 计数,在 百分比 中选择 行与列。
4. 数据结果与说明
(1) 数据基本描述:
- 显示频数表,可看出乙培养基的阳性率为 55.4%,甲培养基的阳性率为37.1%。
(2) 检验结果
- 由表A可知,两种培养基阳性率差异具有统计学意义,不一致;从频数表可知,乙培养基的阳性率较高,要好于甲培养基。
- 由表B可知,kappa=0.422,p=0.000,说明两种培养基的吻合程度具有统计学意义。但其系数值仅为0.422,实际上两种培养基的吻合程度也不好。
5. 语法:
***************** 加权 *******************.
WEIGHT BY Freq.
***************** 卡方检验 *******************.
CROSSTABS
/TABLES=row_乙 BY col_甲
/FORMAT=AVALUE TABLES
/STATISTICS=KAPPA MCNEMAR
/CELLS=COUNT ROW COLUMN
/COUNT ROUND CELL.
示例2:两名医生对200名棉肺沉着病的可疑患者的诊断结果如下所示,分析两名医生诊断的结果是否相同?
1. 说明:
- 本例200名可疑患者,分别由2名医生进行诊断,符合同一受试对象采用不同的诊断方法进行检测的配对设计,同时检测结果为计数资料三分类,本例为3×3方表。
2. SPSS设计录入
- 同样设计为3个变量,分布为 doctor_甲(1-正常,2-1期,3-2期)、doctor_乙(1-正常,2-1期,3-2期)、freq。
3. 数据加权
- 打开 数据—个案加权,将 freq 加入 频率变量,点击 确定
4. 参数选择
- 主页面:行—doctor_甲,列- doctor_乙
- 统计页面:选择 kappa和 麦克尼玛尔 两个参数
- 在 单元格 页面中,默认选择 计数,在 百分比 中选择 行与列。
5. 数据结果与说明
(1) 数据基本描述:
- 显示频数表,可看出甲医生诊断正常率为41.5%,乙医生诊断正常率为42%。
(2) 检验结果
- 由表A可知, P=0.786,说明两名医生的诊断效果没有显著性差异。
- 由表B可知,kappa=0.737,p=0.000,说明医生的诊断结果的吻合程度具有统计学意义。
6. 语法:
***************** 加权 *******************.
WEIGHT BY Freq.
***************** 卡方检验 *******************.
CROSSTABS
/TABLES=doctor_甲 BY doctor_乙
/FORMAT=AVALUE TABLES
/STATISTICS=KAPPA MCNEMAR
/CELLS=COUNT ROW COLUMN
/COUNT ROUND CELL.