孤独症谱系障碍家庭训练（几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究）

孤独症谱系障碍（autism spectrum disorders，ASD）是一种广泛性发育障碍疾病，又称为孤独症或自闭症，其主要症状为社会人际交往障碍、言语沟通表达障碍、刻板动作、兴趣活动局限以及智力障碍[1]。近年来，ASD患病率呈上升趋势，据世界卫生组织统计，全球儿童（14岁以下）ASD患病率为0.67%。2018年美国8岁儿童ASD患病率为2.27%，2011年韩国7~12岁儿童ASD患病率为2.63%，2019年我国6~10岁儿童ASD患病率不到1%[2，3，4，5，6]。ASD病因复杂多样，至今尚不完全清楚其发病机制，遗传因素、环境因素、围产期因素均是诱发ASD的主要原因，其中遗传因素包括家族遗传、父本基因突变遗传、染色体异常等，环境因素包括儿童家庭周围环境（空气污染程度）、母亲职业毒物接触史、孕期疾病史、孕期生活地点与儿童出生地点等，围产期因素包括胎儿早产、窒息和母亲服用药物等。ASD患儿一般起病于出生后36个月内，3~5岁时会呈现部分明显病症[7]。

ASD的发现和治疗不及时会影响患儿终生，给其家庭带来巨大的经济负担和沉重的精神压力，因此科学有效的ASD量表对ASD患儿的前期筛查与诊断尤为重要。研究表明，ASD量表有利于家长早期发现ASD，使患儿尽早接受专业人士的诊断和干预[8]。目前美国《精神障碍诊断与统计手册（第五版）》（DSM-5）[9]和《国际疾病分类第十一次修订本》（ICD-11）[10]是应用最为广泛的两个诊断标准。本文基于专业使用与家庭使用的双视角对几种常见儿童ASD量表进行深层次地解析与重构，探索可用于儿童ASD筛查和诊断的新方法，旨在缓解专业人员资源短缺的问题，提高筛查与诊断的准确性，并降低误诊率和假阳性率，为儿童ASD早期干预数据的收集以及后期治疗提供可靠的科学依据。

1　ASD筛查与诊断测评工具

ASD的早期筛查分为两级，一级筛查是在普通儿童里筛查出疑似ASD患儿，筛查量表有幼儿孤独症筛查量表（CHAT）、修订版幼儿孤独症筛查量表（M-CHAT）、幼儿孤独症筛查量表-23（CHAT-23）、社交反应量表（SRS）等。若一级筛查结果为阳性则进行二级筛查，进一步筛查出疑似ASD患儿，筛查量表有儿童孤独症行为量表（ABC）、克氏孤独症筛查量表（CABS）、两岁儿童孤独症筛查量表（STAT）、孤独症谱系商数量表（AQ）等。若二级筛查结果为阳性，则需要进行早期诊断，诊断量表有孤独症诊断访谈问卷修订版（ADI-R）、孤独症诊断观察量表（ADOS）、儿童孤独症评定量表（CARS）等，一旦确诊则需要尽早进行干预和治疗。

量表的准确性主要体现在其灵敏度和特异度。灵敏度反映量表正确诊断出阳性患者的能力，特异度反映量表正确诊断出阴性患者的能力。相同量表筛查和诊断ASD的灵敏度和特异度不一致的原因有以下3个方面：（1）现在最新的诊断标准是DSM-5，而目前的量表均是基于DSM-4及之前的标准编制的，与最新的标准无法对接。例如DSM-5将DSM-4中的"社会互动"和"语言沟通"合并为"社会交往"，且加入了对ASD的描述，将ASD程度划分为三个等级：需要支持（Ⅰ级）、需要较多支持（Ⅱ级），需要极大支持（Ⅲ级）[11]。这可能会影响量表的灵敏度和特异度。（2）量表中的一些项目不适用于所有的研究对象。如ABC中的一些项目（不会穿衣服、不会控制大小便、不能发展任何友谊等）对于12~24个月的正常儿童不能独自完成。（3）量表的界值会影响灵敏度和特异度，国外的筛查界值不一定适用于中国的ASD筛查，原因包括人种差异、文化差异、生活习惯差异（例如中国家长哄抱孩子的频率远高于西方国家）、对孩子教育方式差异等。ABC经过汉化后将筛查分数线由原来的53分调整到31分时，信效度最高；CARS汉化后诊断界值为30分时，信效度、灵敏度、特异度均良好，使用价值最高；中文版CABS将诊断界值改为14分时，具有较好的信效度。

1.1　一级筛查量表1.1.1　CHAT的演变

1992年BARON-COHEN等[12]编制了CHAT，该量表由两部分共14个项目构成。第一部分由专业人士询问儿童抚养人，完成9个是非判别问题，涉及象征性游戏、社交兴趣、运动发展、指向性行为和共同注意力等方面；第二部分有5个项目，需要专业人士观察儿童的行为，根据目光接触、注意力、假装游戏、原始指向和搭积木等表现进行评定。完成该量表大约需要5 min，耗时短、易操作。但是>24个月的患儿就诊时，需要抚养人回忆或调用患儿18个月时的表现和活动录像来判断。2000年BAIRD等[13]以ICD-10和ADI-R为标准，采用CHAT筛查ASD患儿的灵敏度和特异度分别为0.38和0.98。

2001年ROBINS等[14]将CHAT修改成M-CHAT，在CHAT的第一部分增加了14个项目，即一共23个是非判定问题。增加的项目涉及眼神交流、声音敏感性、模仿能力、共同注意力、社交回应，以及指令性行为等方面。2016年KIM等[15]以ADOS-2和ADI-R为标准，证实M-CHAT筛查ASD患儿的灵敏度和特异度分别为0.52和0.84。2016年黄春等[16]以DSM-5和ABC为标准，采用M-CHAT筛查ASD患儿的特异度为0.95。

CHAT-23是将M-CHAT的第一部分与CHAT的第二部分结合起来的一种新的中文筛查量表[17]。CHAT-23分为两部分，A部分是家长自填问卷，有23个是非判定问题；B部分由专业人士直接观察，有4个项目，包括眼神交流、原始指向、假装游戏和无陈述指向。CHAT-23的创新点是将筛查分两步，先通过A部分确定可能为阳性病例，然后再经过专业人士进行B部分的观察。2016年龚俊等[18]以DSM-5和CARS为标准，采用CHAT-23筛查ASD患儿的灵敏度和特异度分别为0.85和0.98。2018年龚俊等[19]以DSM-5和CARS为标准，再一次采用CHAT-23筛查ASD患儿，结果表明CHAT-23的灵敏度和特异度均为0.97。

1.1.2　SRS

2005年CONSTANTINO等[20]编制了SRS，该量表主要强调儿童的社交行为能力，将社交能力进行量化从而评估儿童的社交情况。SRS由社交知觉、社交认知、社交沟通、社交动机和ASD行为方式[21]5个子量表构成，共包含65个项目。2018年LI等[22]以DSM-4和ABC为标准，采用SRS筛查ASD儿童的灵敏度和特异度分别为0.60和0.78。自2010年以来，彭新贤等[23]以DSM-5、ABC和CARS为标准，采用SRS筛查ASD患儿的原始切点、灵敏度和特异度分别为59.80、0.95和0.90。

1.2　二级筛查量表1.2.1　ABC

1978年KRUG等[24]编制了ABC，该量表主要强调ASD患者的感觉、行为、情绪及语言，共包含57个条目，涉及5个方面：感觉能力、沟通能力、语言能力、运动能力和社会生活自理能力。杨晓玲等[25]在1993年对ABC进行汉化，与原版相比，虽然内容没有改变，但是建议筛查的分数由原来的53分调整为31分，使ABC更适用于中国ASD患儿的筛查。2005年李建华等[26]以DSM-4为标准，采用ABC筛查ASD患儿，结果表明ABC以31分为筛查界值最好，灵敏度和特异度分别为0.89和0.97。2013年王冰等[27]以DSM-4为标准，采用ABC筛查ASD患儿的灵敏度为0.5，特异度高达1.0。

1.2.2　CABS

1969年CLANCY等编制了CABS[28]，该量表共包含14个项目，由抚养人根据孩子最近1个月的情况填写。2005年李建华等[26]以DSM-4为标准，采用CABS筛查ASD患儿，结果表明CABS以6分为筛查界值最好，灵敏度和特异度分别为0.82和0.91。2006年张琴[29]把65例已确诊ASD的患儿和65例非ASD患儿混合在一起，采用CABS来筛查ASD患儿，结果表明CABS的灵敏度和特异度分别为0.82和0.88。

1.2.3　STAT

1997年STONE等[30]编制了STAT，该量表共12个项目，涉及4个方面：游戏能力、共同注意能力、模仿能力和要求能力，主要用于筛查24~36个月的ASD患儿。2008年STONE等[31]以DSM-4-TR（DSM-4修订版）和ADOS为标准，采用STAT筛查24个月龄以下的ASD患儿，结果表明STAT以2.75分为筛查界值最好，灵敏度和特异度分别为0.95和0.73。

1.2.4　AQ

2001年BARON-COHEN等[32]编制了AQ，该量表包括儿童版（AQ-Child）、青少年版（AQ-Adol）和成人版（AQ-Adult）。AQ由社交技巧、注意转移、细节关注、言语交流和想象力5个子量表构成，共50个项目。AQ-Child包含的项目与AQ-Child和AQ-Adult基本是一致的，分数越高表明ASD的可能性就越大。BARON-COHEN等[33]研究表明，AQ-Child以76分为筛查界值最好，灵敏度和特异度均为0.95。2018年李洪成等[34]以DSM-4为标准，采用AQ-Child筛查ASD儿童发现37分为筛查界值最好，灵敏度和特异度分别为0.96和0.90。

1.3　诊断量表1.3.1　ADI-R

1994年LORD等[35]在孤独症诊断访谈问卷（ADL）的基础上修订成ADI-R，该量表被欧美国家认定为诊断ASD的金标准之一，该量表共有56个项目，其中有3个核心部分，分别为社会交往（16项）、语言和沟通（13项）、刻板重复行为（8项），另外还有判断起病的年龄（5项）、非诊断项目（8项）以及特殊天赋（6项）。目前，ADI-R在国外被广泛使用，但因ADI-R的诊断需要具有较高的专业知识和从业技能的专业人士评测，所以该量表在国内还未被广泛使用。2006年RISI等[36]以Best Estimate临床诊断为标准，采用ADI-R诊断3岁以上美国ASD患儿的灵敏度和特异度分别为0.89和0.59。

1.3.2　ADOS

1989年LORD等[37]在其本人前期编制的ADOS基础之上，通过观察儿童在游戏中的行为、语言交流、交往和想象力进行诊断。ADOS分为4个模块（M1、M2、M3和M4），使用模块取决于儿童的发育状况和表达能力。M1主要针对的是没有短语能力，但是能交流的儿童；M2针对的是有短语能力，但语言不流畅的儿童；M3针对的是语言流畅，且能用玩具进行游戏的儿童；M4针对的是有社交和情感感受的青少年和成人。目前，2006年修订的ADOS最新版本在全世界被广泛使用[38]。2004年BÖLTE等[39]以ICD-10和DSM-5为标准，采用ADOS筛查ASD患者，结果表明其对ASD和非典型ASD的灵敏度和特异度分别为0.90和0.48。

1.3.3　CARS

1980年SCHOLER编制了CARS，该量表共有15个项目，涉及与他人关系、模仿、情绪、肢体动作、适应能力、视觉反应、听觉反应、嗅觉反应、语言交流、智力等方面。评估者通过观察、询问，以及从病史中收集数据，根据行为的古怪、频率、严重程度、持续时间进行打分，CARS具有高灵敏度（0.98）和高特异度（0.85）[40]。2003年李建华等[41]以DSM-4为标准，引进汉化CARS并诊断ASD儿童，结果表明CARS以30分为诊断界值的灵敏度和特异度均为1。目前，该量表也是我国常用的ASD诊断工具。

2　ASD筛查与诊断测评工具分析

综合前期各类ASD筛查和诊断量表的功能性与差异性，可从相应量表的适用年龄、评估方式、计分方法和评定标准等方面进行综合考量。

2.1　基于适用年龄的量表分类

目前ASD儿童的发病年龄逐渐提前，甚至在24个月之前就会出现ASD的相关症状。研究表明≤24个月的儿童神经塑性强，行动问题还不突出。早期行为干预能够明显改善ASD患儿的认知、语言和适应能力。因此表1以24个月为界点分类，适用于≤24个月的儿童筛查量表有CHAT、M-CHAT、CHAT-23、STAT和ABC，这些量表均可以在早期筛查出ASD患儿，从而尽早地进行诊断和干预，得到有效治疗；适用于>24个月的儿童筛查量表有M-CHAT、SRS、ABC、CABS、STAT、AQ，其中M-CHAT、ABC和STAT使用的范围广，不仅适用于≤24个月儿童，还适用于>24个月的儿童，ABC、SRS、CABS和AQ更加针对的是>24个月的儿童。

孤独症谱系障碍家庭训练（几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究）(1)

这些量表均涉及儿童的三大类核心症状，即社会沟通、社会交往和重复的行为及兴趣。由于适用年龄的不同，量表的内容上也有部分不同。≤24个月的儿童语言表达不够流利，行动不够自如，所以CHAT系列量表和STAT中的内容更加适用。例如M-CHAT中第6项，"孩子曾用手指指着东西，要求要某样东西吗？"；CHAT-23中第14项，"当你叫孩子的名字时，孩子会回应你吗？"；STAT中点心时间和泡泡活动均只需要儿童有目光的伴随及发声即可。>24个月的儿童语言表达、理解能力和行动能力均较好，所以ABC、SRS、CABS、AQ中的内容更加适用。例如ABC中第56项，"在日常生活中至少会用15个但又不超过30个短句来进行交往。"；CABS中第6项，"以手势表达需求"（正常的儿童是可以用语言清楚的表达）；SRS中第44项，"不能理解事件的相互关系"和第48项"有幽默感，能理解笑话"。

适用于≤24个月儿童的诊断量表只有ADOS，所以≤24个月儿童的诊断还不够完善。适用于>24个月儿童的诊断量表有ADI-R、ADOS和CARS，其中ADOS使用的范围更广。众所周知，幼儿期女童的生理发育与心理发育速度均普遍快于男童，尤其表现在语言能力和小动作行为能力上[42]。例如女童比男童开始说话早，说话的流利程度比男童好。男童和女童在大脑发育上存在很大的差异，女童更容易立体分析和处理信息，男童的精力更加旺盛，在大动作的发育中远超过女童。因此在24个月以内，男童和女童是否能够用同一个量表，还有待研究。

2.2　基于评估方式的量表分类

目前，常用的ASD筛查量表和诊断量表可以分成三类，第一类是由抚养人填写问卷，第二类是由专业人士观察评估，第三类是将抚养人填写问卷和专业人士观察结合起来评估。

如表1所示，M-CHAT、SRS、ABC、CABS、AQ是由抚养人根据患儿平时的行为和语言沟通及抚养人的回忆填写的，这样更加便捷，在家里就可以完成。STAT由专业人士通过游戏互动的方式观察患儿在评估中的表现，例如STAT中的娃娃游戏，即给患儿娃娃或布偶，再加上家具、饮食器皿，观察患儿能否做出一些功能性的游戏（过家家）；气球活动，即在患儿面前吹气球后放气，使气球在室内飞，观察患儿是否伴随目光移动和发声；以及汽车模仿，即在桌子上来回滑动汽车，鼓励患儿模仿动作，这样会使筛查更具有专业性。CHAT和CHAT-23将抚养人填写问卷和专业人士观察结合起来进行评估，如CHAT中的A部分是询问抚养人，如"孩子喜欢玩躲猫猫吗？""孩子喜欢爬楼梯吗？"和"孩子能拿件东西走到你面前给你看吗？"；B部分是专业人士通过游戏和指令性行为观察患儿的情况，如"见面时，孩子与你有眼神接触吗？"，给孩子一个茶杯和茶壶，说"你能给洋娃娃喝茶吗？"观察孩子是否假装倒茶给洋娃娃喝和孩子是否可以用积木搭建城堡。虽然这样花费的时间较长，但是更具有准确性、全面性和专业性。

每个家庭的生活环境和每个诊疗室的环境不尽相同，即使同一个儿童在不同的环境下进行同样的量表筛查，其分数亦会有所差异，这会影响ASD筛查的准确性。因此场景标准化是必要的，即制订标准化的氛围场景以及交谈剧本，让患儿在相同的氛围下进行量表筛查，以减少外部环境的特异化影响，降低筛查与诊断中的主观性，提高量表的准确性。目前所用的ASD诊断量表均需要医院专业人士观察、评估才能进行诊断，可能使专业人士在短期内不能全面了解患儿。因此抚养人填写问卷、专业人士观察和两者结合的评估对筛查与诊断效能有所影响。

2.3　量表的计分方法和评定标准2.3.1　ASD筛查量表的计分方法和评定标准

目前，常用的ASD筛查量表的计分方法主要包括两种：2点计分法和4点计分法。如表2所示，CHAT、M-CHAT和CABS属于2点计分法，分为两个方面"是"或"否"。其中CHAT和M-CHAT设置了关键项目，即判定是否患ASD的决定性项目。如M-CHAT，6个关键项目（2、7、9、13、14、15）中有2项及以上为"是"时，即为高度疑似ASD患者；若第11、18、20、22个项目为"是"，其余项目为"否"，即为疑似ASD患者。

孤独症谱系障碍家庭训练（几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究）(2)

CHAT-23、SRS和AQ属于4点计分法，分为4个方面"没有""偶尔""有时"和"经常"。如CHAT-23中第16项为2点计分法，其余各项为4点计分法。CHAT-23中的4点计分法有所不同，将"没有"和"偶尔"算作"否"，将"有时"和"经常"算作"是"。而且CHAT-23有3种评定标准，第一种是A部分23个项目中有6项及以上项目为"是"；第二种是A部分中的7个关键项目（2、5、7、9、13、15、23）中有2项及以上为"是"；第三种是B部分4个项目中有2项及以上为是，就可以判定为高度疑似ASD患者。

ABC量的计分方法是每项的评分根据其在量表中的负荷大小给予1、2、3、4级评分。国外版的评分标准是总分>53分为疑似ASD患者，总分>67分为高度疑似ASD患者；中文版的评分标准是总分>31分为疑似ASD患者，总分>67分为高度疑似ASD患者。

2.3.2　ASD诊断量表的计分方法和评定标准

常用的ASD诊断量表的计分方法和评定标准如表3所示，其中CARS共有15个项目，根据使用者异常行为表现的严重程度进行7点计分，即1、1.5、2、2.5、3、3.5、4分制；总分<30分无ASD，总分为30~35分为中度ASD，总分≥36分为重度ASD。虽然这些计分方法和评定标准很灵活，但存在较大的主观性，其有效性有待大规模临床证据来验证。

孤独症谱系障碍家庭训练（几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究）(3)

2点计分法是从正面和负面2个点展开，如"是"或"否"和"通过"或"未通过"，有利于计分者便捷地计分，不需要考虑程度，但同时也模糊了是与否的边界。4点计分法同样是从正面和负面两个点展开，但是分别在正面和负面中再展开2个点，一共4个点，如"没有""有时""经常""总是"。这样可以使计分者根据患者的表现程度更加具体、准确地进行计分，但同时也提高了计分者对患儿的了解程度和对这4个点的判断能力，从而使量表更具主观性。因此可以对"偶尔""有时"和"经常"进行一个标准量化，例如CHAT-23中第14项，"当你叫孩子的名字时，他会回应你吗？"可以将"偶尔"标准化为一周1~3次，"有时"标准化为一周4~8次，"经常"标准化为一周8~15次，但对于具体标准化的量值还有待研究。

3　讨论

目前大部分的量表可以大致分为两类：一类是家庭用的量表，在家里就可以填写问卷，同时可以根据儿童的年龄选择相应的量表，例如M-CHAT、SRS、ABC、CABS、AQ等量表。这些量表的缺点在于家长没有相关的专业知识，对量表的把握程度不高。另一类是专业人士使用的量表，需要在医院或机构进行筛查，如CHAT、CHAT-23、STAT、ADI-R、ADOS、CARS，其中ADI-R和ADOS的检测人员是需要考取相关资格证后才能进行评估，所以这类量表在我国应用的范围比较小。

在医院或机构进行筛查，患儿会因为环境和与人交流产生恐惧和退缩等情绪，从而影响量表的准确性。为此可以设想将量表与人工智能结合起来，分别应用于家庭场景、学校和机构场景、医院场景。在这三个场景中分别安装云台系统，用摄像头识别和记录患儿在三种环境下的行为和面部情绪，通过深度学习算法进行诊断，做到对ASD患儿的动态评估，也为后续的干预治疗提供数据支持。

人工智能诊断可以对患儿每一刻的行为和表情进行记录，若超出预警线，则先做出标记，通过多次记录进行机器学习等算法计算，将得到的数据进行分析处理可以及时做出诊断使诊断并的时间减少，提高了诊断速度，具有更好的稳定性、准确性和精确度。同时避免了专业人士的主观性和偏向性，提高了专业人士的工作效率，降低了成本、误诊率和假阳性率。虽然人工智能应用于ASD的筛查、诊断和治疗干预对目前很多ASD患儿的家庭来说还处于犹豫状态，需要很长的过程才能被医生和家长认可，但是这种交叉技术必将正面影响ASD早期筛查的发展方向。

本文无利益冲突。

参考文献略

本文来源：蔡郑婷, 胡连信, 王泽峰, 等. 几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究[J]. 中国全科医学, 2022, 25(24): 2998-3004.

孤独症谱系障碍家庭训练（几种常见儿童孤独症谱系障碍筛查及诊断量表的比较研究）

最新推荐

热门推荐