智商测试是现代心理学家最常使用的手段之一,但智商测试在方法上也有许多缺陷。
IQ 是智商的缩写,是心理学中引用最广泛、用途最广泛的工具之一,跨越了一个多世纪的研究,涉及数千项研究。为了测量人类的先天智力,智商测试通过将几个不同任务的分数聚合成一个代表人认知能力的数字(IQ)。这些测试也有许多最近才被理解的方法论缺陷。
“我认为智商测试弊大于利,”英国心理学家肯理查森说,他是《理解智力》一书的作者。“现在是我们超越智商的意识形态腐败机械模型,对智力进行更深入和更广泛的评价的时候了。”
质疑测试结构
结构效度,或者说任何测试可以衡量它所宣称的结构的程度,是使用智商作为科学衡量标准的最大问题之一。根据理查森的说法,智商的结构效度不存在:“在生物医学和其他科学测量中使用的意义上,或者不知道‘内部’的差异真正反映在‘外部’的分数中。那是因为对于“内部”发生的事情几乎没有达成一致的理论。”
正如2019 年发表在《记忆与认知应用研究杂志》上的一篇评论中所讨论的,通常被吹捧为“一般智力”的东西只不过是在 IQ 测试中为类似任务激活相同大脑区域而产生的统计伪影。 .
另一方面,智商最著名的一件事是其分数分布的形状。将一组考生的分数放在图表上时,他们通常遵循钟形曲线——即所谓的正态分布。人们常说智商自然会以这种方式下降,因此拼写证明它是一个合法的构造。然而,它实际上是人为构造的,平均为 100,标准差为 15。
还有智商相关效度的问题。支持智商的一个常见论点是,它与其他结构高度相关,例如社会经济地位,从而证明了它的有效性。然而,在进一步的审查下,这一切都分崩离析了。例如,智商和社会经济地位之间的大规模相关性也可以说代表了收入和财富对一个人的测试条件的无法解释的影响。
同样,理查森和他的同事们透露,工作绩效是智力测试中最受推崇的相关性之一,在经验上是值得怀疑的。“随着时间的推移,相关性会逐渐消失,与后来的工作表现或其他成功指标几乎没有相关性,”他说。
事实上,工作表现和智商之间的联系是极其脆弱的——这个联系所依赖的相当多的研究已经有几十年的历史了,并且由各种不易比较的测试组成。理查森补充说,许多此类研究所依赖的工作绩效衡量标准本身就存在很大缺陷,缺乏标准的可靠性和有效性来确定正在衡量工作绩效的客观标准。
生物学缺陷
还有一个进一步的生物学理由来反对 IQ 方法论的健全性。智商可能因为遗传基础的程度受到明显的影响。行为遗传学家进行的工作主要依赖于双胞胎研究(评估同卵双胞胎与给定性状相关的相似程度)和全基因组关联研究(GWAS),后者调查整个基因组以找到可能的特定基因与手头的给定特征相关联。
然而,这两种措施都存在方法问题。心理学家杰伊·约瑟夫(Jay Joseph)在他的《双胞胎研究的麻烦》一书中深入探讨了双胞胎研究如何建立在双胞胎和非双胞胎同等抚养环境的假设之上——这一假设经常失败。
根据理查森的说法,GWAS 通常隐藏在表面之下的许多环境混淆。研究人员经常陷入错误假设,即他们在使用本身带来额外混淆的措施时已经纠正了这些错误。这项研究经常表明,与直接的遗传联系相反,是社会不平等得到遗传的另一种方式:通过社会和环境措施。
此外,这些措施强烈依赖于遗传力的测量,这是基于过时的模型而闻名,这些模型没有考虑最近的遗传发现,例如表观遗传学,即研究环境如何导致基因变化的研究。“我不确定它是否基于任何遗传基础,”最近获得博士学位的凯文·伯德说。来自密歇根州立大学,专注于智商如何帮助促进科学种族主义。
“他们在过去几十年中发现的主要事情是,智商分数的相似性和遗传相关性之间存在相关性,但这几乎没有告诉你什么,”伯德说。
智商作为一种看似存在许多问题的衡量标准,由于其缺乏结构有效性、其背后的遗传学研究存在缺陷以及相关性存在问题。由于一些科学家的工作,现在我们可以开始了解它普遍存在多大程度上的缺陷。
,