模糊集合、质性比较与国关研究

摘要:

国际关系研究的核心目标在于探究现象发生的原因,方法论的支撑是比较案例分析和大样本统计法。基于密尔逻辑的比较案例分析存在以下两个方面的问题:一是因果关系的简约化;二是案例数量的非充沛性。在比较案例分析的基础上引入具有逻辑真值表的布尔法,可以识别出导致现象发生的原因组合。但是,布尔法只能处理条件变量和结果变量均为二分变量的案例。有鉴于此,西方学者借助数学工具,构建了基于模糊集合理论的“质性比较分析方法”(fsQCA)。本文详细梳理了国际关系研究中从比较案例分析、布尔法到fsQCA的发展脉络,探讨了各种方法的使用界限与优缺点,阐述了fsQCA的基本原理和操作规则。作为一种中等数量样本的比较方法,fsQCA能够尽可能精确地挖掘现象背后的原因,对案例的处理也更加多样,丰富了国际关系研究的方法。

作者简介:

蒋建忠,江苏省社会主义学院

论文来源:

Quarterly Journal of International Politics《国际政治科学》,2016, 1(2): 147-177.

一、问题的提出

目前国际关系研究中存在着一种有趣的现象,比如说,研究一些战争事件得到的因果逻辑难以解释另外一些战争事件及其规律。这使大家觉得国际关系研究的科学性远远低于自然科学。造成这种现象的原因主要有三个:一是导致国际关系现象发生的原因远比导致自然现象发生的原因复杂,某个现象的发生是多变量要素共同作用的结果。

针对上述问题,为寻找隐藏在国际社会现象背后的原因,人们创造了两种典型的方法:一是以密尔逻辑为基础的“比较案例分析方法”,用以发现因果规律;

基于密尔逻辑的比较法是仿效自然科学中的实验研究设计来挖掘因果关系。

布尔法超越了传统的比较案例分析的一些缺陷,推动了国际关系研究进一步精致化。但是,它的适用范围仍然是非常有限的。其问题主要表现在三个方面:一是案例处理的数量。一般来讲,布尔法处理的案例个数为5—7个,当案例超过这个数目但又低于统计分析所需的大样本时,布尔法就无能为力了;二是布尔法只能处理因变量和自变量是二分变量的案例,对于大样本统计分析中使用的定距变量往往无能为力;三是国际关系研究中的概念往往是“模糊”的,用二分法无法把所有的类别都纳入进去。例如,当我们考察美国的对外军事干涉问题时,常见的划分标准是,要么对外进行军事干涉(取值1),要么不干涉(取值0),但在现实中,如果美国的对外干涉是通过威慑来进行的,那就很难归类了。所以,我们需要引入模糊集合理论来处理相关的变量,

本文以下内容共分为四个部分:第一,简要回顾、评估国际关系研究中寻找现象背后原因的两种方法———比较案例分析法和布尔法;第二,引入离散数学中的模糊集合理论,结合布尔法详细阐述质性比较分析方法(fsQCA)的基本原理;第三,以分析不对称战争中弱国为什么会取胜为例,展示fsQCA的具体操作程序;第四,探讨fsQCA存在的问题及未来的发展方向。

二、既有研究方法及评估

国际关系研究的核心目标是对现象及其规律的理解与解释,也是对其进行描述、解释和预测,其中描述是基础,解释是核心,预测是必然的结果。除了少数国际关系史学家声称只做历史描述,以揭示个案的特殊性,不做因果分析外,纯粹的描述性研究并不多。

(一)密尔逻辑与比较案例分析

密尔强调归纳是一切经验知识的基础。

研究假设:争夺大国地位是大国研制核武器的主要原因(见表1)。

两组变量间相关关系建模(方法新论蒋建忠)(1)

表1 大国研制核武器的原因分析

从表1中可以看出,经过三组案例的比较,世界格局、实力地位、面临的安全威胁都不是大国研制核武器的主要原因,只有争夺大国地位才是研制核武器的主要原因。

(二)随机组设计与大样本统计方法

基于密尔逻辑的比较案例分析在自然科学研究中易于推行,因为其中的变量控制比较容易,国际社会现象的发生往往是多种原因导致的,难以通过控制背景变量来验证核心变量与结果变量的因果性。

随着近代统计技术的发展,1935年,统计学家罗纳德·A.费舍尔(Ronald Aylmer Fisher)完善了随机实验设计,将试验对象随机地分配到实验组和对照组,或随机地抽取案例。根据大数定理,个体的不可控制的微小差异随着试验对象的增加被互相抵消了。因此,两组个体的平均值就只受主要因素的影响。这样在随机实验基础上建立起来的因果关系就不再表述为个体事件,而表述为群体概率或平均值。

比较案例分析和大样本统计揭开了国际关系探究现象背后原因的方法论基础。但是,与自然现象不同,国际社会现象的发生往往是诸多因素共同作用的结果。因此,比较案例分析往往无法通过少量案例的比较寻找到现象背后的原因;即使真的能找到,该方法通常也只能识别出现象发生的一个原因。而大样本统计分析主要是通过回归方式找到现象发生的诸多原因,该方法要求样本数量较多,在对变量进行操作化时往往带有一定的主观性。具体来讲,比较案例分析方法和大样本统计分析法的缺陷主要表现在以下三个方面:

一是因果关系的简约化。人类的社会活动充满了随机性,影响国际政治现象的因素繁多,但往往缺乏一个主导性的因素。比较案例分析得出的因果关系往往是单一因果关系,会遗漏一些重要的解释变量。大样本统计分析把显著的因素都纳入自变量,剩余所有不显著的因素都被纳入残差项。尽管大样本统计法研究的是多重因果关系,但因变量和多变量之间是一种“弱”因果关系,通过回归方程往往无法辨析“因”与“果”之间究竟是充分条件、必要条件,还是充分必要条件。

二是选择性偏差。典型的选择性偏差就是为了证明原因和结论之间的关系,但这种选择仅有几个“恰恰”能够证明因果关系的案例,而对那些“反面”案例视而不见,这就没有从最大概率上保证能够选择正确的案例。许多采取定性方法的研究人员往往“信手”拈来相关案例,随意性极强,非常容易落入选择性偏差的陷阱里。

三是内生性问题。内生性问题是指如何判断自变量和因变量的问题。大卫·休谟(David Hume)认为构成现象的因果关系有三层含义:

针对上述问题,20世纪90年代布尔代数和逻辑真值表的引入有效地探究了现象发生的充分条件和必要条件,同时提供了对现象进行多变量比较分析和联合分析的工具。

(三)布尔代数与多变量比较分析

由比较案例分析获取的因果关系往往是单一因果关系。与自然科学不同的是,国际社会的现象往往是多种因素相互作用的结果,一般而言,不存在一个突出的因素对结果有显著性影响的情况,这是相关理论缺乏解释力并为人诟病的重要原因。基于布尔代数的多变量比较分析便可以较好地解决这一问题。

1. “且”与组合因果

布尔代数中的“且”表示多个原因共同存在时现象才能发生。例如,一个国家参与国际组织往往是其感受到的外在威胁与内在利益共同作用的结果。如果仅用密尔法,假设有以下比较结果(见表2)。

两组变量间相关关系建模(方法新论蒋建忠)(2)

表2 国家加入国际组织的外在因素分析

从表2中可以看出,仅仅利用比较案例分析,那么得出的结论是:外在威胁、领导人的强烈意愿、国家特性,都不是国家加入国际组织的外在因素。

根据比较案例分析,表3显示的内在利益的驱动、国际体系、国际组织特性,也都不是国家加入国际组织的原因。但是,如果把表2和表3结合起来看,我们会发现,当国家出现内在利益驱动和外在威胁共同作用时,这个国家就会加入国际组织。因此,原因2和原因3的“且”(即两个因素的共同作用)是国家加入国际组织的原因。

两组变量间相关关系建模(方法新论蒋建忠)(3)

表3 国家加入国际组织的内在因素分析

2.“或”与多重因果

传统的案例比较分析发现,在不同的案例比较中会发现不同的原因。某个原因并非结果发生的唯一原因,“或”的逻辑表明,某个条件可以由另一个条件取代,并发生同样的结果。

两组变量间相关关系建模(方法新论蒋建忠)(4)

表4 “或”与原因

在传统的案例比较法中可以得出原因1和2都不是现象发生的原因。但是考虑到两者的“或”,即当只有其中一个原因出现时,结果就发生了。思路如下(见表5)。

两组变量间相关关系建模(方法新论蒋建忠)(5)

表5 “或”与多重因果

3. “且”“或”“非”与联合因果

比较案例分析得到的是两个单变量之间的关系。上面两种方法在密尔逻辑的基础上前进了一步,但是国际社会现象的发生往往是多种因素作用的结果,简单的二分法难以窥见其背后的复杂因素。因此,在密尔逻辑的基础上,通过布尔代数符号的多重组合来寻找因果关系是一个重要方法。还是以一个假想的例子进行说明,具体结果见表6。

两组变量间相关关系建模(方法新论蒋建忠)(6)

表6 “且”“或”“非”与联合因果

由表6得知,原因1和2都不是导致结果的原因,“原因1·原因2”和“原因1+原因2”也不是。但是,原因1与“~原因2”共同发生时,结果就会发生。这是通过布尔代数中的“且”把结果发生的原因找了出来。同样,原因3、4、5共同发生时,结果也发生了。因此,结果发生的共同原因应当是“原因1·~原因2” “原因3·原因4·原因5”。这样,通过多个案例的比较分析,就把事件发生的真正原因找了出来。

布尔代数为我们提供了发掘国际社会现象背后多重原因及原因组合的方法,但是布尔法仍然存在着两个方面的问题。一是案例个数的“缺乏”。如果一个国际政治现象发生的可能原因有4个,为了确定到底是哪些原因或其组合导致了该现象的发生,从理论上讲,我们需要至少对24=16个案例进行比较研究。而在实际的操作过程中,基于布尔法的模式,往往无法对这么多案例进行有效的比较。二是布尔法中的条件变量和结果变量都是二分变量(或二元定类变量)。例如在对同盟关系(某个现象发生的可能原因之一)进行赋值时,国家间要么是军事同盟关系,要么未缔结军事同盟。事实上,某些国家很可能是非典型意义上的军事同盟关系,并非完全的军事同盟关系,我们可以说两国关系在30%程度上算军事同盟(如使用共同的军事基地、GPS信号等)。此时二分变量就转化为定距变量,在这种情况下,布尔法就无用武之地了。事实上,国际关系研究中的许多概念都包含有这种本质上的模糊性。所以,我们必须构建一种新的、超越简单二分法的模式和方法。

三、超越二分法:模糊集合与质性比较分析

基于模糊集合理论的“质性比较分析方法”(fsQCA ),是近年来兴起且得到广泛应用的一种方法。与比较案例分析和布尔法比较,fsQCA具有以下几方面的优势:一是突破了布尔法只能进行少数案例比较的限制,它可以对中等规模的样本进行分析;二是与布尔法一样,该方法能对结果或现象的原因进行更深入的分析,它强调结果是由多种因素组合导致的,利用fsQCA可以理清导致这一结果的多种方式和渠道,还可以用于多重原因的不同组合分析;

(一)“模糊集合”的基本要义

“集合论”是现代数学理论的基础。经典集合需要满足完备性的要求,即一个元素要么属于某个集合,要么不属于某个集合,它不可能存在这种情况,即一个元素有85%的可能性属于某个集合。但是,国际关系研究却常需要使用一些边界模糊或成分渐变的集合,比如讨论国际社会的稳定问题。在经典理论看来,国际社会要么是稳定的,要么是不稳定的。但是我们很容易推导出一个疑问:国际社会每年发生10次战争和发生100次战争的稳定程度是一样的吗?合理的理解应当是这样:如果该年度没有发生战争,被认定是绝对的稳定,如果用定量表示可以赋值为1;如果该年度每天都发生战争,则国际社会的稳定是0。战争天数介于0~365的稳定程度可以用0~1中的某一个具体数字来表示,这就是模糊集合的基本含义。模糊集合理论为我们提供一个精确的数学工具,它不是去规定一个清晰的临界点,而是在两个极限之间界定成员归属的不同等级。

模糊集合理论的另一个重要方面是关于集合的运算。在经典的集合理论中,交(∩)、并(∪)、补(~)是三种常用的运算。

通过上述三种基本运算,可以组成各种类型的模糊集合运算。在国际关系研究中,模糊并集模拟了多余的因果关系,而模糊交集则模拟了共生的因果关系。

(二)fsQCA方法的构建思路

构建fsQCA主要出于三方面的思考。

1.国际关系研究的本质是寻找现象背后的原因,fsQCA也是出于同样的目的。更准确地讲,是探究现象背后的充分/必要条件。

2.国际政治现象与自然现象最大的区别在于:自然现象的发生往往是某个或几个条件共同作用导致的,但都可以通过实验的方法将它们清晰地区分出来;而国际关系研究只能根据已发生的事件进行案例研究,而且所提供的案例往往难以对条件和结果变量作出简单的“二元”划分。例如,为了解国家经济的相互依赖程度与美国对外干涉的关系,现有一具体的假设:美国干涉目标国同美国经济的相互依赖程度越低,美国越倾向于对其领土争端进行军事干涉。假定考察30个案例,不可能每个案例的条件变量———经济的相互依赖程度———要么是低,要么是高,结果变量也不可能要么是进行军事干涉,要么是不进行军事干涉。如果出现以下情况,即某些案例中两国的经济相互依赖程度是界于高和低之间,或用相互依赖指数表示是0.5,而且该案例的结果变量是美国用经济制裁的方式对他国进行干涉。相对于军事干涉,经济制裁所表达的干涉决心与意愿都比较低。该案例提供的情境可以作如下描述:其条件变量干涉经济相互依存度是0.5,其结果变量军事干涉度是0.4,其中0.5和0.4分别代表条件变量和结果变量的隶属数值,那么该案例是证明了还是否定了原假设呢?事实上,从直观上看,既没有肯定也没有否定上述假设。fsQCA引入了吻合系数这个概念来判断该条件变量是不是结果变量的充分必要条件。如果条件变量x的隶属数值小于结果变量y的隶属数值,则可以认为x是y的充分条件;如果x的隶属数值大于结果变量y的隶属数值,则可以认为x是y的必要条件。

3.国际社会现象是复杂的,导致结果发生的条件可能是多因素的组合,而且它仅可能在一定概率上导致结果的发生。例如,为了证明A是某一结果发生的原因,通过对20个案例进行比较分析,发现18个案例表明A导致了结果,按照案例比较分析法和布尔法,可以排除A是结果发生的真实原因。事实上,国际关系研究难以像自然科学一样,能够找到现象发生的完全确定的充分/必要条件。因此,在国际关系研究中对因果关系也需要进行模糊化处理:如果因果的可能性达到了一定程度(如90%),我们也可以认为该因素的组合是现象发生的原因。通过对充分/必要条件的模糊处理,fsQCA超越了布尔法的限制,能够从更广宽的范围内探究现象背后深层次的因素。

(三)fsQCA的基本步骤

从上述构建思路可以看出,利用fsQCA进行因果分析可分为四个步骤。第一,获得各个条件变量和结果变量的隶属数值,这一过程称之为赋值和校准。具体步骤包括:(1)对条件变量和结果变量进行赋值,获得原始数值;(2)利用0~1区间的数字来进一步标准化原有变量的值,将结果变量与条件变量的原始数值全部转换为模糊值。上述过程就是校准各个变量的“隶属数值”。赋值和校准是研究者用模糊集逻辑来对条件变量和结果变量关系进行分析的前提。第二,对各个条件变量是不是结果的必要条件进行检测。第三,在第二步的基础上对各个非必要条件的变量进行组合,检验这些组合对结果的覆盖率,进而用该条件组合来分析结果解释力的大小。需要说明的是,必要条件和充分条件的检测都是基于条件和结果变量的模糊值进行的。第四,利用第二、三步骤得到的结果,得出现象发生的充分条件与必要条件。

1.条件变量和结果变量的操作与校准

该步骤的目标在于获得变量的隶属数值,它遵循着概念化—概念操作化—赋值—校准这一过程。

在对变量进行操作和校准之前的第一步,是对变量作出清晰的定义。对于同一变量,定义不同,案例选择、隶属数值的计算结果也各异。举例来说,按照国际关系理论,国际局势稳定是国际体系的均衡状态,它包括非稳定性均衡和稳定性均衡,前者指没有战争的状态,后者指一种不但没有战争而且也没有战备行为的状态。对所用的变量谨慎清晰地概念化是首要的工作。

概念操作化完成后,需要对变量进行赋值。国际关系研究者很难像对度量、质量、距离等那样对国际关系研究中的概念值进行衡量。一般而言,研究者都是通过对概念进行主观的赋值从而完成对变量的测量,只不过这种主观赋值需要接受同行的检验。例如,对军事干涉进行测量时,使用海陆空军进行军事干涉可以设定为10分,提供军事援助、进行军事制裁等可以赋值为8分,口头表示将使用武力威胁赋值为4分,进行经济制裁可以赋值为2分,这些数值的高低反映了军事干涉意愿的强与弱。赋值具有一定的主观性,不同的研究者可以采用不同的标准进行赋值,这使得赋值结果往往具有不可比性。在上例中,研究者可以将上述分值同时扩大10倍,但这并不影响分析的结果。因此,需要将主观的赋值校准为一致的刻度。fsQCA采用0~ 1区间的数字来进一步标准化原有变量的主观赋值。将结果变量与条件变量的原始数值转换为0~1之间数值的过程,就是测量各个变量归属度的过程,称之为校准,得到的数值称为变量的“隶属数值”。

2.对各条件变量是不是结果的必要条件进行检测

将各条件和结果变量都转化为隶属数值后,接下来要回答的问题是:条件变量与结果变量之间是否存在着某种关系?探究因果关系的基本思路仍是案例比较法和布尔法,只不过传统的案例比较法和布尔法有两个明显的弊端。一是只能处理二元变量。举例来说,为了证明国家实力差距与军事干涉之间的关系,如果出现了这样一个案例———条件变量即国家间实力差距的隶属数值是0.6,结果变量即军事干涉的隶属数值是0.5,那么,传统的案例比较和布尔法就无法判断这个案例是证明还是否定了上述假设。二是无法排除少数“例外”案例。为了证明A是B的原因这个假设,20个案例中有19个案例支持该假设,1个不支持,按照传统的案例比较法和布尔法,上述假设是不成立的,但是,应该看到国际关系现象发生的原因太复杂,不能佐证假设的个别案例可能是由于其他特殊原因导致的。因此,从概率的角度看,也应当认为假设是成立的。也就是说,研究者在考虑因果关系时要抛弃A要么“是”、要么“不是”B原因的“二元思维”。

对条件变量是不是结果的必要条件进行检测时,涉及必要条件吻合系数和吻合度的计算。在模糊集合的分析中,如果案例中的某些条件的吻合系数比较大,在集合上的表现就是,这些条件变量的隶属数值(x)应当大于结果变量的隶属数值(y)。用集合语言表示吻合系数的计算公式是:consistency=min(x,y) /y。

两组变量间相关关系建模(方法新论蒋建忠)(7)

表7 条件变量、结果变量的校准值与吻合系数

从上面例子中可以看出,前9个案例满足必要条件吻合系数大于0.75的要求,即说明条件变量(国家实力差距)是结果变量(军事干涉)的必要条件,第10个案例不满足。这说明10个案例中有9个案例出现了导致结果发生的某一条件,条件变量是结果变量的吻合度为9/10=0.9,该值满足拉金所提出的阀值要求,说明国家实力差距是进行军事干涉的必要条件。

一般来讲,fsQCA针对的是条件变量较多(5—8个)、案例较多(20—50个)、单纯用比较案例分析和布尔法的逻辑真值表难以解决的因果检验的情况。那么在计算吻合度系数的时候,如果用手工进行计算,往往会费时费力,拉金等人已编制了软件进行运算。

3.测量多个条件变量所构成的条件组合对结果的覆盖率,进而用该条件组合来分析结果解释力的大小

吻合度测试了结果发生的必要条件。如果在上述步骤中测量某个条件变量对结果的吻合度已达到了0.9以上,说明该条件达到了必要条件的水平,那么在该步骤的条件组合分析中就没有必要再分析该条件变量对结果的影响。如果吻合度在0.9以下,就需要考虑条件组合,分析条件组合对结果的影响度。该步骤的目的是对达不到必要条件阈值的条件变量进行组合,分析这些组合对结果变量的充分性,主要是通过覆盖率这个系数反映出来。因此,条件组合分析可以看成是在单个条件变量不构成必要条件的情况下,测量条件变量的不同组合方式对结果的影响程度。

计算覆盖率主要按两个步骤进行。

第一步,计算模糊真值,构建模糊真值表。模糊真值表是进行模糊集分析的关键一步,它将原来的模糊值转换为清晰值,从而方便利用清晰值分析的精简原则进行下一步的运算。计算模糊真值的核心在于判断在每个案例中某个条件变量对结果变量充分条件的吻合系数。

第二步,根据模糊真值表进行条件组合的覆盖率计算。例如,为了分析大国对外军事干涉的充分条件,

两组变量间相关关系建模(方法新论蒋建忠)(8)

表8 模糊真值表

有了模糊真值表后,可以分析条件变量组合对结果的影响。观察“同盟关系·政体相似度高”这一组合,可以看到10个案例中有5个案例支持当“同盟关系”和“政体相似度高”这两者同时发生时,大国对外军事干涉(结果变量)就发生。因此,该条件变量组合的覆盖率为5/10=50%。在该案例分析中有3个条件变量,条件变量最终的组合有7组(2n-1),逐一分析即可得其覆盖率。

四、结论与讨论

上文呈现了fsQCA方法的基本设想和操作步骤,在接下来的讨论中将以一个假想的因果探究为例,来说明fsQCA的具体运用。

为了探究在不对称战争中弱国为什么会取胜,

(一)条件变量和结果变量隶属数值的计算

1.界定条件变量和结果变量的内涵

变量隶属数值计算的第一步是对变量进行概念化操作。一般来讲,变量的概念化要使用学术共同体中普遍接受的内涵,在这一步骤中涉及对核心利益、民主政体、不对称战略、战争胜败的内涵进行界定。

2.条件变量和结果变量的操作化及其赋值

变量定义后,需要对收集的所有案例中的条件变量和结果变量进行操作化工作。下面以结果变量“战争胜败”为例进行说明。战争中弱国取胜一般而言可以分成两类:第一类是弱国在战争中取得了完全的胜利。比如,在军事上彻底打败了强国,政治上获得了世界的认同、领土收复等。第二类是弱国在部分领域取得了胜利。比如,尽管军事上受损很大,但把强国阻挡在了国门之外,等等。操作的基本目的就是对弱国在战争中的取胜程度进行赋值。具体如表9第二列所示,按获胜程度的顺序进行排列。

两组变量间相关关系建模(方法新论蒋建忠)(9)

表9 战争胜败的赋值与校准

3.条件变量和结果变量的校准(隶属数值计算)

在赋值完毕后,需要计算条件变量和结果变量的隶属数值,也就是用0~1的数字来进一步标准化变量的原始值。在进行校准(即标准化)之前,需要确定校准所用的定性锚值,

需要说明的是,由于研究主题及变量的差异,隶属数值的计算往往是不同的,上例只是演示了一种具有代表性的计算方法。对于隶属数值的计算,现在已有好几种不同的方法,具体可参见史密生等人提出的形式化解释、概率化解释、决策理论观点和公理测量理论等四种方法。

按照上述路径,研究者对所有条件变量和结果变量进行操作化和校准。当完成所有变量的操作和校准后,可以用手工或使用fsQCA软件中的模糊集处理程序来分析上述数据,主要包括必要条件分析和充分条件组合分析。

(二)必要条件分析

假定研究者收集了36个弱国战争的案例,

两组变量间相关关系建模(方法新论蒋建忠)(10)

表10 条件变量的必要条件检测

在所有条件变量中,满足必要条件的是战争时限较长,吻合度为1,即在弱国取胜的案例中,都包含着战争时限较长这一条件变量。弱国采用了不对称战略这一条件变量的吻合度达到了0.71,比较接近0.9的必要条件标准线。这说明,在弱国取胜的案例中,基本上也都包含了“弱国采用了不对称战略”这个条件变量,这一条件变量可以覆盖71%的案例。

从上述的吻合度测试看,除了战争时限较长这个因素外,其他4个条件在分析中均达不到必要条件的标准,因而需要分析它们的组合对战争胜负的影响。

(三)条件组合分析

在上述检测中,研究者发现战争时限长是弱国取胜的必要条件,这意味着弱国在不对称战争中要获胜的话,这个因素必须存在。根据布尔法的简化规则,这个变量就不必再纳入条件组合分析。下面利用36个案例分析条件变量组合对弱国胜负的影响。

首先是推断模糊真值表。假设第一个案例中4个条件变量———冲突关乎弱国核心利益、强国是民主政体、弱国得到重大外援、弱国采用不对称战略———隶属数值分别是0.35、0.50、0.60、0.45,结果变量的隶属数值是0.4,那么根据充分条件吻合系数的计算方法,可以得到相应的吻合系数分别为1、0.80、0.66、0.89,有3个条件满足了0.75的阈值要求,在条件变量的编码中标注为1。由该案例得到的模糊真值如表11第一行所示。对36个案例进行计算后,可以得到相应的模糊真值表(见表11 )。

两组变量间相关关系建模(方法新论蒋建忠)(11)

表11 模糊真值表

有了模糊真值表后,可以进行条件组合覆盖率的测算,下面以“冲突关乎弱国核心利益”且“弱国采用不对称战略”这一条件组合为例进行阐述。根据覆盖率的定义,笔者发现在36个弱国的不对称战争中,同时满足上述两个条件且弱国取胜的有13个案例,覆盖率为13/36=0.36,这意味着这两个条件的组合在36%的程度上解释了弱国取胜的原因。按照这一思想,分别计算其他所有条件组合的情况。需要说明的是,因为有4个条件变量需要进行两两组合,一共有24 =16种可能,那么在计算的时候不可能对所有的可能性都进行计算,对于那些覆盖率十分小的条件组合可以忽略不计,最终得出的条件组合分析结果如表12所示。

两组变量间相关关系建模(方法新论蒋建忠)(12)

表12 条件组合分析结果

分析16种可能的条件组合,由于13组的条件组合覆盖率十分小,可忽略不计,剩余条件组合共有3组。因此,在弱国与强国进行的不对称战争中,弱国取得胜利的途径主要有3种:(1)冲突关乎弱国的核心利益且弱国采用了不对称的战略;(2)强国是民主政体且弱国采用不对称战略;(3)冲突关乎弱国的核心利益且弱国得到了重大外援。这意味着一个弱国在战争中取胜的主要原因在于这三种条件的组合,一旦这些条件得到满足,弱国即使在实力悬殊的战争中也会取得胜利。通过上述方式,挖掘了弱国取胜的原因组合。

(四)最终结果分析

将表10的必要条件分析和表12中的条件组合分析结果结合起来,弱国在非对称战争中取胜的原因可以简化为如下的逻辑等式:

弱国取胜=(战争期限较长)·(冲突关乎弱国核心利益)·(弱国采用不对称战略) (战争期限较长)·(强国是民主政体)·(弱国采用不对称战略) (战争期限较长)·(冲突关乎弱国核心利益)·(弱国得到重大外援)

在上述的等式中,“ ”代表“或者”,“·”代表“并且”。

这一逻辑等式说明这3项条件变量的组合是弱国在非对称战争中取胜的充分必要条件,即这3项中的任何一项成立,都会导致弱国的胜利。例如,如果弱国与强国进行战争的期限较长、冲突关乎弱国的核心利益、弱国得到了重大的外援,那么弱国在战争中就能取得胜利。

可以对fsQCA作一个小结:按照传统的定性分析方法,当我们分析弱国在战争中为何能取得胜利时,往往采用列举法,比如战争关系到弱国的核心利益、强国是民主国家、弱国采取了不对称的战争战略等等。如果我们继续追问,到底是什么原因导致弱国的胜利,传统分析法就无法给出精确的答复。fsQCA为追寻现象背后的确切原因提供了一个较好的途径,它可以精确地发现现象背后深层次的原因。因果关系是预测的前提,如果能准确地找出因果关系,那么预测的准度应该会得到较大的提升;同时,该因果关系也为弱国取得战争胜利提供了启示。

五、fsQCA的缺陷与突破

由上面的分析可以看出,在寻找因果关系的过程中,基于密尔逻辑的比较案例分析往往只能找到结果发生的单一条件,得出的结论不具备普遍性,这也是理论难以解释现象和作出正确预测的重要原因。基于逻辑真值表的布尔法充分考虑了多个条件变量及组合对结果的影响,它能更进一步地认清结果发生的原因。但是,鉴于国际社会现象的复杂性,条件变量的组合不一定会确定地导致结果的发生,有时条件或条件组合只是在一定概率意义上导致了现象的发生。fsQCA就是基于上述思想产生的,与布尔代数法相比,它能比较充分、精确地挖掘导致结果的原因及原因组合。

fsQCA为我们提供了一个追寻现象背后原因的路线图,但是,fsQCA也存在着一些亟待解决的问题和矛盾,是当前学界努力完善的方向。

一是关于隶属数值的计算问题。隶属数值是通过对变量进行主观赋值和标准化后得到的介于0和1之间的数值。国际关系研究中的变量有别于自然科学中的变量,难以精确地用具体数值进行衡量,在赋值时存在着主观性的缺陷。随之产生的另一个问题是,由原始赋值转换为隶属数值也缺乏特定的标准。不同赋值和相异的隶属数值转换标准可推导出不同的隶属数值,从而产生结果不确定的风险。作为fsQCA最基础的隶属数值的计算具有争议性且缺乏单一精确的通用方法。在模糊集合理论的发展和应用史上,学者们曾经尝试过各种方法,试图建立起一套将原始赋值转换为隶属数值的标准。史密生等人提出“形式化解释”“概率化解释”“决策理论”和“公理方法”四种方法,每一类方法都适用于某些特定的研究目的,

二是fsQCA难以处理涉及时间顺序的案例。如果导致某一现象发生的原因可以归结为ABCD,在fsQCA分析中,ABCD这四个条件发生的先后顺序对结果不会产生影响。但是,在现实中,不同的发生顺序可能会对结果造成本质性的影响。举例说来,考察联盟如何在国际冲突中取胜的原因时,

三是fsQCA忽视了因果机制问题。通过fsQCA获得的只是现象与条件之间的因果关系。因果关系解释变量值的变化所造成的系统观测要素的变化,由此产生的理论只在于预测,而不在于提供令人信服的解释。

四是条件组合逻辑剩余问题。从理论上讲,如果有k个条件变量,则需要有2k个案例才能覆盖所有的条件变量和组合。因此,在实际的研究过程中,随着条件变量的增加,往往难以收集到足够多的案例,有些包含条件变量及其组合的案例甚至在现实中都不可能出现。利用fsQCA进行因果分析时就产生了一个逻辑剩余的问题,即条件组合的数量大于可获得的案例数量。约翰·迈考夫(John Markoff)指出,用那些在现实中根本无法观察到的案例去进行条件组合的推理,存在着巨大的理论风险。

① Chales C. Ragin,

② 陈嘉映:《哲学·科学·常识》,北京:东方出版社,2007年,第69页。

③ A L. George, and A. Bennett,

④ 为探究因果关系,基于密尔逻辑的求同法、求异法、求同求异法、共变法的变量控制法已获得了长足的发展,布尔代数、模糊集合理论业已被引入进来,形成了布尔代数比较方法、QCA等方法。具体可参见:C. Ragin, and D. Zaret,“Theory and Method in Comparative Research: Two Strategies,”

⑤ C. Ragin,

⑥ 约翰·赫谢尔(John Herschel)在《自然哲学研究的初级教程》(

① 需要说明的是,密尔最初提出了5种方法,即求同、求异、求同求异、共变、剩余法。但是剩余法只考虑一个案例,所以就无法进行案例比较,不在此列。当然,密尔四法不仅是建立变量关系的法则,也是不可或缺的认知与描述工具,更是解释性的,是一项控制变异的方法,最终是一项归纳推理的方法。N. Smelser,

② S.利普舒尔茨、M.利普森:《离散数学》,周兴和、孙志人、张兴斌译,北京:科学出版社,2002年,第374页。

③ 何俊志:《比较政治分析中的模糊集方法》,《社会科学》2013年第5期,第31页。丹尼尔·卡拉曼尼:《基于布尔代数的比较法导论》,蒋勤译,上海:格致出版社、上海人民出版社,2012年,第68—69页。

④ 所谓“历史遗产”主要是指地理、文化与宗教、经济、社会条件与现代化程度、政治制度等。具体内容可参见Grigore Pop-Eleches,“Historical Legacies and Post-Communist Regime Change,”

⑤ Marcus J. Kurtz and Andrew Barnes, “The Political Foundations of Post-Communist Regimes: Marketization, Agrarian Legacies, or International Influences,”

① 需要注意的是,尽管模糊集合理论被冠以“模糊”两字,但它却是一个精确的数学工具,有助于处理社会科学中的许多概念。

① 彭玉生:《社会科学中的因果分析》,《社会学研究》2011年第3期,第1页。

② Edgar Kiser & Michael Hechter,“The Role of General Theory in Comparative-Historical Sociology,”

③ John Stuart Mill,

④ N. Smelser,

⑤ Skocpol. T. & Margaret Somers, “The Use of Comparative History in Macrosocial Inquiry,”

⑥ 该例子参见阎学通、孙学峰《国际关系研究实用方法》,北京:人民出版社,2007年,第115页。

① 阎学通、孙学峰:《国际关系研究实用方法》,北京:人民出版社,2007年,第106—117页。

② Ronald A Fisher.,

① 李辉、熊易寒、唐世平:《中国的比较政治学研究:缺憾和可能的突破》,《经济社会体制比较》2013年第1期,第147—149页。

② David, Hume, A

③ 对于因果关系的第三个要素,休谟用了两个术语,一个是必然联系,一个是恒定联系。必然联系强调的是两者之间的因果关系,有因必有果。恒定联系与现代统计学中与统计相关的含义比较接近,两者间尽管没有因果联系,但却存在着相关关系。

① K. Barbieri, “Risky Business: The Impact of Trade Linkage on Interstate Conflict, 1870—1985,” in G. Schneider and P. A. Weitsman eds. ,

② 祁湘艳、向洪金:《贸易与国际冲突的因果检验》,《国际政治科学》2009年第2期,第1页。

③ K. Bollen, B. Entwisle, and A. Alderson, “Macrocomparative Research Methods,”

④ C. Ragin,

① 丹尼尔·卡拉曼尼:《基于布尔代数的比较法导论》,蒋勤译,上海:格致出版社, 2012年,第97页。

② 布尔代数本质上是逻辑关系,它是基于3个基本陈述符号或联接词。“且”用符号“·”或“Λ”来表示,它的本质含义是,只有当两者同时发生时,结果才发生。举例来说:A、B都不是革命爆发的条件,而一旦这两者同时存在时,革命就爆发了。或用符号“+”或“∨”来表示。它的本质含义是,当两个或多个中只要有一个发生时,结果就发生了。例如,结果是灯炮熄灭,那么只需要“开关没开”或“灯炮坏了”这两个条件中的任何一个条件满足,结果就会发生。

① M. Jr. Zelditch,“Intelligible Comparisons,” in I. Vallier, eds.,

① Aaron Mathias Katz, HauVom and James Mahoney, “Explaining the Great Reversal in Spanish America: Fuzzy-set Analysis versus Regression Analysis,”

① Zadeh L.,“Fuzzy Sets,”

② B. Heskeht, R. G. Pryor, M. Gleitzman, and T. Hesketh, “Practicla Applications and Psychometric Evaluation of a Computerised Fuzzy Graphic Rating Scale,”in T. Zetenyi ed. ,

③ 所谓“交运算”,是两个集合中共有的元素的组合。例如,集合A= {a、b、c、d、e、f},集合B= {a、c、e、h},则A∩B={a、c、e}。两个集合中所有元素的组合,A∪B= {a、b、c、d、e、f、h}。补集是全集减去该集合后剩下的元素组合。如全集Ω= {a、b、c、d、e、f、g、h、i、j} ,则集合A的补集是{g、h、i、j}。

① 麦可·史密生、杰·弗桂能:《模糊集合理论在社会科学中的应用》,林宗弘译,上海:格致出版社、上海人民出版社,2012年,第17页。

② 同上书,第23页。

① 上述话语理解起来可能有些抽象,事实上,可以采用下面的方式来帮助理解。假定x是导致y的原因,如有一个案例中0.3x出现后,0.4y的结果发生了,我们可以推测较少程度的条件变量导致了较大程度的结果变量的出现,这说明只要x出现,y这个结果一定会出现。因此,x是y的充分条件。需要说明的是,这是判断充分、必要条件的基本原则。在实际应用中有两点需要注意:(1)通过吻合系数判断充分条件、必要条件是在某一个具体的案例中进行的,如果要对条件变量与结果变量的充分条件、必要条件进行判断,需要综合考察所有案例后获得的吻合度;(2)x值大于(小于)y值,并不一定说明x就不是y的充分(必要)条件,在实际应用中可以有适度的调整。具体参见下文充分条件、必要条件吻合系数的计算方法及吻合度的含义。

① 麦可·史密生、杰·弗桂能:《模糊集合理论在社会科学中的应用》,林宗弘译,上海:格致出版社、上海人民出版社,2012年,第30页。

② R. Adcock and D. Collier,“Measurement Validity: A Shared Standard for Qualitative and Quantitative Research,”

③ 阎学通、孙学峰:《国际关系实用研究方法》,北京:人民出版社,2007年,第86页。

① Charles C. Ragin,

② 麦可·史密生、杰·弗桂能:《模糊集合理论在社会科学中的应用》,林宗弘译,上海:格致出版社、上海人民出版社,2012年,第32页。

① 何俊志:《比较政治分析中的模糊集方法》,《社会科学》2013年第5期。

② 对于吻合系数这一概念有不同的翻译方式,有些文献中把它译为一致性参见Charles C. Ragin,“Set Relations and Social Research: Evaluating Their Consistency and Coverage,”

③ 需要注意的是,吻合系数和吻合度是两个不同的概念。吻合系数是指在单个个案中条件变量与结果变量之间的关系,如果在具体个案中吻合系数大于0.75,可以认定在此案例中条件变量是结果变量的必要条件。而吻合度是从总体上判断条件变量与结果变量是否存在必要关系,如果绝大部分案例(比例超过0.9)中的吻合系数都在0.75以上,可以最终认为条件变量与结果变量之间存在必要关系。

① Charles C. Ragin,

② Charles C. Ragin,

① 该软件可以从拉金的个人网页免费下载,地址为http://www.u.arizona.edu/ ~ cragin。

② 何俊志:《比较政治分析中的模糊集方法》,《社会科学》2013年第5期,第34页。

③ 为什么可以排除在外,原理在于布尔法中的简化数据原则。具体可参见丹尼尔·卡拉曼尼《基于布尔代数的比较法导论》,第104—108页。

① 由此可见,每个具体解释的条件组合都会产生一定的覆盖率,条件之间的组合方式越多,则每个具体组合解释的案例所占的比例就越低。参见Charles C. Ragin,

② 注意:此处的吻合系数与第2部分必要条件吻合系数的内涵是不同的。上部分的吻合系数是指条件变量对结果变量必要条件的吻合系数,此处是指条件变量对结果变量充分条件的吻合系数。

③ 该案例的具体分析可以参见迟永《美国介入领土争端的行为———基于模糊集定性比较分析的解释》,《世界经济与政治》2014年第10期。

① 该实例的解析受到杨少华研究成果的启示,参见杨少华《弱者何以能胜》,《国际政治科学》2008年第3期。

① 定性锚值是变量的赋值标准,一般用1、0.5、0这三个数值来表示变量的两极和中间程度,当然,有些学者主张用1、0.75、0.5、0.25、0五个值来锚定。

① 表中对战争胜败的划分和赋值只是为了说明隶属数值的计算方法,实际上战争胜败程度的划分需要相当的专业知识。因此,从这个例子也可以看出来,运用fsQCA同样需要传统理论与技术的支撑。

② 这些战争的数据可以从斯莫尔和辛格的“战争相关数据库”中获得。本文主要参考了杨少华的《弱国何以取胜》一文。

① M. Smithson,

② 约翰·福克斯:《社会科学中的数理基础及应用》,上海:格致出版社、上海人民出版社,2011年,第306页。

③ Charles C. Ragin,

① 该例子的说明可参见岳鹏《联盟如何在国际冲突中取胜? ———基于47个案例的多值集QCA与回归分析双重检验》,《世界经济与政治论坛》2015年第3期,31—45页。

② Benoit Rihoux and Charles C. Ragin,

③ Neal Caren and Aaron Panofsky,“TQCA: A Technique for Adding Temporality to Qualitative Comparative Analysis,”

① Neal Caren and Aaron Panofsky,“TQCA: A Technique for Adding Temporality to Qualitative Comparative Analysis,”

② G. King, R. O. Keohane, and S. Verba,

③ 刘骥、张玲、陈子恪:《社会科学为什么要找因果机制———一种打开黑箱、强调能动的方法论尝试》,《公共行政评论》2011年第4期,第50页。

① John Markoff, “A Comparative Method: Reflections on Charles Ragin’s Innovations in Comparative Analysis,”

② Benoit Rihoux and Charles C. Ragin,

③ Carsten Q. Schneider and Claudius Wagemann, “Reducing Complexity in Qualitative Comparative Analysis: Remote and Proximate Factors and the Consolidation of Democracy,”

编辑|致远星

审核|林陌生

终审|李致宪

©Political理论志

两组变量间相关关系建模(方法新论蒋建忠)(13)

两组变量间相关关系建模(方法新论蒋建忠)(14)

前沿追踪/理论方法/专家评论

ID: ThePoliticalReview

“在看”给我一朵小黄花

两组变量间相关关系建模(方法新论蒋建忠)(15)

,