导读
Foreword
资助者、非营利组织高级管理者和政策制定者都非常热衷于衡量社会价值,不过他们大多无法就社会价值“是什么”达成一致,更不用说进一步的评估。本文发布于2010年,作者根据自己在公共服务领域的多年经验,对社会价值评估中存在的问题及背后的原因进行了分析,并提供了一个有效社会价值评估工具的案例,最后就资助者在社会价值评估领域应发挥的作用提出了建议。
插画:卢克·贝斯特(Luke Best)
在过去的几十年里,许多人试图衡量有时被称为社会、公共或公民价值的东西,即非政府组织、社会企业、社会创投和社会项目创造的价值。对这些指标的需求来自各个领域。基金会希望将资金用于最有效的项目;政府官员、政策制定者和政府预算办公室必须清晰说明他们的支出决定;投资者希望得到类似于利润的硬核衡量指标与数据;非营利组织需要向资助者、合作伙伴和受益人展示他们的影响力。在过去40年里,满足以上需求的指标激增,产生了数百种相互竞争的计算社会价值的方法。
尽管对衡量指标充满热情,但很少有人真正使用它们来指导决策。在非营利部门,优秀的管理者严格地跟踪成本和收入,但几乎没有人使用复杂的指标指导资源配置。与此同时,在公共部门,政治判断比成本效益评估更重要。在极少数情况下,决策者会使用社会价值指标,不过对于是否应该这样做,其实也是不清楚的。
我在不同的岗位上处理过有关社会价值指标的工作。作为英国首相托尼·布莱尔(Tony Blair)的政策和战略负责人;作为青年基金会(Young Foundation)的负责人,这个非营利组织已经创立了几十家组织,包括营利性企业、社会企业和非营利组织;同时也是许多其他政府部门的顾问。在这些工作中,我不仅看到了为什么社会价值指标被忽视,也看到了如何让它们变得更有用。
最近,英国国家医疗服务体系(NHS)与青年基金会之间开展的一项合作可以为我们提供一些参考。NHS委托青年基金会开发一款用于评估服务创新和指导投资决策的实用工具。NHS是一个庞大的组织,年度预算约1500亿美元,拥有员工约120万,与3万多家社会企业签约。它需要一套既可靠又灵活的工具,既能用于决策也能用于评估。
我们首先从扫描现有的社会价值指标开始。我们发现了数百种相互竞争的工具,通常基金会和非政府组织使用一套指标,政府使用一套,学者使用一套。除了发现这种割裂之外,我们的调查还发现了“能够真正指导决策的指标如此之少”的另外两个原因。首先,大多数指标都假定价值是客观的,可以通过分析发现。然而,正如大多数现代经济学家所认同的那样,价值并不是客观事实。价值产生于供需的相互作用,并最终反映人们或组织愿意支付的价格。因为极少有指标反映这一点,它们便不可避免地远离了组织的战略和运营重点。
现有的社会价值指标未能影响决策者的第二个原因是,它们把三个截然不同的目标混为一谈,即面向外部利益相关者进行解释说明、管理内部运营和评估社会影响力。在商业领域,决策者针对每一个目标使用不同的工具。例如,飞机制造商会使用一套法律法规规定的指标,向外部利益相关者解释企业是如何花钱的。然后,该企业将使用第二套指标来分配制造飞机的资源。(一位勇敢的管理者才会让投资者看到这些内部账目。)然后,该企业将使用完全不同的指标来解释其商业活动如何影响更为宏观的经济指标,如国内生产总值。
然而,在社会和公共部门,一些新的社会价值衡量标准的支持者声称,他们的标准可以满足以上所有三个目标。毫不意外,尽管进行了勇敢的努力,这些同时做三件事的尝试其实无法做好其中任何一件事。
在本文中,我描述了一种更有效思考社会价值的方式,即社会价值是社会价值市场演变中供需动态互动的产物。然后,我将展示非营利和公共部门的决策者如何基于此方法来衡量那些可以衡量的,不假装去衡量那些不能被衡量的。最后,我会推荐产出社会价值指标的更好方式。我的主要建议是,非营利组织和基金会应当抵制当前趋势,即完全独立于公共政策和社会科学理论研究开发评估工具,同时开展跨部门合作。
▍难以捉摸的“乱石滩”
社会和公共部门未能成功衡量自己创造的价值,并不是因为缺乏智慧或良好的意愿。相反,这反映了长期困扰社会价值衡量的不可避免的四个复杂之处。首先,社会领域缺乏严格高效的法律法规。许多人希望社会领域更像自然科学,这样他们就可以进行清晰地预测,比如,快速了解一项1千万美元的犯罪预防项目的投资效果。
与严格遵循物理规则的分子不同的是,人类有自己的思想,并受到许多社会、心理和环境因素的影响。几十年参与基于证据的政策制定工作的经历告诉我,尽管证据应该为所有行动提供依据,但极少有领域能够精确预测什么原因会导致什么结果。社会科学(包括商业)中根本不存在类似物理定律那样的东西。即使是看似坚实的经济学原则,如价格上涨则需求下降,也有许多例外。
难以衡量社会价值的第二个原因是,在许多最重要的社会行动领域,如犯罪预防、儿童照护和学校教育,人们对干预结果的期待无法达成一致。换句话说,让公众有争议的不仅是社会价值,还有社会价值观。例如,许多人希望通过监禁惩罚罪犯,即便监禁的成本比其替代方案更高、带来的好处更少。心理学家称这种愿意牺牲很多以惩罚他人的行为为利他惩罚。
由于人们对伦理、道德和优先事项的认知各不相同,只考虑成本和收益的社会价值评估必然不会影响很多公众和代表他们的政治家。从约翰·杜威(John Dewey)到吕克·博尔坦斯基(Luc Boltanski),哲学家早就认识到, 社会由相互竞争和冲突的评价和论证系统组成。但衡量社会价值的人往往试图否认这一点。
即使没有这些问题,许多社会价值指标本身也是不可靠的。例如,社会投资回报率(social return on investment,SROI)的测量通常会相当武断地估算成本和回报,这会极大影响最终计算数值。SROI的计算有助于宽泛的预测,但无法支持更小颗粒度的决策。
显示性偏好(revealed preference)和阐述性偏好(stated preference)方法也是出了名的不可靠。虽然试图提供精确的数字,但它们得出这些数字的方法不是很严格。最终,这些方法混淆了严格和精确,罗伯特组织发展基金(Roberts Enterprise Development Fund,REDF;编者注,REDF为最早提出SROI的组织。)和SROI领域的其他人越来越认识到这一点。
为衡量社会价值造成困难的最后一个原因是时间问题。把当前衡量社会价值的成本,与一项行动在许多年后会带来多少好处进行比较,你会如何决定?在预测商业投资回报率(ROI)时,商人使用贴现率(discount rate)来解释给定金额的钱在未来的价值将低于其当前价值的假设。例如,在5%的贴现率下,30年后的100美元在今天只值35.85美元,50年后的100美元在今天只值7.69美元。目前许多社会价值的衡量标准,如SROI,同样使用贴现率,也许是因为一种错误认知,认为把社会贴现率等同于商业贴现率会使社会价值衡量标准看起来更严格。
但目前还不清楚为什么社会组织和政府应该使用贴现率,尤其是在这些比率会使未来极端贬值的情况下。事实上,我们应该希望这些组织中的人比商业市场更重视后代的利益。对贴现率的进一步分析表明,情况确实如此。在健康领域,许多国家采用极低或零贴现率,理由是相比于年长一代,年轻一代不应处于不利地位。政府在投资教育和国防技术时会忽略贴现率。在气候变化政策上,一场关于如何使用贴现率的激烈辩论再次展开,部分原因是围绕“如何权衡后代与当代的需求”的道德争论。这些例子反映了我的观点:社会价值不是客观事实;相反,它产生于供给和需求的相互作用,因此会随着时间、人、地点和情况的变化而变化。
▍构建价值
借鉴商业和经济学的做法导致了社会价值评估中的许多错误。但是,这些领域仍然为社会创新领域提供了一些重要的经验。在人类历史的大部分时间里,哲学家和经济学家都相信价值是客观事实。例如,亚里士多德认为每样东西都有一个“公平的价格”;卡尔·马克思认为价值来自劳动。
但最近,大多数经济学家已经接受价值产生于市场需求和供给的相互作用,而这是其唯一有意义的概念。换句话说,只有当有人愿意付钱时,某物才有价值。这种直截了当的表述让许多人感到不适,因为它意味着美丽的日落、濒危的物种或一件美妙的艺术品可能没有任何经济价值。但这种对价值的定义是有用的,因为它迫使经济学家观察真实的行为,而不是试图揭露隐藏的现实。
社会领域选取同样简单出发点的时机已经成熟,把社会价值视为我所说的有效需求和有效供给的相互作用。有效需求意味着有人愿意为某种服务或结果付费。这个“某人”可能是公共机构、基金会或个人。有效供给意味着服务或结果是有效的、价格合理的和可执行的。我用“有效”作为修饰词,是因为社会问题总是会带来简单的供给和简单的需求。但要衡量社会价值,供给和需求必须在上述意义上有效。
市场、对话和谈判将一方面拥有需求和资源的人和组织与另一方面拥有解决方案和服务的人和组织联系起来。如果社会价值指标能够塑造这些市场、对话和谈判,那么它们就是有用的。
在一些领域,供需关系已经成熟。例如,许多选民愿意为警察和小学纳税,而许多政府有能力提供这些服务。同样,许多捐赠者愿意为发展中国家的儿童卫生保健项目提供资金,许多当地的慈善机构和教会也能够提供此类服务。在这些领域,分析社会价值并不困难,资助者想要的东西和服务提供者能给的东西之间的联系很清楚。
但在其他社会问题上,供需之间的联系是缺失的。在某些情况下,可能缺少有效的需求,因为资助者、政治家或个人认为需求不够迫切,不足以说服他们投入资源。例如,一些州政府不愿意支持性教育或戒毒。在其他情况下,有效的需求可能是存在的。例如,许多政府都愿意为降低肥胖率买单,不过成本效益高的干预措施十分有限。在这种情况下,任何对社会价值的描述都必然更具不确定性和探索性。
在其他情况下,供需公式两边可能都是模糊复杂的。例如,许多社会政策制定者都明白,更全面的解决方案往往会产生更好的结果。但采用更全面的方法意味着必须与众多“购买者”打交道,也就是分布在众多不同公共机构和非政府组织中的需求方,每个机构对“什么才是真正有价值的”各有不同的看法。供应方可能也是分散的。例如,帮助无家可归者可能取决于不同机构在治疗、戒酒支持、职业培训和住房方面的贡献。在这些领域中,社会价值只有通过持续迭代才能变得更加清晰,坚持把供给和需求引入审议和讨论;如果不沉浸在这些讨论中,即便是最杰出的研究人员也无法衡量或描述社会价值。
▍健康数据
在我们为英国国家医疗服务体系(NHS)所做的工作中,所有这些都变得非常清晰,从常规检查到手术,到行为改变干预(behavior-change intervention),再到社区项目。像NHS这样单一、综合的医疗服务平台的优势在于,它必须明确自己的需求——需要什么和愿意为什么买单。NHS的有效供给方也相对容易确定,包括医生、护士、管理者、社会企业、私营供应商和公众。
为了帮助NHS做出更好的决定并更有效地分配资源,我们在青年基金会创建了一个工具,明确各种备选方案的社会价值。前面我描述了价值评估可以帮助完成三个非常不同的目标——外部问责、内部决策和展示更广泛的社会影响力。我们开发的工具明确关注第二个目标,试图捕捉健康的个体(而非患者)、照顾者、更广泛的社区(如传染病控制)和纳税人所获得的价值。
这个工具不是一个简单的计算机程序或计算器,它是一个协助思考价值的框架。像许多用来评估社会价值的工具一样,这个工具需要一系列的判断。这些判断分为四个主要类别:1)战略契合度,提出的创新方案在多大程度上满足了医疗服务需求;2)潜在的健康结果,包括对质量调整寿命(quality-adjusted life years)和患者满意度的可能影响;3)成本节约和经济效益;4)与实施相关的风险。
当面对一项提案时,该工具的用户用0到5分对此提案各类别判断的每个项目进行打分。提案的范围从一群医生或护士提出的有前景的行动,到已经过小规模试点的想法或准备扩大规模的经营项目。用户还可以在评分的同时提供意见反馈。
在某些情况下,决策者可以利用强有力的数据,如来自随机对照试验的证据。在其他情况下,他们必须基于不那么确定的数字做出决定。考虑到这种易变性,该工具还包括对所使用的证据的可靠性的判断和测量。然后,结果的视觉呈现能够清晰展示判断及其可靠性的情况。
一旦掌握,NHS工具就能够快速起作用,而且易于使用。多个用户可以查询这些判断,并在需要的时候,将它们与实际发生的情况进行比较。它也是公开的。十个地区性创新基金(总资金量约3.5亿美元)正在使用它作为决策的基础,并鼓励申请人使用这个工具对自己进行评估。决策者还可以利用该工具了解彼此的工作,以确保决策的一致性,并与其他公共机构进行沟通。
NHS工具呈现的最终结果是一幅社会价值的“全景图”,它明确地说明了什么是有价值的,什么是没有价值的;并不试图把所有东西合并成一个数字;它是透明的,可以针对所有信息进行深入地挖掘和分析;简单易用,可以帮助决策者应对并处理大量案例。它还避免了试图将贴现率强加于不同维度的社会价值评估的缺陷。
▍构建市场
我之所以描述这个工具,是因为它是一种可操作的衡量社会价值的方法,能够平衡连贯性、一致性、简单性和应对混乱和复杂现象所需的灵活性。NHS是一个拥有明确供给和需求的组织,这为开发此工具提供了很大的帮助。但对大多数非政府组织来说,供需关系比较模糊,每个领域也有不同的关注点。
例如,小学、中学和高等教育机构为学生和更广泛的社会创造价值。他们依靠强大的研究基础来决定哪种类型的教育能给谁带来回报。相比之下,职业教育则呈现出不同的考量。某些技能可能只对一个部门或一小部分雇主有价值。一个为状况糟糕的吸毒者提供针对性支持的方案将具有一套更为复杂的价值体系,包括对个人的价值(经济保障和健康)、对社区的价值(如降低犯罪率)以及对广泛的公共机构的价值(更少地使用医院、警察、监狱和福利机构的应急服务)。
从这个角度来看,资助者的工作不应停留在某一种衡量价值的特定方法。虽然思考价值的通用框架是有用的,但资助者必须关注这些框架是否适用于被纳入考虑的组织和领域。
事实上,资助者可做出的最大贡献往往不是衡量价值,而是帮助供给方和需求方建立联系,从而在日后产生价值。例如,他们可以通过资助有前景的项目并收集有效的证据来支持有效供应;可以通过说服政府使用其资源支付新服务,把有效需求引入市场;可以利用自己的召集力量将购买方和供应方联系起来,然后鼓励他们交流。
基金会还可以帮助实力较弱的参与者在市场上拥有发言权。许多群体,如无家可归者、移民和精神疾病患者,都有明确的需要,但缺乏将其特殊需要转化为市场需求的资源和政治力量。基金会可以将这种潜在需求转化为有效需求。例如,一些支持无证移民的欧洲基金会通过鼓励较大规模的非政府组织和公共机构向这一新兴社会价值市场分配资源(如住房和医疗),这一举措发展了市场中的有效需求。在供给方面,这些基金会资助了有前景的项目,而这些项目能够更有效地满足这一群体的需求。
一些基金会也在发展并建设解决老人虐待问题的市场。在需求方面,他们资助了揭示该问题严重性的研究,并影响政府部门负责人向此问题投入关注并分配资源。在供应方面,他们支持创新项目,以预防或减少虐待发生。
在这两个例子里,政府的资源都远远超过基金会和非政府组织。大致总是如此的。基本上,所有想要产生重大社会影响的人都必须参与政治和公共服务。
▍良好的账目
社会创新领域可以从商业和经济学中吸取一些教训。但它不应该是天真的。正如安然和雷曼兄弟的轰然倒塌所揭示的那样,即便是利润这样看似客观的指标,也并非完全像经济学教科书中所描述的那样。在商业中,账目只是账目。它们是解释正在发生什么的一种方式,同时考虑投资者、管理者、监管者和消费者之间时常存在的利益冲突。它们既包括事实,也包括判断。
任何想要资助社会产品的人,以及任何想要提供这些产品的人,都应该使用指标来阐明投入如何有助于产生结果,以及阐明选择和利弊权衡。但他们应该放弃那些掩盖这些选择或假装提供其实并不存在的客观性的指标。他们应该以适当的方式使用指标。对于一个小型非政府组织来说,将稀缺资源投入对社会价值的精确评估中是不明智的,况且这些评估在严格的检查下必然会崩溃。
与此同时,对于确实需要社会价值评估的大型非政府组织来说,他们需要明确开展评估是为了达成什么目标——外部问责、内部管理还是展示更广泛的社会影响力。如果一个组织在这三个方面都使用相同的方法,那么几乎可以肯定,最终结果是有缺陷的。
参与资助社会价值的人们,无论是专注在有前景的创新阶段还是在大规模实践阶段,都需要更清晰的共享框架。更广泛地使用这些共享框架将比增加评估工具更有价值。以这些框架为基础,有质量地讨论和谈判,以及基于几年后参与者反馈什么有效、什么无效的学习,至关重要。
杰夫·马尔根(Geoff Mulgan)是青年基金会的总监;伦敦经济学院、伦敦大学学院和墨尔本大学的客座教授;也是卡内基英国和爱尔兰公民社会未来调查的主席。他此前是英国政府战略部门的负责人,也是首相托尼·布莱尔(Tony Blair)的政策负责人。他的最新著作《公共战略的艺术》,由牛津大学出版社出版(2009年)。
来源:《斯坦福社会创新评论》2010年夏季刊
原标题:Measuring Social Impact
,