现代化推动了社会科学的产生和发展。要科学地开展中国式现代化的系统研究,加快建构中国自主的现代化知识体系,离不开社会科学研究范式的革命。计算社会科学自2009年被正式提出以来,在理论积累、方法迭代、议题拓展和知识生产上都有了长足的进步。纷繁复杂的数据科学和计算科学分析技术在社会科学领域被广泛使用,而我们对社会科学长期积累的理论框架和实证发现却缺乏足够的重视。这可能会制约计算社会科学的未来发展,令“技术酷炫,理论贫乏”的“精致的平庸”型成果成为该领域研究的主流。

计算智能如何学 计算社会科学须超越(1)

  计算社会科学是社会科学的组成

  按照乔菲-雷维利亚的界定,计算社会科学首先是一门实证科学,其次是社会科学,最后才是计算科学;虽然计算在该学科中占据越来越大的比重,但其社会科学的本色是毋庸置疑的。计算社会科学几乎涵盖了社会学、人类学、社会心理学、政治科学和经济学等主要社会科学门类,并以“计算 单学科”“计算 多学科”和“计算 其他学科”的形式存在。作为范式革命的先锋,计算社会科学试图打破在漫长演化过程中条块分割的学科版图,囊括的研究主题包罗万象,为传统的知识生产体系的发展带来了新的机遇。然而,我们也必须看到近年来计算社会科学所面临的一些新挑战。

  第一,科学化对知识创新的贡献并没有想象的那么大。社会学家阿伯特就对当前的社会科学提出了尖锐的批评,认为学术生产的大量增长只是表面上的,更多的著作和论文并不意味着产生新观念的速度比过去更快。科学化使得许多学科朝着社会工程学(social engineering)的狭隘形式转向,出现了一大批“精致的平庸”型社会科学作品,未能带来令人激动的知识发现。算力和算法的加持,使计算社会科学在科学主义之路上走得更远,同时被诟病的可能性陡增。

  第二,跨学科资源整合门槛的抬升可能加速学术空间的结晶化。学科交叉要求计算社会科学家的知识结构从单一学科向多学科转变,然而事实上这种结构优化比想象的困难。传统实证科学所依赖的调查研究、实地研究、实验研究和文献研究都是以人为中心,而计算社会科学中“机器”的作用在不断强化。研究者自主收集和分析资料越来越依赖于多学科协同,使得社会资本、文化资本、权力资本和声望资本对社会科学研究的形塑力更强。由此,学术空间的“马太效应”愈演愈烈,结晶化加剧。

  第三,平台机构已然成为数据生产的“无形之手”。魏格纳等构建了计算社会科学所面对的大系统,它由平台和算法为基础的社会、政治和经济系统所构成。记录谁、记录什么和怎么记录,很大程度上由各种平台所主宰。计算社会科学的诸多发现都不得不依赖平台所“生产”和“加工”的数据,而受制于资本、算法和伦理的叠加作用,如何打开这个数据生产的黑箱极具挑战性。如果说研究者在传统的实证社会科学中有着较强的主体性,那么这种主体性在计算社会科学中出现了一定的弱化。

  社会思维助力计算社会科学

  社会思维是指关于人类社会和社会互动的系统性理解方式,主要根植于社会学学科。社会思维试图调和个体“过度社会化”和“社会化不足”的分野,弥合“只见树木不见森林”和“只见森林不见树木”的裂痕,强调“结构—机制”和“过程—事件”的融合,以打破人文与科学的分歧。基于社会思维,以社会学为代表的基础学科积累了大量的理论观点和实证发现,能够为计算社会科学输出关键“语法”。

  大数据在社会科学领域的应用越来越普遍,但缺乏与既有社会科学数据融合的框架。最近,基什和库鲁按照个体行为—社会互动、数字化—非数字化两个维度构建了四个象限。左上方是个体的数字行为,左下方是数字化的互动数据,右边就是传统数据。吕贝里和西林加对于如何整合多类型数据提出“三角框架”。从上往下依次是:传统的调查设计、测量和统计推断,借助于大数定律等统计原理;模型辅助型调查设计,在设计调查的过程中以既有的解释模型为前提,强调其背后的理论关怀;调查辅助的模型化,利用调查为大数据分析提供模型设定形式、参数设定等关键依据;模型化和数据挖掘。以上框架为我们更好地处理传统数据与痕迹数据的关系指明了可能的方向。

  计算社会科学从社会科学理论展开数据质量管控的讨论极为缺乏。大数据生产环节(提取—转换—载入)的循环往复次数多,各环节都有可能出现偏误(bias),最终带入统计分析则影响研究结果的解释力和预测力。为此,如何评估痕迹数据生产过程就成为我们必须直面的难题。社会调查专家格罗夫斯等曾提出基于总体偏误的数据质量控制框架,认为调查偏误主要来自测量和代表性两个方面。阿马娅等人受此启发,最近提出了适用于痕迹数据的TED框架(Total Errors Framework for Digital Traces of Humans)。此框架将痕迹数据偏误来源分解为理论建构、平台选择、平台可供性偏好、平台驱动行为、平台覆盖率偏差、数据收集、数据预处理、用户预处理和分析推断等环节。其中,理论建构突破了科学的边界,实现高质量的理论建构尤其需要社会思维。TED框架对于减少平台的“无形之手”对研究发现的潜在影响将有实质性的启发。

  计算社会科学对预测性的重视程度要远强于解释性的坚持。针对学术共同体内部的纷争,戈夫曼和瓦茨等人提出计算社会科学的新范式是可解释性和预测性的整合,强调探索性与验证性综合研究的重要意义。然而,由于学术空间的生态位效应,数据科学家和计算科学家的话语权要明显强于社会科学家,社会思维成为多数科学家的“天然禀赋”,并将其作为预测的先验知识。然而,社会思维并不等同于日常生活习得的常识,它的养成离不开长期的专业训练和积累。社会思维有助于打破社会科学中归纳和演绎难以统一的壁垒。要避免计算社会科学的“精致而平庸”化,用好传统社会科学所积累的理论尤为重要。

  基础学科何以发挥重要作用

  计算社会科学是信息技术发展到特定阶段的产物,也是一门理论关怀和现实关怀兼而有之的社会科学。相对传统社会科学,计算社会科学的方法门槛更高、挑战更大,对基础学科的理论需求在增强,对计算社会科学家的社会思维要求也更高。像社会学、人类学、政治学等基础学科,至少可以从三个维度在推进计算社会科学中发挥作用。

  第一,提供基础性命题的方向。正如瓦茨所认为的那样,社会科学在过去的100多年里产生了大量理论,但是评估其不一致和约束条件的任务却异常艰巨。计算社会科学不仅要解决现实问题,更要牢牢抓住基础性命题,在整个人类发展的不确定性中去寻找和挖掘一些确定性的知识。这些关键命题必须从基础学科中来。

  第二,避免突破科学的限度。化约主义作为科学解释的主要范式,在社会科学研究中却受到长期批评。虽然复杂科学为我们提供了另一种可能,但是复杂性在“以数为媒”的数字社会面临的挑战越来越多。社会学和政治学等对资本利用技术“侵入”社会生活有过诸多深入的研究,可能为包括博弈结构及其演化、分化过程和不确定性增强等挑战提供理论启示,以保证计算社会科学的可解释性和可预测性。

  第三,通过前端干预进行算法审计。在吕鹏等提出的内部治理、外部治理、共同治理所构成的“数字平台治理场域”框架中,离不开计算社会科学的参与。但是,基础学科也是通过源头参与、内容治理、赋能社群等途径促成算法审计的关键力量。基础学科对数据生产过程中各行动主体的理解,可能为计算社会科学解决重大现实问题提供理论起点。

  (本文系浙江大学学科交叉预研专项项目“大数据视野下文学传播的计算社会科学研究”阶段性成果)

  (作者单位:浙江大学公共管理学院)

 来源:中国社会科学网-中国社会科学报 作者:范晓光

,