马季 等:计算社会科学引入非营利组织研究:一种新的工具箱与知识库

2026-02-13

今天为大家推介的是《公益研究》2025年第6期,由马季 等撰写的期刊文章:《计算社会科学引入非营利组织研究:一种新的工具箱与知识库》。本文主要内容译自马季 等合著的Computational social science for nonprofit studies: Developing a toolbox and knowledge base for the field, VOLUNTAS: International Journal of Voluntary and Nonprofit Organizations, vol.34, no.1(2023), pp.52-63.

摘要:如何在非营利组织和慈善事业研究中,引入计算社会科学(Computational Social Science, CSS)方法?本文从研究设计视角作出解答,通过梳理一系列相关的计算社会科学方法,强调了其在非营利组织和慈善事业研究领域中的关键应用。我们将“计算社会科学”定义为一系列涵盖数据管理、概念表征、数据分析和可视化等环节的计算密集型实证方法,其蕴含“社会性”,可服务于各类定量、定性以及混合方法研究中,为理论化奠定坚实基础。我们使用计算社会科学构建了非营利研究领域内规模最大、最全面的学术参考数据库——非营利组织和慈善事业研究知识基础设施(Knowledge Infrastructure of Nonprofit and Philanthropic Studies, KINPS),从而展示了将CSS引入该领域的前景。此外,我们通过应用CSS来构建和分析KINPS,能够更好地理解与推动本领域的学术发展。最后,我们指出了应用CSS时需注意的问题,并为未来运用CSS方法和KINPS数据库的研究提出了建议。

关键词:计算社会科学   非营利   慈善   非营利组织和慈善事业研究知识基础设施    KINPS

文章来源:马季 等:《计算社会科学引入非营利组织研究:一种新的工具箱与知识库》,《公益研究》2025年第6期。

image.png

“计算社会科学”这一概念,自2009年被提出以来,在社会科学诸多领域的影响力便呈指数级快速增长,并被认为拥有彻底改变社会科学研究的潜力。过去十年间,非营利与慈善研究领域也开始应用各类计算方法,如机器学习和自动文本分析。由是,本文首先从研究设计视角切入,具体阐释计算社会科学,并论述其在非营利组织与志愿行动研究中的应用;而后,我们通过运用这些方法,来整合并创建一个覆盖该研究领域内全部既往文献的数据库,以此展现“计算社会科学”方法引入“非营利组织与慈善”领域的研究前景;最后,我们进行了批判性反思并提出建议。本文主要面向三类读者:(1)无技术经验者,可对计算社会科学建立起一种结构性认知,并通过学习合作将其引入自我研究中;(2)有技术经验者,可从研究设计视角重审此类方法,本文所引文献足以支撑起一门计算社会科学课程;(3)有志于推动本领域学术发展者,可发现全新研究方法与有用数据来源。此外,本文的首要目的,并非详尽阐述计算社会科学的所有方法和技术细节,毕竟这些内容在大多数教科书和所引参考文献中均有介绍。

一、计算社会科学引入非营利组织研究:一种方法工具箱

某种意义上而言,所有的实证分析方法都具备计算性,但为何有些被视作“计算社会科学”方法,而有些却没有呢?计算社会科学,仅是一个热门却暂时性的术语,还是一颗冉冉升起的方法论范式“新星”?

社会科学领域的实证研究通常涵盖两个关键环节:理论建构与实证分析(详见图1)。理论建构,着重于概念界定及阐释其内在关联;实证分析,则需要通过实证数据来呈现这些概念并探究其相互关系。二者之间具有双向性或循环性:研究既可由理论驱动(即演绎法),也可由数据驱动(即归纳法),或两者兼而有之。由是可见,定量研究与定性研究虽在研究范式和论述方式上存在差异,但其基本逻辑框架与图1所示模式高度契合。

虽然被广泛探讨,但由于缺乏系统性框架,“计算社会科学”被许多学者认为仅是“暂时性流行词”而非“方法论范式”。本文则将其定义为一系列涵盖数据管理、概念表征、数据分析和可视化等环节的计算密集型实证方法,可应用于各类定量、定性以及混合方法研究中。其具备“社会性”,以服务实证社会科学研究为目标,通过完成演绎或归纳循环为理论建构奠定坚实基础;其也具备“计算性”,采用了创新且计算密集的分析手段。对于“非营利与慈善”这一高度跨学科的研究领域而言,计算社会科学的优势在于促进传统学科间的跨界协作,且这一前景已然并正在其他研究领域中逐步实现。

计算社会科学方法,主要服务于实证研究的四个方面(如图1所示):数据管理、概念表征、数据分析和可视化。数据管理,旨在高效实现数据的呈现、存储与管理,这在处理“大数据”时尤为重要——这类数据往往具有异构性、复杂性和体量庞大的特点。概念表征,则致力于实现抽象概念的具体可操作化测量,例如通过自然语言处理中的情感分析技术来量化政治态度——此类计算方法与传统操作方式(如问卷调查中的态度题项或访谈中的问题)形成互补。数据分析,与统计学(如概率论和假设检验)有诸多共同的统计学基础,但通常须消耗更多计算资源。可视化,则从多个维度展示数据,并通过图谱实现人与数据的交互,使研究者能够在庞大的数据集中更深入地检视感兴趣的数据点。

image.png

(一)数据管理

科学正面临可重复性危机。使用计算社会科学方法的研究者在此问题上则需要更为谨慎,因为他们通常要处理大量数据、使用许多包含指定参数的分析方法,好在已有其他学科领域的学者为此总结出一套“最优指南”。

作为数据管理的起点,适当的数据结构有助于展示和记录现实世界的实体及其关系,这是所有实证研究的基础。为满足实证研究的数据管理需求,可使用包含多个相互关联数据表的关系型数据库。而构建这样的数据库需要完成两个重要步骤:一是将同质数据存储在同一个表中,并为此类数据设置一个唯一标识。Wickham提出的“规整数据”(tidy data)操作方法为标准化数据预处理提供了指导,并说明了如何识别不规整或杂乱的数据。规整的数据集对于分析和可视化纵向数据尤为重要。二是使用共享变量或共享列将不同的表关联起来,再使用图谱表示不同表之间的关系,这也被称为数据库模式或主体—关系模型。

由于计算社会科学方法绝大部分依赖于数据整理以及Python、R语言等编程软件,因此实现文档编制的自动化十分重要,可大大提高研究的可重复性与透明度。“最优指南”中指出,文档编制需要遵循一致的命名规范,并使用GitHub等版本控制系统来跟踪更改等。而之所以追求自动化,就是为了标准化研究工作的流程,保证高效与可复制性。

至于数据管理类知识,其在非营利与慈善研究领域早中已不算陌生,且数字时代下,其作用日益凸显,因为我们面临着愈加海量的异质性数据。例如,Ma等人(2017年)和Ma(2020年)构建了一个关系数据库,对来自六个不同来源、跨度12年、涵盖3000多家中国基金会的数据进行了规范化处理。来自不同来源的数据可以通过非营利组织的代码或独特的国家代码进行匹配。而如若不遵循数据管理的基本原则,许多与非营利组织有关的开放信息资料就无法被获取运用,例如美国非营利组织的纳税表格以及英国慈善机构的注册信息。除此之外,越来越多的社会科学领域学术期刊、出版商和资助机构也开始要求公开源代码和数据。然则,数据管理在现有的非营利与慈善研究与教育中尚未得到重视,我们必须在未来教学中加强对该话题的强调与训练。

(二)网络分析

尽管社会关系与人类网络的概念自始至终都是社会学的基础,但现代网络分析方法真正得以冒头是在二十世纪中叶以后,这与计算能力的迅速提升密切相关。网络是由节点(亦称“顶点”,即网络可视化中的点)和链接(亦称“边”)构成的图形。网络分析实际上是运用图论来研究一种特殊类型的数据——主体之间的关系。

研究人员通常在不同的分析层次上对网络进行分析,例如节点层次、自我中心网络层次和完整网络层次。在节点层次上,研究问题通常关注节点的属性以及这些属性如何受到关系的影响。在自我中心网络层次上,研究人员主要关注感兴趣的节点与其邻居节点之间的互动。在完整网络层次上,则会计算整个网络的属性,例如测量网络的连通性。这一层次的研究问题通常旨在理解网络结构与结果变量之间的关系。这三个层次通常反映了微观、中观和宏观层次的分析。研究人员可以采用单层次或多层次的设计,多层次分析使学者能够回答复杂的社会学问题,并构建整体性理论。

非营利领域的学者一直使用网络分析的一些指标使各种概念操作化。例如,节点或整个网络的连通性可以被视为衡量个人或社区社会资本的指标。网络分析还被用于研究组织间合作、资源分配、连锁董事网络以及公民社会的结构。甚至,有的学者在没有真实世界数据的情况下也可以对网络进行分析。例如,Shi等通过构建模拟不同情景的人工网络数据,测试了不同组织策略如何影响会员比例。

利用社交媒体数据分析非营利组织的在线活动是近年来发展起来的研究方向,其重要性也在不断提升。然而,由于隐私问题,社交媒体平台常常限制数据访问,这也促使了“产业—学术合作”新模式的出现。有的研究者们还开始涉猎数据捐赠项目这一领域,即社交媒体用户自愿提供其用户数据的访问权限。例如,Bail等向倡导型组织提供了一款应用,帮助其了解自身在Facebook上的相对影响力,作为回报,这些组织需要提供其Facebook页面的一些非公开数据。

(三)机器学习

机器学习能够“发现新概念,衡量这些概念的普遍性、评估因果效应并进行预测”。对于社会科学研究者而言,引入机器学习法的核心在于利用计算能力,从海量观测数据中学习或识别特征,并将这些特征与感兴趣的结果变量联系起来。例如,研究者可以展开“监督式机器学习”——对一小部分数据记录进行人工编码,并用该编码数据集训练机器学习算法。随后,经过训练的机器学习算法便能高效、自动地分类剩余的记录,这些记录可能多达数百万条。此外,机器学习算法还可以依据预设策略,从海量观测中提取共性特征,这一做法被称为“无监督式机器学习”。在此基础上,研究者可以评估这些识别出的特征与结果变量之间的相关性。在这两种情境下,社会科学家都能够处理超出人类能力范围的数据记录,从而将精力集中于探讨输入观测特征与感兴趣结果之间的关系。

尽管机器学习方法具有诸多优势,但它同时也面临着许多挑战。其中一个反复出现的问题是,在结果解释方面存在“黑箱效应”。经过训练的算法往往依赖复杂函数,但对结果为何合理却缺乏解释。随着编程语言的发展,机器学习方法正变得越来越容易为研究者所掌握。然而,研究者仍需对机器学习编程包中预设的参数和注意事项保持谨慎。在社会科学研究中,人工校验依然是应用机器学习工具的“金标准”。

尽管非营利领域的学者尚未广泛运用机器学习进行分析,但这种方法已展现出广泛的应用前景。比如,研究者曾尝试使用机器学习算法来分析非营利组织的使命陈述,以及媒体对穆斯林非营利组织的框架建构。

(四)自然语言处理

自然语言处理旨在让计算机分析人类语言。对于社会科学家而言,自然语言处理的目的主要可以分为两类:识别(identification)和量化(scaling)。识别方法旨在发现文本中的主题(如主题建模)或实体(如命名实体识别),这一点与质性研究中的扎根理论方法非常相似。量化方法则将给定文本置于具有社会意义的二元、分类或连续尺度上(例如自由派—保守派态度)。识别和量化都可以通过两种方式实现:一是词典法(即对目标文本与属性关键词表或另一份文本列表进行匹配),二是机器学习法。尽管自然语言处理方法最初主要在计算语言学中发展,但它们同样可以作为社会科学研究的有力工具。

表2列出了和非营利与慈善研究相关的实证研究。其他学科的学者也提供大量案例,体现出了自然语言处理方法的潜力。例如,公共管理和政治学领域的研究者通过情感分析和主题建模来识别词群,并分析政治演讲、议会记录和法律文件的含义。在社会学领域,文本挖掘已被证明有助于提取社会阶层和互动的语义特征。正如Evans和Aceves总结的那样,尽管自然语言处理方法不能取代富有创造力的研究者,但它们能够从海量文本中识别出人类难以察觉的微妙关联。

image.png

二、引入计算社会科学方法的实例:非营利与慈善研究知识基础设施

大多数社会科学学科都有专门的文献数据库,例如社会学领域的Sociological Abstracts和经济学领域的Research Papers in Economics。这些数据库是追踪、研究和促进学科知识增长的重要数据来源和知识库。

过去几十年里,有关非营利与慈善研究的出版物数量呈指数级增长。与此同时,非营利研究领域的学者也开始从不同来源收集文献数据,以追踪本领域的学术发展。例如,Brass等人建立了NGO Knowledge Collective(非政府组织知识共同体)以整合有关非政府组织的学术研究成果。近年来,关于本领域学术发展的研究也日益受到学界关注。

为系统性整合与整合已有成果,建立一个专门的文献数据库至关重要,这亦是特定研究领域内必不可少的基础设施。而计算社会科学不仅为构建此类数据库提供了如意工具,并且也在推动知识生产过程中发挥着核心作用。借助前文所述的CSS方法,我们建立了非营利与慈善研究知识基础设施(Knowledge Infrastructure of Nonprofit and Philanthropic Studies, KINPS;https://doi.org/10.17605/OSF.IO/NYT5X)。该数据库致力于追踪和推动本领域内最全面、最前沿的学术知识。由是,本文第二章节将使用KINPS来阐释具体案例(附带注释代码脚本),以此展示计算社会科学方法在非营利与慈善研究领域中的前沿应用。

(一)KINPS数据来源

目前,KINPS的搭建,主要基于三个来源:(1)来自Scopus的6.7万余条非营利研究文献,时间范围覆盖20世纪20年代至2018年;(2)由印第安纳大学—普渡大学印第安纳波利斯联合分校慈善研究图书馆所维护的“慈善研究索引”中的1.9万余条英文记录;(3)Google Scholar,迄今为止规模最大的文献数据库。

(二)数据库的构建方法

我们在搭建数据库时主要进行三项任务:(1)对异构性数据的规范化和整合;(2)建立文献分类体系;(3)构建文献知识图谱。如表3所示,上述环节均需使用到前文所介绍的多种计算方法。由是,我们实现了整个数据库工作流程的自动化,数据更新也只需几周即可完成。

image.png

1.规范化处理不同来源数据结构

不同来源的文献数据格式各异,因此首要任务是依据统一的数据库模式,并遵循关系型数据库的原则对这些异构条目进行规范化处理。正如图2所示,当不同数据源对同一篇文章存在重复记录时,这项任务会变得尤为复杂。

为了在整合不同来源的文献时既实现规范化处理,又保留文章的全部信息,KINPS的数据库模式需要达到相当程度的“完整性”。“完整性”可以从三个维度加以评估:模式完整性、列完整性与总体完整性。模式完整性指数据库模式在多大程度上能够覆盖一篇文献的各个方面。如图2所示,KINPS的模式包含了“参考文献表”和“分类表”。列完整性衡量的是在某一特定维度下属性的全面程度,例如,只有KINPS在“主表”中包含了“摘要”这一属性。总体完整性则是指数据库能够在多大程度上覆盖全部非营利领域文献,这可通过生成语料的流程加以评估,具体详见Ma与Konrath的论文。图3展示了KINPS数据库模式的最新设计。

image.png

2.使用自然语言处理方法融合异构数据记录

另一个任务是消除歧义,这在融合异构数据记录时非常常见。如图2所示,不同来源对同一篇文章的记录可能存在细微差异。消歧过程利用自然语言处理方法来测量不同文本字符串之间的相似性。

为了使文本能够被数学模型计算,需对其进行预处理,并将其表示为数值。预处理阶段通常包括分词(即将文本字符串拆分为较小的词语单元)和停用词去除(例如去掉“the”“a”等词)。目前最前沿的表征方法,是在大型语料库上预训练出的一个高维语义空间中,把每个单词都映射为一个向量。

对来自不同数据源的出版物文本字符串进行预处理后,我们首先使用传统的计数向量方法将文本转换为词向量,然后通过计算两个文本词向量夹角的余弦值来衡量它们的相似性。该过程使我们能够以较高的信度对来自不同来源的3100多条记录进行关联(代码脚本详见:https://osf.io/pt89w/)。

image.png

3.建立文献分类体系

如学者涂尔干所言,分类反映了社会事实是如何被构建和合法化的。文献分类不仅呈现学术活动的结构,还为构建学科或研究领域的知识范式提供基础。例如,非营利学者的知识生产结构是怎样的?该领域的研究版图如何随时间演进?该领域存在哪些知识范式?要回答这些基础性问题,首先需要对非营利与慈善研究领域的文献进行分类。

我们使用了最先进的监督式机器学习和自然语言处理对KINPS数据库中的文献进行了分类。在融合不同来源的数据记录后,共有14858条带有主题和摘要文本的记录。我们将标题和摘要文本作为输入,主题作为输出,来训练机器学习算法。该分类器经训练与验证后,被用于预测KINPS中全部6万条未标注参考文献的主题。

在KINPS中建立和使用分类时必须格外谨慎,因为它可能会影响本领域未来的研究主题。我们付出了巨大努力,以确保分类具有相关性、一致性和代表性。首先,最初的分类由一位非营利与慈善研究领域的专业图书馆员在20世纪90年代末至2015年间创建。其次,我们在三位慈善学教授和两位具有不同文化与教育背景的博士研究助理制定的一套规则指导下,对原有分类标签进行了规范化处理。再次,我们邀请了一批非营利领域的学者对预测结果进行修订,他们的反馈推动了算法的进一步微调。在数据库的未来使用过程中,为了反映本领域研究主题的变化,研究者需要持续重复这一环节。最后,非常重要的一点是,所有分析方法都应在理论框架内被恰当应用。如果研究者们对我们的分类结果不满意,他们可以遵循我们提供的代码脚本,生成一个可能更适合其自身理论框架的新分类。

4.构建文献知识图谱

从学科发展视角看,要想真正理解某研究领域的成熟度,需要关注其在三个层次的知识范式。概念及其测量工具一同构成了构念范式(construct paradigms),例如“社会资本”,它们是主题范式(thematic paradigms)的基础(例如运用社会资本来研究公民参与)。而通过将不同的主题范式加以整合,我们便能够分析知识体系中的元范式(meta-paradigms)。

我们可以利用网络图谱来分析本领域知识的结构与范式。图4基于KINPS数据库,展示了非营利与慈善研究的知识结构。在线附录(https://osf.io/vyn6z/)提供了该图的原始文件,并从教育、出版与学科发展的角度进行了更为详细的讨论。

image.png

在这个网络图谱中,节点代表上一节所建立的分类标签。如果一篇参考文献被同时标注了两个主题,则这两个节点之间建立连接,且边的权重表示其共同出现的次数。对节点的聚类处理采用了一种改进的社区检测算法,我们还通过一种能够更好区分簇的布局方式展开了可视化。详细信息和源代码可在OSF库中获取(代码脚本链接:https://osf.io/tnqkr/)。

如图4所示,非营利与慈善研究领域存在两个紧密相连的元范式:人文学科元范式与社会科学元范式。欢迎各位读者进入KINPS的在线界面,探索不同范式下的关键文献。人文学科元范式涵盖慈善、女性、教会及慈善史研究等多个主题;社会科学元范式则包括五种主要范式及其议题:(1)社会学范式:研究地方社区和志愿服务;(2)经济学范式:研究捐赠与税收;(3)金融学范式:研究筹款、市场营销与教育;(4)管理学范式:关注评估、组织行为与员工,且话语偏好使用“非营利组织”表述;(5)政治与政策范式:研究法律与社会政策、民间社会与社会运动,并话语偏好使用“非政府组织”表述。通过微调社区检测算法,还可以发现更多的主题范式,而这也将成为KINPS未来深入分析的一部分。

综上所述,诸多实证案例为我们研究本领域发展提供了借鉴。非营利领域的学者们一直在探讨理论自洽性与知识范式,并将它们视为本领域发展成熟度的重要标志。未来研究则可基于现有文献、KINPS数据库,以及前文介绍的计算方法,对本领域学术发展进行深入评估。

三、展望非营利研究的未来:引入CSS方法

我们坚信,计算社会科学方法能够为非营利与慈善这一研究领域带来创新型变革。

其一,计算社会科学方法在理论建构方面具有独特潜力,可为研究者提供解决传统研究问题的新方法。研究者可通过CSS,处理更大规模数据,并由此生成、探索并检验新观点。以KINPS为例,我们并未对非营利与慈善研究的知识结构设定先验期望或假设。本文的知识图谱,仅是从学科和方法论层面较为直观地呈现了不同知识空间间的关联,本质上属于一种纯粹的描述性工具。如今,随着不同研究范式对主题的处理方式及其本土化术语体系逐渐明晰,我们得以建立跨知识领域的理解桥梁。这就利于我们进一步验证关于非营利与慈善研究中知识空间演变规律的理论假设。

其二,CSS方法在引入非营利组织与慈善研究时,将我们对“定性研究”与“定量研究”的认知特征融合起来。典型的定性研究基于对少量样本的观察,形成人工解读,从而生成归纳性知识(如对基金会领导者的访谈);典型的定量研究则要对大量观测数据进行统计性的分析与检验,由是形成演绎性预测(如分析志愿者填写问卷的各项得分);而典型的CSS研究可以利用大数据同时生成归纳性与演绎性知识。具体而言,研究者可以使用机器学习法归纳性地发现数据中的簇、主题或类别,就像在定量研究中可能会涉及假设检验分析;可以利用自然语言处理中的自动情感分析,对文本数据(如非营利组织的工作报告和使命陈述)中的情绪、意识形态和写作风格进行量化分析。此外,计算社会科学方法同样适用于分析图片、视频等视听内容(如研究图片视频类的筹款材料与捐赠行为之间的相关性)。

其三,CSS方法的一个重要优势在于“开放”,要求整个研究过程的高度可复现性。数据和源代码的公开与共享,不仅能带来引用共赢,也可推动本研究领域内共享工具和数据集的发展(如Lecy和Thornton于2016年所开发并共享的一种算法,便能对联邦拨款记录与990表格中的受助方财务数据进行关联)。这也契合了当下非营利研究对数据透明度需求与日俱增的大势。由是,本文不仅开放了KINPS数据库的访问权限,还提供了附加注释的源代码,以方便读者复现实验、运用学术成果以及开展教学研究。

然则,引入CSS方法也会带来诸多隐患风险。如同所有研究分析方法一样,CSS这一方法本身并非问题的最终答案,它只是解决问题的一种手段。

其一,已有许多案例表明,CSS中存在潜在的设计缺陷,这可能导致对特定人群的研究结果出现严重偏差。如机器学习算法会复现其训练数据集中的隐藏偏见,并在大规模应用时进一步放大这些偏差。

其二,有些研究者可能误将CSS视为社会科学研究的“万金油”,对一些不切实际的研究项目产生过高期待。那些沿用数十年的成果评估标准需要重新审视——因为在CSS分析中,即便是实质上微不足道的极小系数,也可能被标榜为具有统计学意义。与此同时,研究者们数十年来用于判断结果重要性的既定标准也需要被重新审视,因为即使在实质上可忽略不计的极小系数,在计算社会科学分析中也可能被表现为“统计显著”。

其三,“大数据”同其他二手数据一样,存在信度和效度的问题。这些数据最初并非为回答特定的研究问题而收集的,因此研究人员对数据构念的控制力极其有限(甚至为零),特别是在数据收集平台无法生成具有代表性样本时。

此外,如前文所述,盲目引入和套用CSS方法是不可取的。即使是再高度精确的预测模型,也不一定能提供有用的解释。由是,专门设立计算社会科学方法的研究设计课程显得极为重要。学生们必须学会如何将计算方法引入研究设计,明确哪些问题类型能够借助该方法得到解答,同时要时刻警惕有损研究有效性的潜在问题与风险。

为更好地将计算社会科学引入非营利与慈善研究领域中去,以及与国内外学者开展更广泛合作,我们计划扩展KINPS数据库,为其纳入语言更多元化的文献出版物(从博大精深的中文开始)。欢迎有兴趣的学者联系我们,共同挖掘更多精彩学术成果!此外,KINPS是开展本领域元科学研究的理想起点(例如,通过关联引用数据进行网络分析,不仅可以评估文献影响力,还能识别到哪些文献为不同研究子领域之间的连接做出了贡献;借助统计检验误差的缺失程度、p值分布等指标,在一定程度上实现研究质量的量化;未来或可开发出自动提取统计效应量的算法,以助力元分析工作等)。由是在此,我们强烈呼吁非营利与慈善研究领域的学者们充分运用起KINPS这一平台,共同打造属于我们的、生机勃勃的学术花园!

(因篇幅所限,注释、参考文献省略。来源:《公益研究》期刊)


返回列表