返回上一页 文章阅读 登录

林展 陈志武:量化历史与新史学——量化历史研究的步骤和作为新史学的价值

更新时间:2021-06-03 21:56:11
作者: 林展   陈志武 (进入专栏)  
验证的办法是使用一些其他指标作为代理度量。比如,除了人均收入税的多少,贝克尔和沃斯曼还选择了男性小学教师的平均工资和当地非农就业的百分比作为经济发展的代理变量。如果不同的代理度量指标都指向同一个类似的结果,结论就更可信。

   2.问题和假说

   在前面提到的韦伯假说中研究的问题是,新教伦理是否导致了资本主义的增长。相对于研究问题,假说则更进一步,认为新教伦理导致了资本主义增长。假说是对人类行为和社会规律的一个猜测(猜想)。这个猜测是对关心的变量关系的一个明确表述。比如儒家文化阻碍了创新,儒家文化减少了社会冲突,大运河导致商业革命,等等。由于是假说,其可能会被数据所证伪。

   上面的假说,基本上都涉及两个变量,比如,韦伯假说中,涉及新教伦理和资本主义经济发展。与社会科学中经验研究一样,在量化历史研究中,把希望解释的对象叫做被解释变量、因变量或Y变量,把用来解释的对象叫做解释变量、自变量或X变量。下面为了表述方便,分别称为被解释变量和解释变量。韦伯假说中的被解释变量是资本主义经济发展,解释变量是新教伦理。影响资本主义发展的因素很多,这些因素和新教伦理共同影响了资本主义发展,为了发现新教伦理这一单一因素的作用,需要把其他影响因素的效果也揭示出来,排除出去。这些其他的影响因素,一般称之为控制变量。

   假说被提出之后,研究的路线图也就形成了。一个假说需要证明解释变量如何影响被解释变量,因此首先需要对被解释变量和解释变量进行度量,然后通过量化方法寻求两者之间的关系,以及对这种关系进行解释。

   一篇量化历史研究的论文,通常会关注一个被解释变量和一个解释变量,这样做的目的是为了使论述更为集中,重点去探索两个变量之间的因果关系。(14)这样做,并非是简化历史,而是分析复杂历史的可行方式。一个研究中的被解释变量,在其他研究中可能成为解释变量或控制变量。同样,一个解释变量可能成为被解释变量或控制变量。通过对同一个问题进行多个角度的量化分析,会有效增加对复杂历史的认识。这也是考虑到人的认知能力有限,为集中注意力而作的折中,这样做不是不考虑其他影响因素或解释变量,而是在分析中尽可能包括各种解释变量或控制变量,但在写作中有所侧重。

   一个好的假说是研究质量的重要保障,好的假说需要含义明确、有一般性、可以被证明或证伪。含义明确包含两层含义,一是被解释变量和解释变量必须是具体的,能够找到一个指标来进行度量。比如什么是资本主义萌芽,就是一个模糊的概念,无法通过一个具体的指标进行度量。二是必须清晰说明二者的关系,即解释变量是如何影响被解释变量的,这也是下文将介绍的作用机制。

   所谓一般性,是指假说不能只陈述个案。比如,旱灾导致了明朝的灭亡。由于明朝灭亡只发生了一次,这个假说难以被验证,但是可以修改为一个一般化的假说,即旱灾发生频率越高的朝代,其存续的时间越短,或旱灾增加朝代崩溃的概率。一个假说可能来自于常识、来自于统计数据、来自于理论与其他研究或者来自于历史材料的描述。

   即使在定性研究中,也存在大量的假说,只是由于研究者没有特意强调,不容易被人察觉。传统的历史研究,避免带着问题阅读史料,从而希望避免“以论带史”。那么量化历史研究先提出问题和假说,再去收集整理史料的好处是什么?

   量化历史首先提出问题的好处,一是可以方便跟已有文献的对话,确定自己的贡献在哪里。史料可能证实也可能证伪提出的问题或假说,只要史料的收集既全面又公允不偏,就不存在研究方法上的问题;如果证伪,已有的观点被推翻,更容易形成重要的发现。实际上,越是重要的假说,讨论的角度越多,一般也会有越多的竞争性假说。比如,朝代的灭亡,到底是因为旱灾、鼠疫,还是因为农民战争,等等。定性研究的特点在于,常常会有很多的假说在一起讨论,这帮助我们知道了更多的历史细节,但也不利于将复杂的历史条分缕析,将其中包含的规律一个个揭示出来。二是便于跟不同学科的交流,回答不同学科的重要问题。比如贝克尔和沃斯曼对韦伯假说的研究,虽然是讨论的普鲁士的情况,但其基本问题是文化如何影响经济发展,研究者可以在这一问题之下,讨论基督教在中国的发展对中国经济的影响,儒家文化对经济的影响,这不仅有利于在这些重大问题中提供中国经验、中国故事,也有利于知识的积累。三是可以基于要验证的假说,从被解释变量、解释变量和控制变量的角度,高效率地组织史料。史料如大海,如无问题视角,极易淹没其中。最后需要指出的是,量化历史在研究开始就提出问题和假说,但不是预设结论,而是猜测,这个猜测可能被史料证实,也可能被证伪。

   (二)理解史料与数据

   在提出问题和假说之后,我们需要寻找史料来建立数据库,即需要找到被解释变量、解释变量、控制变量等度量指标和数据。

   在拿到相关的史料和数据之后,量化方法并非像很多批评所说的那样,对数据和史料拿来就用,而是先从不同的维度对它们的质量进行检验。这里的检验,主要是基于历史史料学的基本要求,由于这方面已经有众多教科书,此处不做介绍。下面主要讨论从量化历史的角度,如何理解史料,重点是史料的代表性问题。

   在历史研究中,拿到的史料往往是关心的研究对象的一部分,只能够基于拿到的史料去开展研究。尽管随着历史大数据时代的到来,有时候可以拿到关于研究对象的全部史料,但这样的情况还比较少见。基于研究对象的部分信息对研究对象的特征进行分析,是统计学研究的核心之一。这里就涉及总体、样本和随机抽样的概念。

   在统计分析时,把研究对象的全体称为总体,每一个研究对象称为个体,把从总体中抽取的一部分个体称为样本。比如,如果研究中国历史上的皇帝,那么,所有皇帝就是一个总体。如果只使用清朝的皇帝,那么就是一个样本。

   什么对象是总体,取决于研究问题。如果希望知道清代中国的命案率,如果是以省为分析单位,那么每个省在每一年的命案率就是一个总体。如果只分析其中的一个或几个省,就是样本。如果只分析乾隆朝的命案,也是一个样本。前者是基于空间、后者是基于时间的抽样。

   对于历史研究而言,基于空间和时间的抽样是非常常见的。一个典型的历史研究常常会限定地域和时期,比如清代中后期江南经济研究。对时间和地区做这样的限定,是为了方便集中论述,避免将不同时期、不同地区的史料混用。抽样方法有其特有的优势,也是目前历史研究中常用的方法,但从实证研究、发现规律的角度看,这样的研究方法却可能会带来选择性偏差,研究结果不一定带有普遍性。

   选择性偏差是指由于选择的样本不是随机抽取的(比如,专挑对研究结论有利的时期和地区),所以不能够基于这些样本的特征推断总体的特征。随机抽取是指保证总体中每个样本被抽中的概率都是一样的。例如,不能够基于江南的经济发展水平去推断整个中国的经济发展水平。这样的选择性偏差非常明显,也很容易被察觉,但历史研究中,还有大量不容易察觉到的选择性偏差问题。例如传统经济史研究中的“选精”“集粹”问题,其实质就是一个基于样本推断总体的问题。(15)

   具体而言,如果我们希望知道北宋整个朝代的年均亩产量,那么北宋所有土地上每一年的亩产量就是一个总体。由于不知道这个总体的规模有多大,我们不妨做一个假定,假设北宋耕地有7亿亩,平均每块耕地面积为70亩,那么耕地数量就有l千万块,再假设是一年一熟制,北宋总共存续了167年,那么理论上,北宋亩产量的观察值应该有16.7亿个,因此要精确地知道宋代的亩产量这个总体几乎不可能。如果研究者拿到了16700个北宋亩产量的历史记载,那么这1万多个亩产量占全体亩产量的比例约为十万分之一。我们自然要问,这十万分之一的样本能否推断总体呢?

   这样的挑战不仅仅在经济史,在其他历史学分支同样会出现。比如,如果想知道民国时期中国人的民族观念,假设只考虑16岁以上的人,那么总体数量可能在两亿人以上。如果拿到了2000个当时中国人民族观念的调查或者其他记载,能否基于这2000人来推断两亿中国人的民族观念?这里还需要假定一个人在一生中的民族观念变化不大。

   由于研究者拿到的史料通常是样本,但希望了解的是总体,如何由样本推断总体就成为历史研究的挑战。这种挑战在定性和定量研究中都存在,尽管定性研究中不用这套术语,但不代表这个挑战不存在。定量研究的好处在于,可以明确地展示出这种挑战,同时利用已有的量化方法克服这种挑战。

   基于总体和样本的理解,可以知道,历史大数据或增加数据量,并不必然会解决“选精”与“集粹”的问题。利用样本信息来推断总体的信息,是统计学中统计推断(statistical inference)的重要内容。应对选择性偏差,基于非随机抽样的样本来推断总体的特征,是量化分析方法特别是计量经济学分析方法的核心关注之一。

   (三)相关分析和因果分析

   在提出问题和收集数据之后,第三步是量化分析。量化分析方法主要有三类。第一是对数据进行描述统计,主要包括数据的来源、处理过程,观察值也即样本量的多少,每个变量的统计特征,比如平均值、方差、最小值和最大值等。描述统计主要针对单个变量进行分析。这一方法比较简单,在历史学研究中较常见,不赘述。第二是相关性分析,主要分析方法包括画散点图、画地图、计算相关系数等。这一方法主要用于分析两个变量之间的关系。第三是因果关系分析,通常使用多元回归分析的方法,重点是处理内生性问题和发现作用机制。

   1.相关关系

   当我们提出假说时,实际上就提出了一个相关关系,也就是两个变量的数值之间的变动关系。相关关系分为三种,分别指正相关、负相关和不相关。

   正相关是指两个变量朝相同的方向变动,比如新教徒数量越多的地区,经济发展水平越高。负相关是指两个变量往相反的方向变动,比如儒家文化越发达的地方,发生暴力冲突的次数会更少。不相关是指两个变量的变动没有关联。韦伯在《新教伦理与资本主义精神》中开篇就提到他所发现的相关性。这种相关性构成了这一专著的起点和基石。展示相关关系的方式主要是画散点图、画地图和计算相关系数。散点图是用二维坐标展示同一个观察对象两种不同特征度量值关系的图。横轴标示一个变量的数值,纵轴标示另一个变量的数值。每一组数值对应散点图中的一个点,点的位置由两个变量的数值决定。通常,自变量标示在横轴,因变量标示在纵轴。如果两个变量之间不是解释与被解释的关系,可以将变量标记在任意坐标轴。画地图的方法,使得相关性在空间上的分布很直观地展示出来。从贝克尔和沃斯曼的文章所画的地图中,可以看到新教徒数量越多的地方,人均收入税确实越多。当然,这也从一个角度说明,如果只考虑某些特定的区域,比如普鲁士东北部地区,结果可能会是完全相反的。这正是考察大样本和考察个案所带来的差别。散点图和地图图示方法可以直观展示两个变量的相关关系,但并不精确,且也难以对不同组变量之间的相关性进行比较。解决办法是计算相关系数。相关系数描述两个数值变量之间线性相关关系的方向和强度。数值介于-1到1之间,符号的正负表示正相关和负相关,等于0时表示不相关。相关系数绝对值越大,表示相关性越强,反之,则越小。

   2.因果关系

   韦伯显然没有满足于只是发现新教徒数量与经济发展之间的相关性,而是继续追寻背后的因果关系。

因果关系的基本含义是改变一个变量的值,就可以使另一个变量的值改变。由于与相关关系类似,两个变量都有变动关系,人们常常将相关关系误读为因果关系。但相关关系不等于因果关系;相关关系中可能隐含有因果关系,(点击此处阅读下一页)


爱思想关键词小程序
本文责编:admin
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/126792.html
收藏