返回上一页 文章阅读 登录

何哲:公共治理研究:历史为什么是重要的?

更新时间:2020-08-12 22:50:49
作者: 何哲  
因此,在同等个体数量下社会系统的复杂度要远高于自然系统。这种复杂度的区别,就标志着,绝大多数自然系统是可以找到科学上的运动规律和动力机制的,即便对于那些高度复杂的自然系统而言,纵然无法进行精确的动力学描述,精准预测其运动状态,但也可以通过统计学的方式来描述其宏观特性。然而社会系统则很难如此,社会系统由于人类个体的组成维度极为丰富,影响个体行为的要素很多,因此,很难对一个社会系统构建出稳定可靠的运动机制模型,只能在某一个相对简单的层面上缩小其他维度要素的影响简化系统和建构机制(例如经济学的交易模型)。然而,这种简化,始终无法反映社会系统的真实状态。所以,社会系统无论在运动机制还是在外部宏观表现上的抽象研究,都只是真实状态的一个具有很大偏离的减维投影,远谈不上客观性和稳定性,这是需要进行相关研究所自知的。

   第三,自然系统是满足同质性原则,而社会系统不满足。自然系统由于其结构的物质性和客观性以及相对简单性,从而导致了自然系统是可以满足同质性原则的。也就是说,如果两个自然系统,其组成个体相同,数量相同,外部条件相同,那么所呈现出来的系统性质和运动规律也是相近甚至一致的。但是社会系统由于无法满足以上的要求,在个体身体差异、文化差异、行为习惯、心理状态、乃至地理位置等各种复杂要素的影响下,即便两个数量相同,构成结构相似的社会系统用来比较,它们可能无论在微观个体还是在外部宏观特性上,还是行为方式,表现得都不一致(已有的大量行为社会科学研究已经证明了这一点[[9]])。这种社会系统的非同质性就意味着对社会系统的研究具有高度的样本依赖性,远不能得出一个普适性的社会系统运作规律。既不能抽象的得出稳定的社会运动状态模型,甚至对于宏观状态的外部统计分析,也是极其不稳定的。

   以上的三个根本性的差异,就意味着当社会学科研究在引入和借鉴自然系统研究方法时,要高度认识到社会系统的特殊性和自然方法的局限性,从而才能对研究方法所得出的结论,采取一种是审慎的态度。既不会迷信某种研究方法,更不会迷信所谓的科学研究方法所得出的结论。

  

三、数据实证研究的典型谬误

  

   今天社会学科的实证研究,已经从一种完全的理性规范分析,走入了面向数据的绝对实证主义的方法论中,这种方法论从本质上是认为社会系统的研究,特别是公共治理的研究,一定要用实证检验,只有数据实证检验,才是有意义的,才能成为“科学”。这种绝对的研究方法论内在具有非常明显的谬误,而且其绝对化的滥用已经造成了很严重的后果。

   谬误一,问题谬误。实证研究最重要的是研究的问题,其基本的逻辑在于假设存在一个问题,然后抱着检验的态度去收集数据,并对这一问题进行是或者否的判断,从而将问题科学化。然而,所检验的问题是从何而来的?在公共治理体系中,由于公共治理具有高度复杂性,这就意味着各种要素的相互关联。因此,从众多复杂的作用机制中选择出一种潜在的合理的机制(这一机制就是问题)进行检验,就是实证方法的第一要务。然而,现实的大量研究显示,由于缺乏对实际治理体系足够的了解,研究者往往想当然的认为社会是按照某种机制运行的(这其中最多检验的是经济机制,如锦标赛模型)。但是一个基本的问题是,是不是公共治理体系在现实中是真的如此运行的,在复杂的个体动机机制中,是不是这一机制是主导机制?这显然已经不是简单的纸面数据分析能够得到的信息了。

   谬误二,因果谬置。虚假问题必然导致因果谬致。实证研究的根本出发点是找出社会运行中的因果关系,因此,虚假的问题往往导致因果谬置。因果谬置有三个表现:第一是因果倒置。所谓因果倒置,就是置因为果,置果为因。公共治理的复杂性作用机制往往使得多个变量同时发生,从而有可能使得看起来是原因的变量实际上是结果,反之亦然。还是以锦标赛模型为例,假设锦标赛模型是成立的,然而一种机制是绩效决定了晋升,另一种则是那些本来优秀的官员给予重点培养,从而表现出更好的绩效。然而,模型检验中,却无法分辨两种机制到底是谁对?第二是因果假置。就是指本来可能不存在因果关系但是存在相关关系的被错误的认为存在因果关系。由于社会系统的多维度表现性,所以当社会状态改变时,其在不同的维度和侧面都能观察到不同的状态改变,于是研究者就认为一种状态改变决定了另一种状态改变。实际上他们可能都只是一个宏大变化的结果。实际上,传统的因果关系一定要求具有时间先后性,然而,近年来的因果推断方法已经逐渐放弃了严格的时间先后性,因此在方法论上本身也存在很大争议。要在研究中,真正避免把单纯的相关关系误认为是因果关系。第三种是因果强置。也就是对那些其实不具有实质相关或者因果意义的变量,强行设置因果关系。而由于社会系统的复杂性导致多变量的普遍联系性,所以很容易在遥远的两个变量之间发掘出相关关系,甚至设置因果关系。也就是说,当研究者在A和B两个变量设置联系时,其实本身已经在其中建构了联系,然而,这种联系是不是真实存在的,还是只是数据上的伪关联,或者是有实际意义的,则是无法检验的。

   谬误三,同质性谬误。如前所述,社会系统存在与自然系统的根本不同之一是同质性问题,因此,实质上在社会系统的实证研究中,都或多或少存在着根本上的同质性谬误。任何实证统计的前提假设是统计的对象是具有高度同质性的,比如要分析水果的营养成分时,首先要按照种类,把对象分成苹果、梨等,绝不能随便在水果堆里抓一把然后分析。社会系统的难度就在于,由于个体具有高度的独立性和多维度的标识,社会系统的实证分析只能勉强的按照某一特性将对象归类分组,然而,所分组归类的对象依然是高度不同的。比如大量的实证分析去统计公共政策在不同国别、省际的作用差异,这一前提都是假设:无论国家、区域面积大小,人口多少,信仰什么,其都是相同的社会系统。然而,这是不是真的,显然已经被隐含进去。同质性谬误的存在,使得,任何实证检验实际上都建立在非常不可靠的基础上。

   谬误四,数据谬误。数据的真实性问题是最明显也是长期以来被讨论的问题。尽管如此,这种状况并没有根本性的改变。一般来说,数据谬误来源于三个原因:一是个体对自我的辨识困难,也就是说,当面对一组问题时,个体在愿意回答的同时,是否可以精准的将其内心的状态准确的反映出来。由于人的状态受主客观环境的变化影响很大,加之人的主观意识存在多种深层的分布状态,因此,即便一个测量个体在力图真实回答的状态下,其回答的问题也存在很大程度上的变数和不一致。也就是说,直观的表现为如果多次对一个主体进行测量,会发现其结果很可能变动很大。二是个体的故意伪造。任何个体都存在保护自己隐私的动机,因为隐私在一定程度上意味着个体的消极自由。因此,无论国别文化,也无论研究者多么强调研究结果的隐私保护,最终个体都存在着隐瞒真实判断的动机。这种动机有时候是明显的

   ,有时候则是潜在的。当然,更多情况下的伪造是个体面对随意发放的问卷而随意填之。三是研究者的数据修改。这其中包括两种情形,一种情形是恶劣的故意伪造,例如面对数据量不足的情况下,随意找人填写问卷或者自己填写数据。另一种则是对非常态数据的删除,对于非常态数据而言,往往会导致计算结果超过研究者预期,因此,研究者往往会将明显不好看的样本剔除,从而保证运算的结果符合预期。究其本质,数据谬误所表现的根本原因就是在复杂的社会个体状态下,较大规模的样本数和精准的数据采集本身就是一对互斥的矛盾,大样本采集数据没有办法在实验室条件下从而长期稳定的对一个个体的真实意愿进行详尽的测量。

   谬误五,信效度谬误。为了尽可能的让实证结果具有说服力,信效度分析被引入到实证分析中,用于分析问卷和数据是否真实反映了样本的状态。信度反映测量的一致性,效度反映测量的准确性。这种思路固然是非常好的,然而,在现有的信效度分析中,并不能严格的反映出信效度的需要。信效度的分析一般而言包括重复测量法,折半分析法,克朗巴西系数法等。准确的讲,重复测量法实际上是最有效的方法,然而受成本等制约,很难对同一样本群体进行重复测量。折半分析法实际上就已经是大打折扣了,其一个基本假设是这一群体具有共同的属性,因此才可以折半分析。克朗巴哈系数法实际上是最简单也是运用最多的方法,在各种统计软件中均可直接计算,然而这一方法本质上是在已有数据基础上的自我判断,更重要的是,这一系数随着样本问题数的增多而显著增大,面对今天动辄几十个问题的问卷,其很容易就满足。从根本的原因来看,信效度谬误的本质来源在于试图在已经测量的问卷上自我证明自身的合理性。而从基本的逻辑角度,一个系统自身证明自身的合理性和准确性是非常困难的,再自洽的系统,都无法不借照外界参照而证实自己的合理与准确性。

   谬误六,方法谬误。方法谬误通常体现在数据分析方法、变量选择和样本数量上。各种数据实证本质上都是在利用已有的数据进行各种线性或者非线性的回归,从而进行各种变量间关系的参数或者非参数估计。近代统计学的发展和计算软件的发展使得各种统计计算成为非常简单的事情。这种便利性往往使得研究者忽略了计算方法背后的隐含条件和要求,从而导致若干较为严重的方法谬误。一是过度变量谬误。现有的多元回归体系导致可以很方便的计算多达七八个乃至十几个变量。然而,却掩盖了严重的变量之间的相关性关系。多元分析有效的前提是自变量之间的独立性,也就是正交性。在这种基础上才能准确分析各个变量之间对因变量的影响。这也是在实验分析中最需要控制的。然而,在社会系统下,由于社会系统的复杂性,导致各个大量变量高度相关,从而在社会系统的分析中变量独立是非常困难的事情。因此,为了解决这一问题,产生了包括因子分析、虚拟变量、对数化、标准化等各种方法力图减少这种相关性。然而,这种减少都只是在技术上的处理,不能改变自变量相关的事实。因此,在多元回归中,变量越多的回归越不可靠,当面对超过三个以上变量的回归时,对其结果就要千万小心。二是模型可靠性谬误。由于多元变量分析存在很大的结果不稳定现象。因此,为了确保结果是可靠的,实证研究者往往使用大量的模型来对已有数据进行检验。主要方法是通过变换拟合方法和增减控制变量来实现。有的研究甚至展示十余种回归模型的结果,其中,两个证明核心自变量与因变量正相关,三个证明无显著关系,五个证明有负相关关系,从而研究者就得出结论,存在着比较大的负相关关系。这实际上是极不严肃也谈不上什么科学的。三是样本数量谬误。样本数量既关乎到结果的一般性,又对回归估计的可靠性高度相关,然而,受制于成本和条件约束,研究者往往拿不到足够的样本。因此,有的研究就无视样本数量短缺的现实,强行运行计算,并得出结论。而有的就用插值法、面板数据法来强行扩大样本规模。其中插值法本质上是一种修改数据的行为,而面板数据法则忽略了样本个体在时间维度的同质性改变。

   谬误七,结果与结论谬误。由于方法谬误的普遍存在,导致大部分回归模型的结果是高度不可靠的。在很大程度上说,多元回归方法中,发现两个变量之间存在正与负之间的相关关系已经是模型能够提供的最大的信息,而这一关系的强度已经是高度不可靠的。实际上,越简单的模型的结果越可靠,二元分析相关分析最为可靠,随着变量数量的增多其结果可靠性呈指数下降。因果分析在自变量与因变量没有时间先后顺序的情况下,很难与相关关系相辨别,除非有足够多的其他(一手材料、调研、文本等)证据证明存在着很强的因果机制存在。多模型比较的结果,除非多模型一致指向同一稳定的相关关系存在,否则不能被认为是高度可靠的。

因此,可以看出,由于以上的各种谬误存在(在其他社会科学领域也存在相当多的谬误[[10]]),大量的实证研究实际上走入了一种盲目的误区,大量的数据实证分析,实际上是用统计来代替研究者的思考,(点击此处阅读下一页)

本文责编:sunxuqian
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/122450.html
文章来源:作者授权爱思想发布,转载请注明出处(http://www.aisixiang.com)。
收藏