返回上一页 文章阅读 登录

左卫民:中国计算法学的未来:审思与前瞻

更新时间:2022-05-27 00:16:47
作者: 左卫民  

  

   近年来,“计算法学”逐渐成为法学界的高频热词。例如,若干法学院校开设了计算法学课程、法学与计算机的双学位专业,甚至开始在计算法学相关领域招收研究生。中国计算机协会(CCF)也成立了计算法学行业分会以促进计算法学的发展。伴随数据时代来临,法律实践更容易被数据记录、捕获,奠定了法律计算的数据基础。随机森林、聚类算法、神经网络等机器学习方法的出现,为法律计算的实现提供了可能。上述种种,似乎预示计算法学正在兴起。然而,关于计算法学的发展却存在着两种声音:其一,计算法学正在兴起。在国内,已有文章开始探讨计算法学的概念与内涵。计算法学似乎正成为一种新的发展趋势。其二,计算法学并未成为独立且成熟的学科。在部分学者看来,国内尚未有成熟的计算法学概念、成果涌现,计算法学既没有有效的计算方法,又缺乏可行的计算思路,计算法学的发展可能受到诸多质疑,似乎难以成为一个独立的学科。

   笔者认为,中国的计算法学的前景如何,取决于其是否能够完整经历从知识酝酿或引介,到概念凝练和学科构建,再到研究方法成熟的过程。对于刚刚走在知识酝酿阶段的新学科而言,其研究前景还有诸多的不确定性。关于计算法学在中国的未来,我们需要讨论三点:第一,计算法学的概念范畴。什么研究才能称为计算法学研究?抑或是计算法学的概念与定义是什么?第二,计算法学应当如何计算。可以计算的法律经验数据是什么?用以法律计算的方法是什么?第三,计算法学的前途。即法律的计算效果究竟如何?未来的计算法学学科应该如何发展?

   一、计算法学:概念为何?

   何谓计算法学?这是一个尚未充分明确的问题。在域外,理论界实际上较少直接使用计算法学的称谓,相邻概念主要涉及计算社会科学(computational social science)、法律计量学(jurimetrics)、法律信息学(legal informatics)等。具体而言,可从以下方面把握域外计算法学的相关概念。

   第一,从计算社会科学(computational social science)角度把握。按照克劳迪奥·乔菲雷维利亚(Claudio Cioffi-Revilla)的定义:“计算社会科学是以计算为媒介,对社会学领域开展的跨学科研究,使用大数据、云计算和智能机器人等计算机技术进行的数据挖掘。”2009年,由15位学者在自然科学领域内权威期刊《科学》(Science)杂志刊发的《网络生活:计算社会科学时代即将到来》指出:通过大量社会信息,计算和预测人类的交流、互动将成为计算社会科学的主要研究领域。据此,计算社会科学被视为一种充分使用大数据和依托计算科学方法的社会科学研究。计算法学的概念自然也需要放在计算社会科学的框架下把握。

   第二,从量化研究角度把握。法律计量学的最早倡导者洛文杰(Loevinger)在《法律计量学:前进的下一步》一文中主张,将量化思维引入法律分析过程,强调使用概率统计方法来测量证人、法官与立法者行为。我国有学者则将其翻译为“计量法学”或“数量法学”,所谓“计量法学”是一种使用法律实证分析,以数据建模为方法,从事判决预测与制度评价的研究。计算法学便应当从法律量化的角度加以理解。

   第三,从法律信息的角度阐释。自从香农创立信息学以来,信息就成为计算机技术研究的对象。法律信息学开始成为信息学的分支之一,如根据美国斯坦福大学法律信息中心杰内塞雷斯(Michael Genesereth)的论断,计算法学是法律信息学的组成部分,而法律信息学是法律推理的一种方法,依托现代信息技术的法律分析可以极大地改变法律行业,提高法律服务的质量和效率,从而提高获得司法公正的机会,并改善整个法律体系。据此,计算法学的概念应当在法律信息学的范畴内理解与把握。然而,法律信息学的概念似乎还没有获得理论界的普遍性认可,域外代表性的研究成果尚不多见。

   整体上,具备成熟研究思路和方法的计算社会科学(computational social science)已在数据与人工智能风起云涌的欧美社科界蔚然成风。在笔者看来,其原因可能与域外社会科学界包括法学界如美国实证研究已经成为主流研究范式有关。欧美社科界很多研究者具备很强的统计分析能力,并在多领域开展实证研究包括法律实证研究。同时,当前域外研究者包括实证研究者通过长期关注并不断吸收机器学习等计算科学的方法,展开新的科学研究包括新的实证研究,相关研究成果甚至可能促进法学与人工智能技术的跨界融合。实际上,我们已经见到域外司法人工智能技术的发展往往伴随着法律实证研究成果的实践应用,美国COMPAS软件与法国Predictice软件对裁判结果预测的实践应用即是最好的例子。以“做实证研究”来促进法律人工智能技术的发展,进而寻求在重大问题上的研究共识,正在成为美国式法律实证研究(计算法学)发展的新方向。

   与域外不同,计算法学在中国的出现,可能与新文科的兴起,相关学术组织的成立,以及计算法学论文的发表有关。具体来看,国内对计算法学概念的研讨,大致可以分为两种进路。第一种进路中的计算法学是“法律与计算、科技”的结合,认为使用计算机技术研究传统法学问题即是计算法学。应用计算机技术实现对海量裁判文书中的数据提取、要素输出和准确率检查等就是计算法学的研究成果。这种理解往往将“计算法学”简单理解为“法律与科技、计算”的结合,并进一步认为,在法律数据完备、真实、精确的前提下,通过计算方式研究法律数据,从而设计出一系列智能化产品,为立法与司法活动提供重要参考。据此来看,这种进路将法律人工智能相关技术作为焦点,在识别、转换法律文本为法律数据方面做了不少努力,如应用自然语义识别、裁判文书提取等,但在文字转换成为数据之后,如何展开数据式研究,却并未有多少应用统计学和机器学习方式展开的研究,也缺乏在此之上的法律人工智能开发,最常见的仅仅是知识图谱式的显示而已。同时,这种定位还将法律与科技的结合问题,如法律如何规制大数据、人工智能应用的相关问题作为学术研究的关切点。不过,这种学科定位与发展模式仅是“科技”与“法律”简单交叉的研究定位,可能导致计算法学与法律人工智能、司法人工智能的研究内容重叠。当法律人工智能的发展在技术层面需要经历漫长过程,技术应用还可能遭受法律伦理质疑之时,这恐怕难以支撑“计算法学”成为一门充分展开的独立学科。

   第二种路径认为,计算法学是一种应用数学、统计学、计算科学的相关知识、方法展开的法律实证研究。笔者比较认同此种进路,但更明确地认为:计算法学其实是传统实证研究的新阶段,它是一种从量的层面研究社会现象的方法与学科。作为社会现象的一种,法律现象也具有量的属性,可以从量的方法进行观察和研究。根本上,法律实证研究与计算法学的研究对象有着天然共性。如法律实证研究与计算法学都强调使用统计学方法进行数据的收集、分析,进而发现法律现象的相关性和因果性。显然,计算法学与法律实证研究都是一种基于经验数据的量化研究。至于是否应用计算机技术、计算思维和计算方法,并不能成为法律实证研究与计算法学的“分水岭”。当前,法律实证研究成果同样重视法律大数据与计算机技术结合,主要基于法律现象的经验数据,使用统计学与计算机科学的相关知识来阐释法律实践。例如,王禄生开发了分段、分词检索工具,实现对303万份判决书的自然语义挖掘,形成了一系列的法律实证研究成果。笔者所著的《刑事辩护率:差异化及其经济因素分析》一文,应用“爬虫”软件对54409份裁判文书进行了数据挖掘,使用Python语言参与数据挖掘和分析工作。同时,美国的实证研究学者更是已经将决策树、随机森林以及神经网络等机器学习方法应用于法律的实证研究。通过分析法官经验和法律决策模式,使用机器学习方法构造和模拟出同人类决策类似的决策模型,并依据决策模型的研究成果研发出风险评估和预测案件裁判结果的人工智能系统。

   如图1所示,科学意义上的计算法学与法律实证研究呈现“一体两面”的关系。计算法学与法律实证研究在研究对象、研究方法和研究领域上相通,其本质上是实证研究在新材料、新方法兴起后的应用与拓展。计算法学处于统计学、计算机技术与法学的交叉领域,并非单纯强调计算科学方法与计算机技术在法学领域内的推广,更不是那种既不使用数据,也不运用统计学方法,更没有决策树、梯度算法等机器学习方法应用,仅简单将法律问题与科学技术简单组合的“伪”计算研究。至少计算法学研究的其中一种应是基于法律经验现象的数据分析与定量研究,以统计学、机器学习为主要研究方法,实质上是法律实证研究的最新表述,可以视为法律实证研究的衍生或者2.0版本。

  

   图1计算法学相关学科关系图

   二、计算方法:如何计算法律?

   如何计算法律?一方面,法律的计算需要有成熟的计算法学,使用机器学习计算法律实践或法律现象或许正在成为法律计算的一种新方向。另一方面,有了成熟的计算方法,还需要具备丰富的法律数据来源。可是计算的法律数据则诞生于法律的实践,静态的法律条文既不可能反映数量变化情况,更无法自我呈现法律条文背后复杂的权力关系,因此,动态变化的法律实践才是法律量化数据的重要源泉。下文将从可以计算的法律量化数据特征与计算法学如何使用机器学习方法两个方面展开分析。

   (一)计算法律的方法

   计算法学的基本方式是什么?这是一个十分重要但尚未厘清的问题。笔者以为,以统计学为根基的机器学习应成为法律计算的主要方式。在美国,已经有学者开始探索、使用机器学习相关方法研究法律问题。如美国学者乔恩·克莱因伯格(Jon Kleinberg)等人以此分析了美国15万余件重罪案件的法官假释结果,他们对法律的计算思路与方法值得关注,可据此从计算法律的设计思路,法律决策树与随机森林的组成以及梯度提升算法的应用方面把握计算法律的方式。

   首先,使用机器学习的法律计算是以概率论、数理统计、最优化理论等为基础,核心要素是法律数据的计算模型。机器学习的结果与统计学的相关性分析类似,都是一种法律数据拟合度很高的计算模型,可以实现通过机器学习方法对法律结果的预测。如乔恩·克莱因伯格等人利用美国司法部(1990年至2009年)审前保释决定的相关数据,并将其分为法官决定组与机器学习预测组,对影响释放决定的因素,如再犯风险、逃避审判风险、保释金数额等决定性要素量化处理。通过决策树、梯度提升算法等机器学习方法构建和训练计算模型,使用梯度算法提高计算模型的精确性,通过对比法官决策结果与机器学习算法预测结果的差异,分析影响差异产生的“不具有观察性”的要素。

其次,利用法律经验数据的特征与法律决策分类结果之间的数量关系建构出具有分类关系的决策树,即让不同法律关系特征落入对应分类的模型。为避免单一法律特征可能被过度放大,造成不必要的偏差,其随机挑选部分法律数据特征建构多棵决策树形成随机森林。决策树与随机森林是常用的机器学习分类方法,在法律样本数据中,依据结果变量与自变量之间的对应关系可以构建多棵决策树组成随机森林。如再犯风险、逃避审判可能和保释金额同审前释放决定之间的对应关系即可构成不同类别的决策树。获得一种对同类数据相同方法处理的“学习分类器”,使得新出现的案例数据对应预测分类。例如,在乔恩·克莱因伯格等人的研究中使用决策树对释放风险予以评估,将观察因素(影响决定的因素)映射到结果(逃避审判风险)的函数,建立一系列“二元决策树”。如决策树根据先前是否有犯罪记录进行第一次分叉,(点击此处阅读下一页)


爱思想关键词小程序
本文责编:admin
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/134162.html
收藏