返回上一页 文章阅读 登录

雷磊:司法人工智能无法实现司法公正

更新时间:2022-10-24 09:46:14
作者:

   摘要:司法人工智能具有人类法官不可比拟的优势,但也具有不可克服的缺陷,即无法应对不确定性,不具有人类常识常情,以及无法进行价值判断。司法人工智能的基本运行逻辑是基于历史数据基础上的预测,既包括基于类案裁判之历史数据的同案预测,也包括基于法院或法官个人裁判历史数据的个性预测。在同案预测中,司法人工智能有助于实现司法统一,但不一定能实现同案同判或依法裁判意义上的形式正义,更可能与实质正义相矛盾。在个性预测中,“法官画像”的现实主义逻辑可能与实体公正背道而驰,“买卖法官”的商业偏好逻辑必然侵蚀程序公正的理念。因此,司法人工智能无法实现司法公正,目前它的合适定位就是司法裁判活动的辅助手段。

  

   关键词:司法人工智能;实体公正;程序公正;同案预测;个性预测

  

  

   人工智能技术在司法领域的应用已成为我国国家信息化发展战略的重要支点。2016 年 7 月发布的《国家信息化发展战略纲要》提出建设“智慧法院”,推动执法司法信息公开,促进司法公平正义。2017年 4 月,最高人民法院印发《最高人民法院关于加快建设智慧法院的意见》指出,智慧法院是人民法院充分利用先进信息化系统,支持全业务网上办理、全流程依法公开、全方位智能服务,实现公正司法、司法为民的组织、建设和运行形态。在第十三届全国人大五次会议上,《最高人民法院工作报告》将“深入推进司法体制改革和智慧法院建设”作为独立板块,视为“坚持体制改革和科技创新双轮驱动”“人民群众对司法公正的获得感不断增强”的重要表现。

  

   有法官指出,在司法领域,“人工智能的运用能够极大地减少人力的重复运用,减少人为因素对司法公正的干预,极大地提高司法活动的效率”。这种观点极具代表性。几乎没有争议的是司法人工智能对于司法效率的提升,以及对“案多人少”矛盾之解决方面的重要意义。但有疑义的是,司法人工智能能否实现司法公正这一价值目标? 当然,如果承认司法公正是一种有着不同实现程度的价值诉求的话,那么,司法人工智能在何种意义和范围内能否促进司法公正? 与司法效率可以依靠实证研究得到检验不同,司法公正主要是一种理论判断,需要深入人工智能的技术逻辑,看其与司法公正的理念是否匹配。

  

  

  

   什么是司法公正?

  

   广义上的司法公正涉及到司法程序的各个领域和各个方面,与司法的权威性、司法活动被社会伦理的认同程度、司法制度的宏观构架,以及司法程序的合理性相关。相反,狭义上的司法公正主要涉及司法裁判活动。司法裁判是一项价值取向的活动,司法公正是司法裁判的价值诉求。一般认为,判断现代司法是否具有公正价值,就是要看它是否既具有司法结果公正价值,又具有司法程序公正价值。由此,司法公正就包含两种类型,即实体公正与程序公正。并且通常认为,实体公正是司法公正的根本目标,程序公正是司法公正的重要保障。程序公正注重诉讼过程的公平,其最重要的原则是程序自治和当事人获得同等对待。程序中的法官要做到对各方态度相同、权利相同和机会相同。所以,当事人是否获得了参与诉讼的机会,诉讼过程中陈述、举证、辩论的权利是否得到了同等关注,法官对双方当事人是否一视同仁而无任何偏颇,是否同等地考虑和评价了双方当事人的主张和证据,就成为判断程序公正与否的主要标准。程序上的步骤与方式的设计一方面是出于对实体公正结果预望值的确保,另一方面是则是基于程序的固有内在价值( 程序价值) 之上。

  

   相反,实体公正更多与裁判结果相关,具体而言又包括形式正义与实质正义两方面。形式正义既包括平等,即同样事物同样对待,也包括法的安定性。法的安定性大体又囊括这几层含义: 其一,公民可以基于法律获得关于其法律地位以及这一地位之法律条件的信息( 可知性) ; 其二,公民可以确凿地依赖这类正确的信息来行为( 可靠性) ; 其三,公民可以预见到政府官员所作之具体法律决定的可能( 可预测性) ; 最后,政府官员必须遵循现行有效的实在法,必须以事前确定的一般性法律规范为司法、执法的依据,他们的裁量权要受到约束( 可约束性) 。2在这几层含义中,最核心的是可预测性要求。形式正义落实为法官的义务就是“依法裁判”,因为依法裁判原本就蕴含依照事先颁布的一般性规则来处理案件的要求,“事先颁布”就意味着裁判标准的“可视化”,而“一般性规则”则意味着同案同判。当然,依法裁判的另一面向就是法官受制定法的拘束。这表明,通过制定法表达的价值实现的方式和方法对法官有约束力,因为未公开的条款、对法律续造的需求或具体案件中出现的法律矛盾,都使得法官必然诉诸立法者的评价( 目的解释) 。同时,法官对正在适用的规则的目的之直接渗透,使得他们也参与了法律的塑造。

  

   与立法者不同,法官的这种塑造活动不是在一般意义上进行,而是“逐案”进行。正如德国法学家拉伦茨所说的: “法学所关心的不仅是明确性及法的安定性,同时也致意于: 在具体的细节上,以逐步的工作来实现‘更多的正义’。”因此,法官需要在个案中来考量一般性规则的适用,为此要考虑到适用情境的诸多要素,也包括裁判结果之社会效果关照下的公正观。反映在法官的义务上,就是要兼顾“个案正义”。司法裁判中的个案正义与一般的正义观念相比具有两个特征: 一则它是具体正义而非抽象正义,二则它是法律正义而非纯粹的伦理正义。一方面,个案正义是具体个案中体现出的实质正义。实质正义涉及实质价值或道德考量。实质价值或道德考量是有一定范围或受到限制的,它们应当来源于司法裁判所处国家或地区中流行的或符合大多数人道德观念的主流价值观或社会公正观,而非法官个案的公正观。但是,社会公正观又难以明确表述为或“编码为”一套明确的规则,它往往融合了社会不同层面的情理,是一种同理心正义。同理心正义是一种多元、动态正义。在此,个案情境尤为重要。情境的不同,决定了移情的经验和体验自然也不同,这就造成了司法公正内涵的复杂多样。个案正义的一个最为核心的特征,在于它的“个案性”。换言之,以个案正义形式出现的实质正义往往无法一般化和规则化的处理,它总是要面对每个不同个案的不同情况,面对事先所未曾预料的不确定性。建立在不确定性基础上的“因时制宜”“因地制宜”“因事制宜”的实践智慧、权宜考量和共情能力,正是司法活动中实质正义的重要特征。另一方面,个案正义是法律正义,它既要顾及社会的道德观念,也要顾及已经制度化了的价值,也就是得到法律制度支撑的价值判断,例如法典和单行法的总则部分所规定的基本原则和价值。

  

   因此,司法公正是司法领域的一种统合性价值诉求,既包括实体公正,也包括程序公正,既包括形式正义,也包括实质正义。

  

  

   司法人工智能的运行逻辑及其缺陷

  

   人工智能研究有大量不同的技术途径,其中得到最多研究、占据主导地位的两大途径是强力法和训练法。强力法的基本原理是: 第一,根据问题的精确模型,建立一个搜索空间; 第二,压缩搜索空间; 第三,在压缩空间中枚举所有选项,找出问题的一个解。强力法的基本前提是: 待解问题存在一个良定义的精确模型,且该模型默认为某种符号模型,以逻辑形式化、概率形式化和决策论形式化为主导模型。强力法又包含推理法和搜索法两种主要类型,搜索法是在状态空间中进行搜索( 如蒙地卡罗树搜索) ,推理法则是在知识库上进行推理,通常由一个推理机和一个知识库组成,推理机是专业团队研发的负责推理的计算机程序,知识库则需研发者针对不同应用自行开发( 专家知识库) 。训练法的工作原理是,用一个人工神经网络表示给定问题的输入输出格式( 元模型) ,然后用大量标注数据去训练这个元模型,即调整这个人工智能神经网络的连接权重,从而得到一个具体的亚符合模型。这种训练遵从数据拟合原理。训练集中的每个样本包含着已对输入值和期望的输出值,训练过程中反复比较被训练的人工神经网络的输出值与训练样本标注的期望的输出值之间的偏差,用监督学习算法调整元模型的参数( 即人工神经网络中的连接权值) ,努力让总体偏差尽量小。可见,强力法是用知识和推理解答问题,要求针对某应用场景编写相关的知识库,然后用推理机回答问题; 训练法则要求首先采集、制作训练数据集,训练出一个合格的神经网络,然后用该网络回答问题。

  

   强力法利用显式表达的知识进行推理来解决问题,所以是可解释的,而训练法利用人工标注的数据训练人工神经网络( 或其他隐式知识表示模型) ,用训练好的人工神经网络来解决问题,不具有可解释性。将强力法和训练法应用于司法裁判,就相应产生了两种人工智能运行方式: 一种是显式编码、封闭规则的算法,通过法律专家系统实现对人类法律推理的模拟并将之应用于司法裁判的决策; 另一种是机器学习算法,通过大数据分析训练,发现人类司法裁判的内在规律,并将之应用于对未来裁判的预测。后者是人工智能和司法大数据相结合的产物。

  

   在大数据时代,司法人工智能运行的基本原理是,将开放的司法数据通过自然语言处理后,输入机器学习的算法之中,然后得出一种或多种用于预测或预见案件胜诉或败诉可能性的模型。这个算法的目标并非复现法律推理,而是寻找判决中各个参数间的相关性。事实上,机器学习算法能做的,只是通过一种自动化的方式用多种预设配置将一组观测值( 输入值) 与一组可能结果( 输出值) 关联起来。它在组成司法判决的不同词汇组之间构建分类链接: 输入阶段的特定词汇组( 表征案件事实) 对应于输出阶段的特定词汇组( 表征裁判结论) 。它的基本原理近似于“讯飞”这样的机器翻译系统,只能在一组词汇和已经完成的译文之间对最佳匹配作可能的估计值,而无法真正“理解”所处理的句子的意思。强力法与训练法的区别只在于: 在前者那里,哪些输入值( 案件事实特征) 与输出值( 裁判结论) 相关是通过计算机程序或者说人为预先设定的,司法人工智能只负责按照设定的模型来进行计算; 而在后者那里,与输出值( 裁判结论) 相关的输入值( 案件事实特征) 由人工智能通过训练自行学习获得,至于是基于什么模型算法得到结果( 输出值) 对于外部来说则是不透明的。但两者的基本运行逻辑并无二致,即基于封闭场景进行价值中立的被动应用。

  

这也导致现有司法人工智能技术( 其实是一般意义上的人工智能技术) 具有如下三个特点: 一是封闭性。在推理法上,封闭性表现为: 存在一组固定、有限的知识,就可完全描述给定的应用场景。在训练法上,封闭性表现为: 可用一组固定、有限、带人工标注的代表性数据,完全描述给定的应用场景。因此,一个应用场景如果具有封闭性,则应用人工智能的强力法或训练法技术,可以保证应用成功; 如果不具有封闭性,则不保证应用成功( 也未必失败) 。二是被动性。现有人工智能技术不具备主动应用的能力,只能被动被人应用。即便是训练法中,人工智能具有所谓“自主”学习能力,甚至深度学习能力,那也只有在人类给定问题的输入输出格式,事先标注好训练数据集并在封闭性场景( 如“下围棋”) 的前提条件下的学习。这种所谓的“自学”完全由设计者事先安排好,并非通常人的自学。(点击此处阅读下一页)


爱思想关键词小程序
本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/137361.html
文章来源:《政法论丛》2022年第4期
收藏