返回上一页 文章阅读 登录

雷磊:司法人工智能无法实现司法公正

更新时间:2022-10-24 09:46:14
作者:
三是价值中立。也就是说,人工智能技术本身无所谓善恶,人对它们的应用方式决定其善恶。以推理法为例,推理机给出的回答会不会对人有害,完全取决于知识库是否包含可能隐含不良后果的知识。由于知识库由人编写,所以是设计者决定了推理法的具体应用的善恶。

  

   由上述不难看出,虽然司法人工智能具有人类法官不可比拟的优势,即数据搜索、比对、关联的迅捷性和准确性,但也具有不可克服的缺陷:

  

   首先是无法应对不确定性。人工智能技术应用成功所需的封闭性使其在面对非预期输入时具有脆弱性。强力法无法绕过人工建模,不确定性对强力法的三方面挑战也是对其建模的挑战:一是对象的不确定性。现实世界中,一个对象往往存在不可预测的很多“变体”,试图在建模中穷尽一个预期对象的所有可能应用场景中出现的所有变体,在工程上是不可行的。例如,尽管可为“正当防卫”建立典型案例,但却无法事先就穷尽正当防卫的所有情形。二是属性的不确定性。现实世界中,属性往往是含混的和场景相关的。一旦给出一种属性的任何良定义的形式化描述,就意味着人为限定了该属性的一部分可能场景,舍弃了该性质的另一些可能场景。因此,用形式化方法建模原则上无法保证覆盖实际应用中可能遇到的所有场景。例如,案件“情节恶劣”意味着什么?这类评价开放的概念很难被固定为数量有限的操作性标准。三是关联的不确定性。现实世界中现象是相互关联的,一个现象可在不同场景中具有不同属性,关联于不同对象,并具有无法预测的关联方式。人工智能系统的模型无法预测或描述现实世界中所有可能的关联,当人工智能系统在实际运行中遇到模型未表达的关联时,就无法有效应对。例如,推理模型可能将“向他人开枪”现象关联于“故意杀人”,甚至也关联于“正当防卫”,但却没有将“作战”或“执行死刑”这些关联包含进来。训练法绕过了人工建模,但它的性能依赖于海量数据及其人工标注的“质量”( 数据+标注) ,而这种质量的保证来源于“采样一致性假设”,也就是全体采样样本的概率分布和实际采样样本的概率分布之间的一致性。但实际采样可能未包含必要特征点,所以这个假设在实际应用中无法保证。司法裁判的场合就是这样一个非封闭性的场合,它要面对现实世界的诸多不确定性。

  

   其次是不具有人类常识常情。人类具有复合型的知识和复杂的推理能力,而这其中有很大一部分属于“通用型”的常识常情。一个人可能兼具多重身份,例如“法官”( 在裁判活动领域) 或者“棋手”( 在棋类比赛中) ,但他首先是一个“人”。不管他从事哪个领域的活动,除了专业知识和能力外,他还会将其作为人所拥有的社会常识常情带入它所从事的任何活动。这种常识和常情属于现实世界的、跨越任何专业领域的底层知识和逻辑,很多时候往往是默会的。但人工智能恰恰不具备这类常识常情,所以阿尔法狗可以战胜人类棋手( 因为这只需专业知识和对于胜率的计算) ,但却“不知道”棋子是不可以吃的。因为人与人工智能是完全不同的“物种”,两者做事的难易程度往往恰好相反———对人容易的往往对人工智能难,对人难的( 如下围棋) 往往对人工智能容易。所以人工智能下棋赢了人类,绝不等于人工智能在对人类更容易的事情上也能赢人类。所以在司法裁判活动中,哪怕是只需要常识常情作出判断的简单案件,对于人工智能来说也可能是难的,因为归根结底,目前并没有可以全盘模拟人类智能( 对常识常情部分领域加以计算的) 的通用人工智能。

  

   最后是无法进行价值判断。现有人工智能技术不会自主地形成“价值判断”,更不会基于这种价值判断作出决策。法律人并非将法律规则视为静态的法律表述,而是将它们视为用来追求特定目的的手段。相反,人工智能无法理解不同论据的“意义”,以及这些论据与特定结论间的“支持”或“反对”关系。尤其是在疑难案件中,法官往往要超越法律文本,进行复杂的价值权衡。价值权衡并非计算,无法被量化处理,也无法被代码化。所以疑难案件往往就成为算法系统无法预期和应对的异态。

  

   总的来说,司法论证包括两个步骤: 一是将结果性事实与原因性事实联结起来,二是将这种原因性事实涵摄于规范的构成要件,并将特定法律后果与之联结起来。两种联结分别涉及因果关系和归责关系。而司法人工智能其实是将这两个步骤化约为简单的数据关联,也即从结果性事实( 输入值) 与特定法律后果( 输出值) 直接联结起来,将之上升为通则性的算法规则。这种联结并不是“推理”,而是基于历史数据的预测。司法人工智能进行的预测又包括两种:一种是基于先前所有同类案件的历史数据来预测当下案件的裁判结果( 同案预测) 。至于裁决这些先前同类案件的具体主体( 法官) 是谁,对于这种预测来说并不相关。另一种预测是基于法院或法官个人裁判的历史数据来预测当下案件的裁判结果( 个性预测) 。比如商业公司推出基于法官“画像”的判决书大数据应用产品,也即利用法官过去对同类案件的判决轨迹对其裁判行为进行分析和预测。以下就分别对这两种预测与司法公正的关系进行论述。

  

  

   同案预测: 司法统一等于司法公正吗?

  

   同案预测是基于类案裁判之历史数据的预测。通常认为,司法人工智能有助实现同案同判,进而同案同判就表征司法公正。但这两个判断都不成立。

  

   ( 一) 司法统一即同案同判?

  

   如前所述,司法人工智能的应用原理是基于历史数据的预测。换言之,它将司法裁判的重心置于对过去裁判的模仿上,也即持一种历史决定未来的思路。而这种思路符合人工智能成果的技术条件必须符合的封闭性准则。具体而言,如果一个应用场景符合以下条件,则该场景对于强力法是封闭的: ( 1) 该场景的设计规范可以用有限多个确定的因素( 变元) 完全描述,而其他因素可以全部忽略; ( 2) 这些因素共同遵守一组领域定律,而这组定律可以用一个人工智能充分表达; ( 3) 相对于该场景的设计规范,上述人工智能模型的预测与实际情况足够接近。如果一个应用场景符合以下条件,则该场景对于训练法是封闭的: ( 1) 存在一套完整、确定的训练评价准则,这套准则充分反映了该应用场景的设计规范; ( 2) 存在一个有限确定的代表性数据集,其中数据可以代表该场景的所有其他数据; ( 3) 存在一个人工神经网络 ANN和一个监督学习算法,用该算法和代表性数据集训练ANN 后,ANN 将 满 足 评 价 准 则 的 全部 要 求。在司法裁判这一应用场景中,对于待决案件被裁决的这一时刻点而言,同类案件的历史数据是有限的。封闭性条件能够确保基于有限历史数据的裁判保持统一性,也即实现统一裁判( 司法统一) 。但问题在于,司法统一就意味着同案同判吗? 未必如此。关键在于何谓“同案”无法或不应由人工智能系统自身决定,这里既有技术方面的原因,也有理论方面的原因。

  

   技术方面的原因主要仍在于前文所说的不确定性挑战。这可以通过人工智能的运作模型来阐明。人工智能的运作模型涉及三层空间,即现实层、数据层和知识层。其中底层是数据层,就是人类的现实世界,是非常复杂、模糊和具象的。中间层是数据层,其中的数据是通过各种数据采集手段( 如人工采集和机器感知) 而从现实层获得的,这一层是抽象的、格式化的。在数据采集过程中,一部分信息被搜集起来,同时现实中无限多信息被丢弃了。在数据层上,经过人工建模或通过机器学习可以得到知识,知识是结构化的、包含语义的。在知识层上可以进行自然语言处理、推理、规划、决策等。[10]在此,从现实层跃升到数据层和知识层有两种方式,一种是通过人工构造,另一种是通过机器自主感知。

  

   在人工构造数据库和知识库的情形下,4数据库的完整性或者说采样的全面性会影响“同案”判断。因为机器裁判的可靠性很大程度上取决于它所使用的数据的质量和对机器学习技术的选择。例如,目前在机器学习的刑事案例库中,纳入到样本库的基本上都是有罪判决,而中国的无罪判决事实上非常低以至于“趋零化”。以有罪判决样本为基础构建起来的数据库,几乎不可能智能化地预测出无罪判决。换言之,决定哪些案件数据“纳入”样本库,从而成为机器学习样本的依然是具有主观意志的人。当然要指出的,“标注样本”只是经典训练法的特征。但大数据时代的训练法可能不再任何人工标注了。5但无论如何,在司法裁判中,训练法的应用总是要以司法案例库为运作基础,而司法案例库无论如何有赖于人类建立。在另一种方式中,智能机器人自主感知现实世界,获得数据,从中抽取知识,并利用知识进行理解、推理、规划、决策,产生机器人行动,并在现实层中加以执行。智能机器人的运行形成一个完整的闭环,也即从现实层到现实层,所以现实层包含的不确定性会对机器人产生不可忽视的影响。于此,人工智能系统在知识层形成的问题模型只能覆盖现实层的一部分,至多在其范围内产生正确解。而面对不在此覆盖范围内的非预期输入,很可能产生错误解,例如皮肤病诊断人工智能系统会将一辆生锈旧卡车“诊断”为得了麻疹。目前还有没可相比拟的“司法机器人”,能够直接感知( 听审) 现实案件并作出裁判,所以这条路径至少目前在司法领域还不可行。当然,技术问题之所以为技术问题,就在于它有被解决或接近解决的可能性。例如随着全样本案例库的建立,采样问题就可能会在相当大的程度上得到解决。再比如,随着深度学习能力的进一步提高,人工智能系统问题模型覆盖现实层的范围可能会越来越大。但只要通用型人工智能没有诞生,将“生锈旧卡车”和“麻疹”判断为同案的可能性就依然存在。

  

   相对来说,司法人工智能要面对的理论挑战更为根本性。理论方面的原因主要是“同判”判断本身的价值负载性。“同案同判”中的“同案”指的是“同类案件”,也即属于同一类型的诸案件。世上不存在两个完全一样的案件,并不存在什么固有的、实质上的或原本的“同案”。“同案”还是“异案”取决于判断的视角,而法律上的“同案”判断取决于法律的视角。因此,两个案件是否属于同一类型,主要看它们之间是否具备相关相似性,而相关相似性的判断标准则是由法律自身来提供的。法律不仅是语词的系统,也是意义的系统,它将特定法律后果归属于特定事实要件之下。所谓的“相关相似性”,不仅指两个案件事实层面上存在相同要素,也指两个案件在“这些相同要素与法律后果相关”的意义上被法律等同评价。而能否被法律作等同评价,则要依据法律文本背后的法律目的。相对于法律目的而言,对案件事实之可能描述的多样性要受此控制,即将为识别案件而进行的相关描述限于既有法律中已经包含的那些描述。“同案”就是可被涵摄于相同法律规则之下的案件,也即满足了同一法律描述的案件。[20]这就要求法律适用者理解法律文本的目的或意义。只有在法律所欲追求或评价的要点上具有相同意义,即意义同一性的,才属于同一类型( 同案) 。意义不是事物外在的物理特征,因而类型判断不是一种“物性的思考方式”,而是一种意义同一的探求; 不是两个案件的数个甚至全部的单列特征相同,而是由形形色色的特征组合构成的“整体性关照”。6

  

人工智能恰恰无法对意义进行整体性判断和关照。因为人工智能系统尽管可能实现数据的最佳匹配,却无法“理解”它所处理的语句意思。认知计算技术无法在人类阅读的意义上阅读文本,它具有的是智能处理文本的技术、识别与问题相关的那些元素的技术,(点击此处阅读下一页)


爱思想关键词小程序
本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/137361.html
文章来源:《政法论丛》2022年第4期
收藏