分享

人工智能与司法证明过程:来自形式主义和计算的挑战

 余文唐 2022-01-02

人工智能与司法证明过程:

来自形式主义和计算的挑战

摘 要

就实际法令的意义而言,法律规则与法院判决之间的冲突广为人知。这种冲突关系同样存在于事实认定之中。法律几乎贯穿了人类活动的所有方面;人与人之间的任何互动都可能会导致法律冲突。对这些纷争进行准确的事实认定是恰当贯彻实体法要求的必要前提保障。若事实认定缺乏准确性,法律就会变得不可测,继而人们便无法高效地按照法律规定行事。法律事实认定之于准确性和可预判性的需要促使了人们去探寻适用于这项任务的形式化工具。众多形式化工具之中,贝叶斯定理和期望效用理论(贝叶斯式或统计式决策理论)已被检验。可惜二者并无法很好地与诉讼相契合,进而引发了对其它替代方案的探索与检验,其中以案情故事模式和相对可信论为典型。本文将依次探讨这些问题,展开论述美国传统法庭审理的基本架构;审视庭审与贝叶斯定理、期望效用理论等形式化工具之间的不和谐关系;并介绍相对可信论——一种阐释司法证明本质的理论。

本文作者

Ronald J. Allen

美国西北大学法学院John Henry Wigmore法学特座教授、中国政法大学证据科学研究院外国专家咨询委员会主席。

本文译者

汪诸豪

中国政法大学证据科学研究院副教授,美国西北大学法学院S.J.D.候选人。

原文载于美国《人工智能与法律》杂志第9卷第99-104页(2001年)[Artificial Intelligence and Law 9: 99–114, 2001]。本译文载于《证据科学》杂志2020年第5期。感谢杂志社授权转载,亦感谢中国政法大学证据科学研究院谢执萱、战思伯和谢明豪三位研究生为本文翻译提供的协助。

目 录

1.庭审的性质与“证据”的含义

2.证明的法律规定:证据规则

2.1. 对不确定性的规制

2.2. 相关性和实质性

2.3. 多重政策考量

3.形式化与法律程序之间的艰难关系

3.1. 期望效用理论

3.2. 贝叶斯定理

3.3. 还有什么选项?

正 文

文明国家中的法律涵盖了人类行为活动的方方面面。每个人的每个行为都笼罩在一张由宪法、法规、条例、判例法、行政命令、规章及其它规范制度织起的庞大规则网中。这张规则网的结构和内涵是多元的。其既创设了我们之于他人的权利,也确立了对他人的义务;其既允许我们有权利行事,也禁止一些所作所为。其网络分布纵横交错,既有法典内部规则之间的交织联系,又有各独立权力机关颁布的不同法规之间的相互援引,以及不计其数的例外规定。有些法律规定的要求清晰且明确,也有些规定是模糊的;还有些法律之间存在语言表达或概念逻辑上的不一致。这张规则网除了包含各类正式的法令,还提供了可用于人与人之间互动所导致的几乎任何冲突的解决方案。即便是最平淡无奇的日常行为也可能会引发亟待解决的重要法律问题。例如,一位母亲喂孩子吃麦片,却没料想到当孩子吃完后竟发现麦片盒底有一根老鼠尾巴,美好的早餐就这样成为了一场诉讼的开始;一名司机迎着阳光驾车行驶在熟悉的道路上,忽然感觉光线刺眼,于是伸手去拿太阳镜,结果撞倒了行人,熟悉的日常通勤却引发了一起法律纠纷;邻居张三把车停在离我家车库很近的位置,令我很难进出自家车库,邻居李四在深夜大声播放音乐,二者都可能会导致待由官方来解决的法律纠纷。

由于任何人的任何行为(及诸多不作为)都可能会产生亟待官方解决、牵动个人生命和财产权利的冲突,因此有必要明确法律,将法律的要求浓缩为一系列必要和充分条件以便权利和义务事先可知,从而弱化任意性的可能。然而,对于权利和义务之官方解释的需求范围远超任何人类机构的供应能力。我们的世界过于复杂,复杂到规则并无法将其牢牢框住。在美国,最好的例子便是IRS国税局意将税收工作悉数收纳于一部包含必要和充分条件的复杂法典,并为之付出了努力。然而这一努力已然宣告失败。只要针对法典或规章的修订一出台,税务律师和会计师就会很快找到相应的方法进行避绕,进而又会引发更多的修订和补充,以此类推,循环往复。即便是仅针对某一微小的法律领域进行修订且有大量资源投入的情况下,要实现法律明晰的愿景已被证实不可能实现。现实中的折中处理方法往往如经典法律术语所言——“情况不言自明(res ipsa loquitur)”。

那该如何解决这个问题呢?我们只能在很大程度上视法律制度及普通法的发展(包括纯粹意义上的普通法和由法条解释驱动的普通法)为一种事后程序,而非简单的预先形成的明确规范。面对无从预期的发生案件,明理之人(通常指法官,有时也包括陪审团)应当运用其天生的认知能力,主要通过类比推理的方法得出关于案件事实的结论。但是,类比推理并非无懈可击。一起关于麦片里夹杂老鼠尾巴的案例可能会对下一起涉及掺杂物案件的审理起到决定性影响,但是下一起案件中可能存在着有别于上一起案件的特性,以至于二者存在本质的区别,依此类推。[1]所以,法律在永无止境地寻找下一个好用的类比案例,以试图减少(即便不可能消除)事后制定规则的问题(之所以成为一个问题,是因为其违背了法律的核心愿景,即事先规定好每个人的权利和义务,以便人们有时间去适应并遵守)。

需要引起注意的是,此处描述的复杂性由两部分组成。其一是标准计算的复杂性,法律的形式复杂性令人生畏。其中还有更深刻的概念问题,即问题不仅关乎于现有官方规定的含义和彼此之间的关系,而是未来会出现的许多规定在当下根本无法被预测,也不可能被想到。它们只会伴随着被卷入法律系统的五花八门争议的出现而出现。这种局面使得法律无法形成制定新标准的体系化理性机制,也解释了为什么在法律中有这么多关于法官自由裁量权和个案判决的援引,以及为什么“先例”的概念充满了模糊性。

尽管人工智能不是我的专业领域,但显然已有越来越多的公开发表文献(例如通过加深我们对类比和基于案例之推理的本质理解)或可揭示法律体系中规范的形成方式。这会潜在帮助到法律研究者们更好地理解诸如“自由裁量权”、“裁判”和“先例”等术语的可能含义,尽管由于人类情境的复杂性这将会非常困难。本期专刊旨在聚焦日前人工智能和法证领域已完成的研究工作,以及形式化建模对理解司法证明性质的可能贡献。我很高兴获悉这些进展。用本期专刊组织者的话来说,聚焦“人工智能和形式推理的范式在法律证明活动中的应用”对于法律程序而言或有至高的价值。与上文所提的法令形成过程相比,证据规则直接作用的庭审证明阶段有着更多的模糊性、不确定性和开放性。美国每年都有数百万起纠纷进入到诉讼程序,却没有任何两起案件的所涉证据是完全相同的,并且案件之间的细微差异可能会导致完全相反的推论。

此外,由于裁决案件人员(法官或陪审员)的自然学习过程,影响庭审决定做出的相关信息在不断变化。试想某人被邀请去裁决去年和今年各一起案件。在此期间,他有大量机会进行学习和反思,进而对今年的案件裁决产生了一些观念性的改变影响。这一概念性要点一直是司法证明系统化的一个主要障碍,原因就在于任何事项的有效系统化显然都必须要先能预判个体如何学习以及学习到了什么。尽管如此,由于缺乏看起来如同“规则”的系统化证明程序,人们就会担忧审判结果的变幻无常,进而加剧了对法律无法提前明示要求的忧虑。这两种担忧似乎都有可能会导致不可预测和异常的审判结果,与法治的精神背道而驰。因此,人工智能在此方面能提供的任何辅助都必将会大受欢迎。

还有第二个更本地化的问题阻碍了司法证明形式主义的发展,这就是美国案件审理的某些特定属性阻碍了贝叶斯定理——一种很有前景的形式主义——在法庭审理中的应用,也使得其它前景被看好的形式主义(如预期效用理论)在司法程序中的意义变得不确定。贝叶斯定理与庭审的关系是布莱克斯通出版社《证据与证明国际杂志》最近一期专刊的主题。我是该期专刊的特约编辑并提交了一篇主题文章,尝试论证贝叶斯定理在庭审中应用的难点。我认为主要困难在于主观贝叶斯主义的形式要求与美国传统庭审的架构不兼容。由此引出一个基本观点:即任何对证明过程制度化的努力都必须要充分考虑进实际法庭审理的架构和运行流程并要与之兼容,亦或要能提供替代现行庭审模式的机制。因此,对于那些在“人工智能+法律”领域工作的人来说,理解庭审的本质十分必要。理解法律是如何回应我的上述担忧或许也会有所裨益,同样有帮助的还包括对现存描述性或规范性的法律形式化理论摇摇欲坠命运的理解。下文将逐一讨论这些要点。

1.庭审的性质与“证据”的含义

庭审中的事实认定者在审前大多对案情不了解。陪审员们尤其如此,法官的情况会略有不同。陪审员大体上将会对案件所适用的法律和庭审中将出示的证据材料毫不知情。法官会知晓或是有能力确定有关法律,并有可能会对涉案材料有些许了解,但这种了解的程度因案而异。在审前程序发达的民事案件中,法官可能会对案情了解得相对多一些;而在刑事案件中,法官会和典型的陪审员们一样知之甚少。

无论是法官的审前指示还是控辩双方的开审陈述都不会导入大量实体法知识。[2]陪审团通常会被告知案件所涉及的法律指控,但不会了解到指控的各项证成要件。在某些情况下,他们会从自己的生活常识中了解其中部分要件;但在许多其他情况下,他们基本上对此一无所知,例如涉及到复杂税法的民事诉讼诸要件。

开审陈述只会引入极少的法律专业知识,该环节的作用通常是对接下来庭审中各项证人陈述的简要介绍。虽然律师在开审陈述中会讲述一个关于案情的故事,但无论是诉讼当事人还是事实认定者都不受此约束。正如某次庭审中法官给陪审团的指示:“我们在正式开始接触案件证据之前的最后一件事是律师有机会向陪审团发表开审陈述,这是律师对于庭上所示证据将要证明之事项的简要概述。当然,有时庭审中证据的展开会和律师预期的不一样。”[3]

许多情况下,典型的前后证据不连贯始于零散的证据展示,即没有人在庭上讲述一个完整的故事。常见的情况是,零零散散的证据拼凑在了一起。交叉询问往往是以间接的方式形成疑点:

“最后,有效的交叉询问往往是通过运用暗示和影射。没必要向证人提出'终极问题’,而且这样做往往会对提问方有害。结案陈词环节才是你方指出各项事实之间联系、揭示表象背后的实质并根据诸多细节描述积累得出结论的机会。”[4]

重点是,事实认定者直到庭审结束时才能够对证据进行有效评估。

证据展示程序的末尾是结案陈词环节。只有在该阶段才能够清晰且详细地呈现当事方的各项主张。律师们各自阐述心中的案情事实,并提示已展示的证据佐以证明。构成结案陈词基础的除了庭审中已作的陈述,还包括那些可以合理推断出的言外之意,以及从整个庭审过程中得出的合理推论。此时律师有机会对交叉询问环节中所提微妙问题的含意进行提升和检验。从本质上来说,双方当事人都会声称,庭审中所示证据能够更好地反映出本方的案情主张。

法官下达最后的陪审团指示后,事实认定的“审议”开始,该过程或由陪审团协作完成或是法官孤军奋战。“审议”通常是指从陪审员的个人角度出发去分析证据,直至陪审团中所有人就所发生之事达成共识。作为事实认定者的法官和陪审员在初期的做法中是共通的。无论是法官审还是陪审团审,事实认定者都必须首先要站在自己的立场上对证据进行回顾,并至少要对争议事件做出初步判断。在陪审团审中,这种个性化的评估之后便是集体讨论,以期达成共识。在对证据的独自考量和群体审议两个层面上,巨量的知识和信念会被用于理解证据的意义。证据本身并不会开口诠释其含意。这些含意来自于被正式称作“证据”的信息与事实认定者个人价值观之间的相互作用。因此,将证据与庭审中出具的信息材料画上等号是个错误。实际上,它是事实认定者对庭审中所示信息的评估与其在评估过程中调用的个人价值观中大量“证据”储备相互作用的产物。[5]

法庭上的每位决策者都拥有自己的价值观,因为世上没有任何两个人过着完全相同的生活。因此,就如法律大多为事后规制,关于事实的认定很大程度上也无法预先知晓。事实认定的形成是决策程序的结果,这意味着证据的内含在许多情况下(实际上是大多数情况下)是预先无从得知的。因此,将形式化的推理方法论应用于庭审中“证据”的尝试有扭曲事实重构过程的风险。该过程是富有创意的,而非静态不变。几乎在所有情况下,某一特定证据的提出并无与之捆绑的特定含意。请考虑以下例子:

1.辛普森案中,尼可·辛普森家门口的血迹到底是暗示着辛普森犯了罪,或是警察为了构陷辛普森而人为制造的场景,其实他并未杀人?

2.一位证人在作证时汗流浃背、言辞结巴。这是其说谎的证据吗?还是说一位诚实的证人被肃穆的庭审程序吓破了胆?

3.四位证人在法庭上分别讲述了他们的“亲眼所见”,所述内容大抵相同。这到底是每人的讲述互相印证,还是说该情况证实了该些证人是想通过合谋来掩盖真相?

诸如此类。

因此,法律“证据”不同于对照实验中的科学“证据”,而是更接近于科学领域中代表互为竞争关系理论的“证据”(提出是为了促进理念的改变)。庭审中的证据与对照实验中得出证据之间的差异至少有两方面。首先,在对照实验中,数据本身通常没有问题(例如:气泡室中有或者没有可观测到的痕迹),容易出问题的是对数据的解释。而在案件审理中,不一致的原始数据是常态(“灯是红色的”—“不,是绿色的”),并且通常不可复制。其次,科学知识通常是以“假设——演绎”方式组织起来的。即便是那些提出互为竞争关系理念的科学界专业人士,通常也会与他们的竞争者分享方法论和数学原理,对于何为证据的问题上看法一致,并且能够全面地表达他们的分歧点在何处。

现在我们看到了事实调查在法律程序与科学研究中的重要区别。科学研究通过控制尽可能多的变量来实现对现象的简化。相比之下,对日常事件的主观判断很少能作为对照实验的结果予以重塑。有太多的变量在持续、必然地发挥作用。

因此,我们得出了一个与直觉相反、但我相信是正确的观点,而且我希望人工智能领域的专家们也能认同:即日常生活中的信息比科学知识更复杂,而非更简单,原因是其涵盖了人间百态。[6]面对如此广泛而棘手的模糊性,法律放弃了对证据理论的形式化努力,而只是简单地在一定程度上规范了什么是证据及其含意,且大体接受现状。若所提数据能够影响到事实认定者对案件结果的判断,那便是证据。其是否会影响到事实认定者则取决于该人在做决定时的人生阅历,此时的阅历包括了诉讼双方律师试图引导事实认定者关注庭审中出具材料的含意以及庭审中形成的其它所有观察。正如我在其他文章中提到的以下观点:

“证据不再仅被看作是传统理论上认为的一组数据或信息,而是事实认定者得出关于过去结论的过程。其归结于这样一个命题:一名无利害关系的事实认定者在做出决断的时刻基于其当下掌握的全部观测来重构过去。这一说法看似平淡无奇,但亦有惊艳之处。司法证据理论的精彩在于对两方面的认可:(一)在常规事项上必须要根据官方既定的框架行事,别无选择;(二)收集到必要信息以便准确重建过去发生事件的可能性提升不止与庭审中所呈现证据数量的增多有关,也和事实认定者人数规模的扩大有着重要关联。每位事实认定者本质上都是独自求解的探索者,为了减少一般意义上的模糊性而不懈努力。对于这种模糊性的处理与科学上变量的处理是不同的,因为试图就其概况达成明确的一致意见会消耗过多的资源,因此我们不会专门组织攻击其模糊性。但当涉及模糊性的争议出现时,我们会召集一小群人,从一人(法官)至十二人(传统意义上的陪审团),汇集所有成员的知识和智慧去理解所提证据。鉴于缺乏以科学模式构建常识的社会正当性,法律通过召开一场由普通人组成的求知会议,并要求他们在一起深思熟虑足够长的时间以达成一致的看法,进而实现类似于科学求知的结果。”[7]

2.证明的法律规定:证据规则

然而,普通事实认定者(非科学家)的求真套路是值得研究的。其是一种部分主动、部分被动的思维活动。事实认定者在庭审结束后的审议阶段相当主动,因为每名陪审员需要运用自己的知识和理解来解决眼下的问题,并且陪审团实际上可以就事实疑点进行公开讨论,在此意义上,陪审团审议期间的讨论也成为了案件的证据。相比之下,事实认定者在正式庭审听证过程中则显得相当被动。美国传统庭审听证环节中的陪审团几乎是完全被动的,甚至连提问都不被鼓励。虽然该传统正在经历缓慢改变,如一些州正在尝试建立更为积极的陪审团,但普遍做法依然是陪审团被动听证。

向陪审团审中的普通事实认定者或法官审中的审判法官所提供的信息,很大程度上(但不完全)是当事人双方希望提供的信息。因为证据规则的关系,当事人双方在庭上可出示的证据是受限的,同时这也是对本文开头探讨的担心出现异常审判结果的法律回应。笼统来讲,推出证据规则的三大动因是:通过证明责任、推论和推定等决策规则来规制不确定性;通过相关性和实质性的要求来规制情感、偏见和其它从准确事实认定角度来看为潜在不合理干涉的诱惑;以及独立于准确事实认定考量的各种政策推进。下面我将依次讨论这三个方面:

2.1. 对不确定性的规制

法庭上的决策始终是笼罩在不确定性阴影之下的决策。人们普遍认为,在面对不确定性时,应当由法律来左右如何决策,而非任由每位事实认定者个性化地决定。这就导致了人们通常会提炼出一条简短的规定(或一套简要规则)和一组富有说服力的先前判例来从不同方面去规制这种不确定性。在最基础的层面上,实体法上的每个诉讼事由都有相对应的证明说服责任来具体说明事实认定者做出裁决所必须要被说服的程度(以及举证责任,一个重要概念,但由于本文篇幅所限在此无法展开阐释其含意)。民事案件中的基本证明说服责任标准是,诉因的每项要件都必须要由原告证明达到优势证据的程度,即通常解释为可能性大于0.5。出于种种原因,该项民事基本证明标准有时会被修改,时而提高、时而降低原告的说服责任。此外,有一些议题被定性为是辩护,因此在这些议题上的说服责任要转由被告来承担。刑事案件中,由于宪法上的要求,检控方必须要能证明罪行的每项要件均至排除合理怀疑的程度。尽管如此,如同上述民事案件证明责任倒置的情况,刑事案件中的某些议题亦被视为辩护,其说服责任通常要由被告承担。

不确定性也可以通过一套针对推论的强有力法律说明来进行规制,明确建议事实认定者(无论是法官或陪审团)要进行特定的推论。之所以这么操作是因长期以来,人们逐渐形成了这样一种想法,即事实认定者总是会误读某些特定证据的含意,赋予其的权重总是会出现偏差(过高或过低)。推论说明的出现意在引导事实认定者做出系统在总体上认为是正确的决定。例如,人们通常有意为自身的行为负责,因此某人占有最近被盗物品的事实可得出其了解该物件被盗特性的推论。

除了在笼统的层面上直接分配证明说服责任并给出有关推论的说明之外,法律还通过设置推定来对证明程序进行更为精细化的调整。常见的方式有以下两种,即改变证明说服责任的标准或是仅在发现特定事实的情况下才给出非标准化的推论说明。举例来说:通常情况下提起违反合同诉讼的人必须要能证明订立合同的要约和承诺。而在美国一些州,通过邮寄信件接受合同订立意味着说服责任转移至对方当事人,其有责任证明该封信件未予送达,因此合同并未生效。而在美国另一些州,邮寄出了这样的信件可以产生以下推论说明,即有好的理由相信有效合同已经形成,因此也就给了事实认定者这样的推论建议。

通过运用推定可对事实认定过程形成大幅调整,但所有这些调整都是出于同一考虑,即相比于启用推定而言,若不启用该推定,事实认定者更有可能会做出政策制定者认为是错误的决定。[8]因此,证明说服责任、推论和推定三者都是对理性决策过程之担忧的直接回应。然而,这其中存在着一些难题,我将在下文中继续进行阐述。

2.2. 相关性和实质性

对证明过程的第二组限制来自于对证据的普遍要求,即庭审中提出的证据必须要与待证事项有关——相关性要求,并且该证据要证明的主张之于案件诉因而言必须是重要的——实质性要求(美国《联邦证据规则》401)。证据是否具有相关性,首先取决于审判法官的良好意识判断。如果审判法官没有被说服证据具有相关性,则其有权排除该证据;其次,证据一经采纳,基本上陪审员们就被赋予了自主决定该如何使用该证据的权力。一项主张是否具有实质性则取决于具体案件所适用的实体法。通过这两项相互关联的要求,审判法官可以排除掉与诉因没有逻辑关系的证据,因为审议这些证据只会浪费司法资源并得出错误的事实结论。根据现代法律的精神,这些决策由审判法官自行定夺。确实有些先前判例在一定程度上限制着审判法官的这种自由裁量权,但幅度并不大。因此,很大程度上这种对证明过程的规制形式取决于行为人的判断。其只是用法官的判断代替了当事人的判断而已。

根据美国《联邦证据规则》403,“当证据的证明价值实质上低于其所造成的不公正偏见、混淆问题或误导陪审团、过度拖延、浪费时间或不必要地证据堆积等危险”时,审判法官亦有权排除掉相关证据。这项有趣的规定结合了“实质上低于”说法的证据采纳排除引导和对庭审法官自由裁量权的另一种认可。审判法官可以基于以下信念排除证据:即认为该证据存在曲解而非促进事实认定过程的实质风险。同样的,少数案例判决中形成了关于该条款内容含义的先例,但从总体上来看该项规定就是将对于这些问题的判断权分配给了庭审法官。

相关性和实质性基本原则激活了一系列特定的证据规则。例如,实物(非言词)证据必须要通过鉴真的一般要求(即表明其的确为其所指)(美国《联邦证据规则》第九编)。另一个例子是最佳证据规则(如果文件的内容事关重要则必须要在法庭上出示原件,除非另有规定)(美国《联邦证据规则》第十编)。传闻证据规则的多个方面显然也是受相关性驱使(美国《联邦证据规则》第八编)。例如,脱离语境的陈述可能会产生误导,传闻证据会加剧这种风险。还有些证据很可能具有特定的相关性或偏见影响,因此一些规则明确地采纳或排除该些证据(美国《联邦证据规则》609,412-415)。但是在现代证据法典中,这样的规定寥寥无几。

2.3. 多重政策考量

现代证据法典中,对证明过程的调整实际上更多是出于各种政策考量而非相关性的原因。与之相对应的是,审判法官对证据的自由裁量权也在相应减少。传闻证据规则部分是受相关性驱使,另一部分则是出于政策性考量,尤其是在刑事领域,人们对当庭对质的重要性深信不疑。一系列证据排除规则推进了特定的政策,例如排除关于近期维修的证据以鼓励事后修缮,排除提议和解的证据以鼓励庭前和解,排除性骚扰案件中有关受害人先前性行为的证据以鼓此类起诉的提起,排除有关保险的证据以消除陪审员们从丰富的财富资源中“揩油”的动机等等。有时候,法律还会通过采纳证据的规定来敦促有关政策目标的实现。例如,令人感到遗憾的美国《联邦证据规则》413-415允许采纳被指控性侵犯之人的过去性经历,甚至不论其相关性或偏见影响如何。

此外,现代证据法典中普遍存在一组合理且生机勃勃的特免权规定,其主要目的是为了促进和鼓励某些特定关系的维系:夫妻,医患,心理诊疗师与患者以及神职人员与忏悔者之间的秘密交流受到保护。美国各州还有许多其他自行创设的特免权,诸如新闻记者特免权、商业秘密和投票特免权等等。

3. 形式化与法律程序之间的艰难关系

近年来,各种形式化理论频频问世,用以描述或规范法庭事实认定的决策过程。其中有两种理论的内涵获得了深入挖掘,但结果却有些令人失望:即作为解释证明(说服)责任的期望效用理论和作为证明理论的贝叶斯定理。第三种有关证明过程的微观经济学分析理论尚处于起步阶段,在此不作进一步讨论。[9]

3.1. 期望效用理论

证明(说服)责任似乎很容易就可以找到理论进行解释。在任何特定案件中,真相都鲜为人知,否则就没有必要举行庭审了,而且有大量案件待决。若将这一实际情况视为呼唤最大化的期望效用,确实没有违反常识。再者,简单的计算就能生成期望效用最大化的规则。在涉及二元选择的案件中,如果误判的负效用是相当的,那么胜诉的一方就应该是(诉讼主张为真)概率较高的一方,这就是民事诉讼中的0.5规则。在涉及两种以上可能解释的案件中,判决应与最有可能为真的解释保持一致。如果误判的负效用并不相等,例如刑事案件中,错判比错放的后果被视为要严重得多,那么就应该调整决策规则以适应这种差异性。如是而已。[10]

然而,数学世界与人类事务世界之间的关系并非如此简单,而是存在着问题。首先,在其目前版本中,尽管期望效用理论可被用来批判法律,但其实际上并没有在描述法律。法律将证明说服责任适用于诉因中每项要件的证明,而非就整体案由而言。期望效用理论却将二者混为一谈,好似审判中的问题就是被告有责任还是无责任。从某种意义上来说,的确如此,但只有在说服责任适用于诉因中每一项要件之后才会这么做。将适用证明说服责任解释为对每项要件的概率测量法则会产生广为人知的证明悖论。例如,如果两个独立的随机问题均被证明至0.6的概率(可能性),那么二者同时发生的概率就只有0.36。在此情况下若做出对原告有利的判决则不能实现期望效用的最大化。

难题还不止于此。支持期望效用理论的学者们可以通过批判法律来回应上述悖论,并主张需要证明至特定程度的是各项要件结合后的整体诉讼事由。然而,这同样会产生不可接受的结果,因为这使得特定要件的证明标准取决于诉因的要件数量这一偶然性因素。对此我最喜欢举的例子便是盗窃罪与谋杀罪的比较。盗窃罪的要件数量远远多于谋杀罪。因此,根据上述理论,若要定盗窃罪,对犯罪意图(即盗窃的意图)的证明标准平均而言就要比定谋杀罪中的杀人意图证明标准还要高。这一结论会令所有法律界人士感到荒谬且不能接受。在本文末尾部分,我将会提出针对此问题的可行解决方案。

期望效用理论还存在第二组问题:其最简单(且最广为人知)的表达模式忽略了基准概率和概率评估的准确度,并且混淆了一个基本概念,即法律系统要最大化的并非是法官和陪审员们的主观期望。相比之下,在其更为复杂的表达模式中,也并未就对这些问题的考量如何能促进法律系统目标的实现做出合理解释。此外,这两种表现形式均忽视了我将在下节中讨论的主观概率中的某些含意。

法律系统涉及由第三方决策者(法官和陪审团)来落实人民的旨意和期盼,或从低一层次来说是在执行政策制定者(立法者和制宪者)的意图。因此,需要最大化的是政策制定者的效用,而非法官或陪审团的效用,且二者可能恰恰是南辕北辙。举例来说,由于缺乏基准概率和概率评估之相对准确度的信息,对于事实认定者而言,期望效用理论的教训非常直白。然而,政策制定者可能会认为其掌握有这些信息,而且在其眼中,这些信息会显著地影响预期结果。打个简单的比方,如果没有事实上有罪的被告人参加审判,那么唯一可能发生的错误就是误判有罪(阳性错误)。提高证明说服责任标准只会增加政策制定者的期望效用,无论这对于事实认定者的期望效用来说意味着什么。类似地,政策制定者们可能会认为事实认定者们的概率评估存在一定程度的系统性偏差,从而就会产生同样的问题(即事实认定者的实际出错率与政策制定者的预期理想值之间存在偏差)。

这个问题至今没有令人满意的解决。法律领域内支持期望效用理论的人们只是简单地主张有关基准概率和概率评估准确度的信念本身可在形成主观概率时予以考虑。确实如此,但是很难看出这种说法会有什么程序性影响,因为向事实认定者发出这样的指示将会对其评价证据造成不可测的影响。任何事实认定者都可能会高估或低估被告有责任的概率,而对于系统性信息的了解可能会导致差异巨大的调整。

然而,在这些情况中,法律并不会袖手旁观。实际上,推定和推论的要点之一就是要基于这些顾虑来调整事实认定的过程。这种调整措施的运用会非常慎重且与之相伴的是健康的自我怀疑精神和对事实认定者地位独立性的合理尊重。当然,若期望效用理论仅仅是在主张其提供了讨论这些问题的另一组用词,那当然没有什么可反对的,但如此一来该理论也就没什么特别的贡献价值了。

3.2. 贝叶斯定理

正如证明责任领域看似适合开展决策理论分析一样,庭审中的证据出示过程似乎也适合运用贝叶斯定理进行解释。诚然,认为通过了解证据来认定案件事实的过程就是根据新提供的证据来更新先前关于事实的既有看法是非常自然的。然而,实践和概念之间存在着一众难题。

实践中的主要困难之一在于计算的复杂性。大多数庭审,即便是最“简单”的庭审都包含着庞大而复杂的数据集。没有任何一台计算机拥有这般算力可在合理时间内完成必要的运算以运行贝叶斯定理,更何况是人了。贝叶斯定理的支持者们对此有两个层面上的回应。首先,这个世界如此复杂并不是他们的错。这确实不是他们的问题但也是他们的问题,因为在庭审的情境下,贝叶斯定理会如何指引我们探索未知世界,这一点并不明确。其次,他们主张贝叶斯定理并没有指明分析的单元是什么。因此,事实认定者可以将一集束的事务合而为一来考虑,并将这一集束事务视为一项“新证据”来更新先前对事实的既有判断。[11] 可能的确可以这么操作,但所有的智力工作都会集中于对“集束”的整理。因此,在这种表达方式中贝叶斯定理本身并不是非常有帮助和有吸引力。

概念上的问题更加深刻且棘手。其中有两方面的困难,第一个难点直接源自于庭审的性质。回顾上文中对庭审的描述。直至庭审结束前的结案陈词环节,事实认定者们对于案件究竟发生了什么缺乏良好判断。此外,控辩双方的结案陈词内容并不受法律上的限制,因此他们可以自由地就事实情况陈述各自的版本。这其中有两层蕴意。其一,一旦事实认定者在结案陈词环节听闻了多个事实版本,为了实践贝叶斯定理,其就必须要对各版本进行概率赋值。但是那些概率将根据庭审中已呈现的证据进行赋值,因而所有那些证据都是所谓的“旧证据”,即其都已经被考虑过了。其二,即便遵循最初的概率赋值,在事实认定者审议阶段也可能会产生关于案件事实的新解释。根据贝叶斯定理,因为新解释的诞生,所有可能的事实版本之初始概率都需要重新进行赋值,如此一来旧证据的问题就又出现了。因此,贝叶斯运算的可行范围是非常有限的。[12]

概念性问题的第二个方面出自于对初始概率的赋值。这些赋值是主观的,需要遵守的条件仅仅是一致性及赋值之和为1.0的要求。这意味着不同的人在赋值问题上的出发点可能会大相径庭。而根据贝叶斯定理,每个人都是在同等理性地实践。贝叶斯定理并没有提供裁判这些不同之处的方法。在其他情境中,例如科学,这些差异可以通过整合定理的办法来进行边缘化处理,表明随着时间的推移和足够多新证据的提出,最初观点之间的分歧会逐渐消除,而结论将聚拢于真相。可惜这与庭审的情况大不相同,因此不具有参考性。在首次面对新的事实版本说法时,陪审员的角色的确如同科学家(需要去探索真相),但是他们不能像科学家一样随着时间的推移形成大量的证据专门用以裁决互为矛盾的科学理论版本之间孰是孰非。若没有机制可替代整合定理的步骤,主张在法律领域中适用贝叶斯定理的论断也就缺失了可连接主客观之间的明显桥梁。[13]

还有其他形式化上的问题。萨维奇的主观概率形式化包括了“确定性”原则,这是生成主观概率和客观概率互换的关键公理。[14] 换言之,该公理主张在一系列关于性质的假定中如果行动A比行动B更有可能发生,那么该组假定就不应该造成偏好的逆转,即行动B比行动A更有可能发生。例如,若给你一份菜单,且比起火鸡你更喜欢吃鸡丁,然后告诉你这家餐厅还可提供烤鸭,若此时你改口说“加上这个额外信息后,我现在要把刚才的点餐改为火鸡”,这就是对萨维奇确定性原则的公然违反。[15] 不幸的是,人们时常在违反这个公理。假设你认为在准备火鸡时需要非常小心地使用烤箱,否则就可能酿成火灾,而你点了鸡丁就是因为你不想冒这个风险。然而,烤鸭是非常难准备的。得知菜单上还有烤鸭后,你对厨师的能力有了更深的信任,因此不点鸡丁而改点火鸡了。这违背了塞维奇的确定性公理。人们常常违背这个公理是因为其要求在同一个概率空间里阐述所有的逻辑命题。即便是在一个被高度限定的空间里这也是艰巨的任务,而当概率空间需要覆盖所有人类事务时,这就变成了一项不可能完成的任务。对于团队决策而言,这是个尤其棘手的问题。正如萨维奇本人所言:“这并不奇怪,举例而言,如果就在宴会主办方即将决定吃鸡丁时,临时又得知菜单上还有白鹅宴,最终妥协决定了今晚吃烤鸭。”[16]

3.3. 还有什么选项?

目前,司法证明贝叶斯论的主要竞争对手是相对可信理论,即认为法律上事实认定主要是决断诉讼双方在庭审中提供解释版本的可信性问题。在民事案件中,事实认定者的任务是要确认有关案件相关事实的最可信阐述,而在刑事案件中,检控方必须要能够提供被告有罪的阐述且没有关于无罪的可信解释。[17] 尽管相对可信论中有许多细节值得深究(包括事实认定者并不受制于当事双方提供的事件版本),总体而言该理论中的归责架构是由各项诉因要件提供的,但这与证明过程不同,后者很大程度上是在比较当事人双方提供的事实主张。一旦有关事件的最可信阐述得以确定,也就可以从法律的形式架构中演绎性地得出责任归属。相对可信性论主要是分析性的,但其与彭宁顿和哈斯蒂在陪审团决策方面的实证研究成果密切相关。[18] 其亦与通过运用联结主义方法来进行假设比较的研究成果密切相关,如保罗·塔加德的研究。[19]

相对可信论的优点包括但不限于如下几点:

1.其解释了控辩双方在庭审中实际在做的事。

2.其规避了贝叶斯主义的形式化难题。

3.证明悖论的问题被边缘化,因为这些问题被均分给了争议的双方。

4.计算复杂性的问题在很大程度上得以消除,因为诉讼关注的是当事人所提供案情版本的连贯性和合理性,而非离散的个别证据。

5.该理论包含有多种解释(包括贝叶斯理论在内),尽管它的主要部分看上去更像是一个似然比。从形式上来说,待决的问题是给定案情描述版本中证据的相对可信性,而非对于给定证据中任何具体案情描述版本为真的可能性。

6.其解释了事实认定者实际在做的事。

7.其解释了证据规则的诸多方面。[20]

相对可信论也有缺点,其中至少有一点或可以通过人工智能技术予以补强。尽管彭宁顿和哈斯蒂已经指明了什么会令陪审员们认为具有说服力,但“可信性”在很大程度上尚未进行定义。且保罗·塔加德的研究表明,假设比较可与贝叶斯定理兼容使用,但不会带来贝叶斯定理所伴随的叠加信息量爆棚问题。在这些问题上,来自人工智能界的看法将会非常重要。相对可信论的另一个劣势是其尚未被形式化,因此不会吸引到那些更崇尚形式主义的理论学家。最后,该理论在出错率和效用方面的蕴意几乎无从说起。当然,这也可能是一种优势。鉴于前述原因,各种决策理论方法的效用是很有限的,这至少表明了研究者应当将精力集中于争议解决程序的公正性上。相对可信论很好地抓住了这一点,因为其在实质上保证了对抗双方有权向事实认定者呈现他们各自认为是最具说服力的证据和陈词,并要求事实认定者来决定哪方的事实主张版本更为可信。这至少保证了一位无偏私的中立决策者有机会听取双方意见,在该过程中当事人双方掌控着自己的命运,而这恰恰正是程序公正原则的核心。此外,即便用公式无法证明,相信人们无需花费太多周折便会意识到实践相对可信论可以带来出错率最小化的结果,其肯定比期望效用最大化理论更有实际价值。

那么,人工智能界会怎样评价以上观点呢?或许他们会有很多想说的。在《国际证据与证明杂志》特刊的文章里,我写道:“我所提论点预示着法律上的争辩应从贝叶斯主义转向追求可信性和可解释性”。[21] 或许聚焦于可信性和可解释性的人工智能研究可对这一司法证明理论的范式转移过程发挥积极效用。我们中的许多人都期盼着想了解情况是否的确如此。

本文脚注列表

[1] 例如,1997年12月16日,美国有线电视新闻网(CNN)在网上转载了一篇关于Michael F. Zanakis因敲诈勒索被定罪的AP新闻报道。据称,Zanakis从他工作的实验室里盗取了一根老鼠尾巴,将其油炸后放入他在麦当劳为两岁儿子买的一包炸薯条里。他随后向麦当劳索要五百万美元和解金。

[2] 通过查阅庭审笔录,我们就可以确定审前指示和开庭陈述中存在实体法知识上的相对缺失。我在此处提出的观点可以通过查阅两起案件的庭审笔录得以证实,分别是:People v. Steele【转载于Ronald J. Allen和Richard B. Kuhns:《证据法的分析路径:文本、问题和案例》(小布朗出版社)An Analytical Approach to Evidence: Text Problems, and Cases. Little and Brown: Boston, MA(1989年)第3–95页】和People vs Johnson【转载于Ronald J. Allen, Richard B. Kuhns和Eleanor Swift:《证据法:文本、案例和问题》(第二版)(阿斯彭出版社)Evidence: Text, Cases and Problems, 2nd ed. Aspen Publishers: New York, NY(1997年)第4-118页】。

[3] Ronald J. Allen, Richard B. Kuhns和Eleanor Swift:《证据法:文本、案例和问题》(第二版)(阿斯彭出版社)Evidence: Text, Cases and Problems, 2nd ed. Aspen Publishers: New York, NY(1997年),第8-9页。

[4] Steven Lubet:《现代庭审辩护》(国家庭审辩护研究所)Modern Trial Advocacy, NITA(1993年),第60页。

[5] Ronald J. Allen:事实模糊性与证据理论,《美国西北大学法学评论》Factual Ambiguity and a Theory of Evidence. Northwestern University Law Review第87卷第2期(1994年),第604-640页。

[6] 例如,Rashkin和Yuelle发明了一套方法来分析涉嫌性虐待案件中的儿童采访。当然,这只是法律面临的众多面谈问题之一。根据Rashkin和Yuelle的研究成果,与这一过程有关的因素包括:A.指控的一般特征(1.连贯性,2.自发复述,3.足够多的细节);B.指控的具体内容(4.情境铺垫,5.对互动的描述,6.交谈的复述,7。事发期间的未曾预料到的困难);C.内容的特殊性(8.异常细节,9.外围细节,10.被误解的准确报告细节,11.相关的外部联系,12.描述主观心理状态,13.犯罪者心理状态的归因);D.与动机相关的内容(14.自发更正,15.承认记忆缺失,16.对自己的证词提出疑问,17.自我贬低,18.赦免肇事者);E.犯罪特定要件(19.该行为的细节特征)。参见David C. Raskin和John C. Yuille:分析评估性侵犯案件中儿童采访的问题,《儿童证言的视角》(施普林格出版社)Problems in Evaluating Interviews of Children in Sexual Abuse Cases. In Ceci, S. J.,Ross, D. F., and Tolia, M. P. (eds), Perspectives on Children’s Testimony. Springer-Verlag: New York, NY.(1989年)第184-207页。

[7] Ronald J. Allen:事实模糊性与证据理论,《美国西北大学法学评论》Factual Ambiguity and a Theory of Evidence. Northwestern University Law Review第87卷第2期(1994年),第627-628页。

[8] Ronald J. Allen:构建刑事案件中的陪审团决策过程:统一宪法性视角下的证据工具,《哈佛法律评论》Structuring Jury Decisionmaking in Criminal Cases: A Unified Constitutional Approach to Evidentiary Devices. Harvard Law Review第94卷第2期(1980年),第321-368页;Ronald J. Allen:再议民事案件中的推定,《爱荷华法学评论》Presumptions in Civil Actions Reconsidered. Iowa Law Review第66卷第4期(1981年),第843-867页。

[9] Ronald J. Allen, Mark F. Grady, Daniel D. Polsby和Michael Yashko:律师-客户特免权和律师工作成果原则的实证理论,《法律研究杂志》A Positive Theory of the Attorney-Client Privilege and the Work Product Doctrine, Journal of Legal Studies第19卷第2期(1990),第359-397页。

[10] John Kaplan:决策理论与事实认定过程,《斯坦福法学评论》Decision Theory and the Factfinding Process. Stanford Law Review第20卷第6期(1968年),第1065-1090页;David H. Kaye:单一统计证据,《耶鲁法学评论》Naked Statistical Evidence. Yale Law Journal第89卷第3期(1980),第601-611页;David H. Kaye:优势证据标准的边际线:正当的单一统计证据和多重因果关系,《美国律师基金会研究杂志》The Limits of the Preponderance of the Evidence Standard: Justifiable Naked Statistical Evidence and Multiple Causation. American Bar Foundation Research Journal 1982年第2期,第487-516页。

[11] Ronald J. Allen:理性、计算和司法证明:一次初步探讨,《国际证据与证明杂志》Rationality, Algorithms and Juridical Proof: A Preliminary Inquiry. International Journal of Evidence and Proof 1997年特刊,第254-275页。

[12] 同上。

[13] 同上。

[14] Leonard J. Savage:《统计学基础》(多佛出版社)The Foundation of Statistics. Dover Publications: New York, NY(1972年)第21-26页。

[15] 这个例子出自芝加哥大学的Albert Madansky,他帮助我厘清了主观概率里的一些困难问题,对此我深表感谢。

[16] Leonard J. Savage:《统计学基础》(多佛出版社)The Foundation of Statistics. Dover Publications: New York, NY(1972年)第207页。这其中有一些复杂问题。实证研究已经表明,个体会违反确定性原则(Eldar Shafir:不确定性和通过析取进行思考的困难,《认知》Uncertainty and the Diffiiculty of Thinking Through the Disjunction. Cognition 第50卷(1994年)第403-430页;Amos Tversky and Eldar Shafir:不确定条件下进行选择的析取效应,《心理科学》The Disjunction Effect in Choice Under Uncertainty. Psychological Science 第3卷第5期(1992年)305-309页)。当文本示例是现实生活中的例子时则更加困难,因为它可能是对概率空间错误量化的示例。在我看来,结果都是一样的,无论例子是什么。如果违反了确定性原则,就是违反了主观概率公理。如果是一个错误量化的概率空间例子,其演示了在庭审中概率空间如何根据新的信息不断地修正,直至做出决定。这反过来意味着贝叶斯定理在决策点之前不起作用,在决策做出之际概率空间才会形成;但是,此时贝叶斯定理也没有实质作用可以发挥了,因为所有证据都已是旧证据。

[17] Ronald J. Allen:司法证明的本质,《卡多佐法律评论》The Nature of Juridical Proof. Cardozo Law Review 第13卷第2-3期(1991年),第373-422页;Ronald J. Allen:事实模糊性与证据理论,《美国西北大学法学评论》Factual Ambiguity and a Theory of Evidence. Northwestern University Law Review第87卷第2期(1994年),第627-628页。

[18] Nancy Pennington和Reid Hastie:陪审员决策过程的认知理论:故事模式,《卡多佐法律评论》A Cognitive Theory of Juror Decision Making: The Story Model. Cardozo Law Review 第13卷第2-3期(1991年),第519-557页。

[19] Paul Thagard:《概念性革命》(普林斯顿大学出版社)Conceptual Revolutions. Princeton University Press: Princeton, NJ(1992年)。

[20] Ronald J. Allen:司法证明的本质,《卡多佐法律评论》The Nature of Juridical Proof. Cardozo Law Review第13卷第2-3期(1991年),第373-422页;Ronald J. Allen:事实模糊性与证据理论,《美国西北大学法学评论》Factual Ambiguity and a Theory of Evidence. Northwestern University Law Review第87卷第2期(1994年),第627-628页。

[21] Ronald J. Allen:理性、计算和司法证明:一次初步探讨,《国际证据与证明杂志》Rationality, Algorithms and Juridical Proof: A Preliminary Inquiry. International Journal of Evidence and Proof 1997年特刊,第254-275页。

微信编辑:战思伯 谢执萱

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多