分享

案例统计?一个专业性的扯蛋

 陆大伟律师 2022-02-10

 陆大伟,2018年6月14日写作

本文注定无法发表在任何第三方法律平台,一方面原因在于本文反对的对象太多,有些可能是被法律界称为大咖、专家的人物。另一方面在于文章字数,一般平台对于文章的字数有要求,像毕业论文一样,因此如果一篇文章的水平很多高,即使是像张明楷亲手写的,但是字数不多,并且以笔者的名义给某一法律类阅读平台投稿,估计百分之百被拒绝。还有一个原因,可能是很多平台的编辑本身水平不足,投搞的是法学博士之类的,审查校对文章的编辑可能是司法考试都没过的实习生,但是字数少的原因,不是笔者不会扯蛋,而是作为一名按时收费的法律工作人员,如果能用1分钟的话解决问题,而非要为了让人感觉自己很专业而扯成1小时的话,很容易破产。

废话不多说,现转入正题。目前笔者听了很多法律类的讲座、论坛,发现很多讲课者习惯于在PPT的开头进行可视化图表演示。例如某江苏律师,讲故意杀人罪方面的课题,他一般会通过图表展示一下最近5年江苏省地区故意杀人罪案例的趋势,有的心细的,还会展示二审的、再审的故意杀人罪案例数量。下面听课的观众看到这些专业的图表,一般会纷纷拿出手机进行拍照,至于为何拍照,可能为了下课后仔细研究,也可能是以这个图表为模板,以后自己出去讲课用

但是笔者一直有一个疑惑,讲课者是如何统计到相关的案例数量的,并且是如何进一步将案例按照不同类别再次分类的?带着这个问题,笔者在阅读带有案例统计的文章时,以及在参与相关讲座时都特别注意关于如何统计的解说。

经过长期的观察,笔者发现,此类案例大多是在“中国裁判文书网”以及其他第三方案例数据库平台通过关键词进行检索,然后根据检索结果出现的数量,从而得出相关案例结果的,有的案例数据库平台甚至能自动生成分析图表。

这就出现一个问题。通过关键词检索出来的案例,都可能是某一类案例的数量合集吗?

答案是否定的。首先,案例统计,是一个统计学方法,只有运用正确的统计学方法才能得出稳妥的统计结果。

统计的第一步,就是找样本,要找到拟统计的对象,例如要统计南京律师男律师里有几个超过200斤的,首先要找出南京的律师,然后还要把其中的男律师挑出来,不能把不男不女的律师挑出来,也不能把一个名称叫“张亚男律师”的女律师当成男律师。这一步如果出现问题,那么下面再怎么搞都是扯蛋。

而案例统计的问题基本出现在第一步。

以“裁判文书网”,为例,按照裁判文书公开的规定,只有不涉及国家秘密等情形的案子才可能公开。裁判文书公开,离不开工作人员把原本还没有公开的裁判文书传到网上,一个人在2018年6月14日下午3点01分检索了某一类案子,得出有20个此类案例,可能在3点05分时候网上又新传了2个,在一个星期后,他在讲课时称某类案例有20个,这个结果就是错的。但是我们是无法让法院的人在讲课之前先不要传的,所以说,从严谨的角度讲,为了避免此类问题,严谨的方式在数据上表明检索的来源,和检索结束时的时间

另一个问题是,现实很多案例存在案由错误,即判决书中使用的关键词并不是正确的。例如某一案例,其正确的案由是劳务合同纠纷,当事人的起诉状上都写“劳动关系”这个关键词,这个案子的结果是法院认为双方之间是劳动关系,必须去仲裁,从而驳回。如果一个人在检索最近3年的劳动纠纷案例时,很可能把这类案例也包括在内,因为这类案例中判决书里是包括“劳动关系”这一关键词的,但是实质上是当事人主张为劳动关系,而真实情况却不是劳动关系,而是劳务关系。尤其是检索结果中有上百案例时,统计者只有一个一个研究才能排除出此类案例,不然仅以检索出来的案例数量作为某一类案例的数量,肯定是错误的。此类“跑题”的案例其实很多,尤其是在当事人没找律师时,很容易形成此类案例。笔者将此类错误的关键词称为“跑题关键词”

还有一种情况下是“历史性关键词”,即此类关键词并不跑题,但是也和本案无关,属于对以往事实的陈述。例如,在一个强奸罪中,当事人信息记载中,可能记载了其以前曾经因重婚罪被判过刑,如果一个人研究重婚罪的数量,以“重婚罪”为关键词,肯定能检索到这个“强奸罪”的判决书,这也导致了检索结果的错误。

对于“历史性关键词”的问题,可以通过增加一个“案由分类”作为限制性检索条件从而保证结果的错误率降低。

对于“跑题关键词”,笔者认为通过“案由分类”也是无法排除的。因为目前似乎还没有检索工具能够领会到判决书中的真实法律关系是什么,并且在此基础上按照真实的法律关系变更原本立案时的案由分类的。

另外,在现实工作中,笔者还遇到拿到的纸质判决书,和网上的判决书表述不一致的情况。另外,有的第三方平台数据库是通过某一技术抓取“中国裁判文书网”的数据库,但是并没有抓全,或者一些判决中会出现一些乱码,如果统计者用第三方平台来检索,那么也是不全面的。当然,问题不仅仅只有上述这些。

这些问题使得一个科学的、准确的案例统计基本上无法完成。所以,我们去听课看到的很多案例图表基本上不严谨的,而在数据不严谨的情况下,如果演示者通过一些限制性词语来说明标注一下数据是如何形成的,其结果也是严谨的,但是可惜的是,目前笔者看到的案例统计,基本上一方面是看不出其案例是来源于哪里,以及通过什么方式检索出来的。笔者认为,此类问题是态度问题,作为律师或者其他法律职业共同体人员,应该具备良好的、严谨的态度。尽管此类错误,对讲课主题或某一文章的主题影响不太大,但是其反映了一种科学的态度。如果法律人都是这种无所谓的态度,如何能在代理案件中发现问题,解决问题呢?

(完)


【作者简介】

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多