语言识别在侦查 破案中的作用 刘潮杰 张 靖 引言 案件言语识别是运用语言学的知识、原理和方法,通过对作案人语言特点的分析,判断作案人的身份特征和活动区域,为侦查破案提供线索和方向的一门侦查技术。 案件的书面语言,一般都会反映出书写人的方言特征和用字遣词的习惯,这对于判断作案人所在地区以及有关的特征,具有十分重要的意义。具体来说,言语识别在侦查破案中主要有两个方面的作用:一是确定侦查的方向和范围即所谓“定向”;另一方面是确定作案人的有关特征即所谓“画像”。 一 定向 确定侦查方向和范围的依据是多方面的,但是有一些案件,如写反动标语、反动传单、反动信件、诬陷信、恐吓信等,便常常要靠运用言语识别的知识来分析了。一般来说,运用言语识别,可从三个方面来确定侦查方向: (一)从方音确定侦查方向 汉语方言颁布的地域十分辽阔,其语言现象也非常复杂,有的省、地区,甚至一个县以内都存在着不同的方言。各方言之间的差别,首先表现为语音上的差别。任何作案分子都是生活在一个具体的方言区域以内,并在语音上受到其所在区域方言的制约和影响。这种制约和影响在其口语和书面语言材料中都会不同程度地表现出来。 1.从口语分析方言特征。指的是通过对口语中的方音特点、词汇范围、语句类型的分析,判断讲这一口语的人的某些身份特征和活动范围。这对迅速查明一些拒不老实交代的流窜犯的身份能起很大作用。如:某市一案件中,当审讯人员问一做案嫌疑人的原籍时,该犯负隅顽抗,说他自幼四处流浪,已记不清了,可能是山东、河南、河北、北京等地。按照他提供的姓名、地址,经过一个月的调查,均未得到证实。后由有关部门从口语上对其籍贯进行鉴别。此人一口混合腔,各地方言词语都有一些,但专家们认为其口语中的一部分单字音最能反映其原籍的方言特点。如“国”, 读为普通话的上声 214,“邮” 读为普通话的阴平 55,“三” 读为普通话的阳平 35,“割” 的韵母为 a,“的” 的韵母读为 i。古诗有云:“少小离家老大回,乡间未改鬓毛衰。” 这说明一个人的乡音是极不易改变的。正是从这部分单字音反映出的文章特点,最后作出了“被鉴定人的第一方言是东北话” 的结论。破案后证明这个结论是正确的。 2.从分析方言同音别字定向。所谓方言同音别字,是指在某个方言的语音系统内形成的与普通话语音系统不相符合的同音别字。由于文化程度、方音影响等方面的原因,书面语的书写人常会写一些自认为同音的别字,这些同音别字就直接反映出书写人的方音特点。 汉语从大的方面说,可以分为八个方言区,即:北方话、吴语、湘语、赣语、客家话、闽北话、闽南语、粤语。由于语音不同,每个方言都会形成自己独特的相同字音。比如:苏州等地分不清“买” 与“卖”, 厦门话把“美国” 说成“米国”。这种方言里相同字音的现象,表现在书面上就会出现符合本方言语音规律的同音别字。如:上海习惯把“黄瓜” 写成“王瓜”, 广州很多人把“省吃少用” 写成“省吃小用”。由此可见,利用书面语言的同音别字可以为侦查定向。 (二)从方言词汇和语法结构确定侦查方向 1.从方言词汇确定侦查方向。相信许多人都曾注意到,同是人称代词第一人称单数,普通话叫“我”,有的地方却叫“俺”, 这里的“俺” 就是方言词汇。方言词汇具有本方言独特的色彩,只通行在特定的地区。所以可从方言词汇来确定侦查方向。 2.从语法结构确定侦查方向。汉语的句子是按照一定的结构规律组成的,方言之间同样也存在语法上的差别。如:北京话说“我先去”, 广州话却说成“我去先”。像这样由于语言结构形成了方言特点,便可用于推断案件的地区。 (三)从地方习俗字确定侦查方向 地区习俗字是指流行于某一地域的不规范汉字。由于地区习俗字都有比较明确的流行范围,所以,如果它出现在案件语言材料中,对于我们判断作案人生活活动的区域有很大的帮助。 从地区习俗字定向应注意两个问题:1.注意将地区习俗字与一般异体字区别开来。一般异体字通行于整个汉语流行的区域,一般都可以在字典辞书中查找到。如“峯” 字。而地区习俗字一般在字典辞书查不到。2.定向时应全面了解地区习俗字分布的区域。有时相距很远的几个地方会使用同一地区习俗字。所以,在分析时,应将地区习俗字与方音、方言等词汇、语法结构等语言方面的因素,以及投邮地点、投邮线路、物证、原件内容等方面的因素综合加以分析。 二 画像 所谓“画像”, 即勾画作案人的“脸谱”, 根据语言材料反映出来的特点,判断作案人的性别、年龄、文化程度、职业以及是否精神病、聋哑人等,在确定侦查方向后,利用言语识别的“画像” 功能,可使侦查范围更为具体、更准确的判断犯罪嫌疑人。 (一)判断作案人的性别。 男性和女性在书面语上的差异,具体表现在: 1.女性在叙述中经常是多层次的,表现清楚,涉及面广,并且句型的变化多,促使语义的更新和递进 ;男性在叙述中层次较为单一,句型变化也少,有时甚至是直截了当。 2.女性陈述的内容多涉及具体的人和事,男性一般常述及政治、社会等方面的内容。在匿名材料中,谈及某人男女作风方面的问题的,不少是女性写的,有的女性在写这方面的材料时,甚至把亲属也扯了进去,使人难以察觉是出她之手。 3.女性在抒发情感多以家庭、爱情、个人处境为主题,并且易于表现出忧郁、感伤的情调。男性表现情感的主题是多方面的,而且常用爽快的笔调。 4.女性在情节叙述上,大多写得新鲜 、活泼、细腻、具体,给人一种逼真的感觉。男性则多半就事论事,至于情节的具体描绘,是常被忽略的。 5.女性书面语的语气大多舒缓、和婉,有时还会出现敬词、敬语,用以改善信中气氛。男性书面语中这类情况少见。 6.在使用詈语 (辱骂性语言)方面,男女也不完全相同。女性常用“王八蛋”、“不要脸”、“缺德”、“该死的”、“不得好死” 这类话,男性骂人,尤其是青年人,爱骂一些粗鲁话,或者恶语威胁恫吓。 7.女性书面语中表示肯定、转折、犹豫 、停顿语气的短语出现得较多。如“真的”、“是的”、“对了”、“可”、“怎么说好呢”、“难看死了” 之类。男性此类词语相对用得较少。 8.女性容易表现出喜悦、悲伤、愤怒 、厌恶、惊恐的情绪,所以,在书面语中,叹词用得比较多,如“啊”、“呀”、“哇”、“哪”、“哦” 等。另外,女性口语的疑问句和祈使句也要比男性多些,因此,语气助词“呢”、“吗”、“吧” 等的出现,频率也要高些。 9.女性在书写家庭、爱情、个人处境突出浪漫性为主题的内容时,不容易出现错别字。而男性则是在书写男性勇猛特征性内容时不容易出现错别字。 (二)判断作案人的年龄。 根据对以往作案人年龄情况的分析,通常可以把作案人的年龄分为四个阶段:少年 (12 -17), 青年 (18 -34), 中年 (35 -50), 老年 (50以上)。各个年龄阶段的人作案,都有其语言文字的特点。 1.少年人作案的语言文字特点。(1)大都使用比较规范的简化字,多错别字。(2) 运用书面语言的能力很低,常常表现出语句不通顺,表意不完整,词义褒贬不分。(3) 说话口气大,常常不着边际。(4)一般没有伪装,即使有伪装,其程度也都很小,并且极易识破。(5)文字书写水平很低,或字迹潦草,没有规律,或纯学生体。篇章布局极零乱,不注意行款格式。标点符号使用混乱。 2.青年人作案的语言文字特点。(1)绝大多数使用规范简化字、繁体字个别出现。(2)语言轻浮,追求华丽的词藻,喜欢修饰卖弄,表露自己的才华,故在其书面语言中常出现诗文并用的情况,其结果是不伦不类,明显地表现出爱虚荣的心理。(3)书信中的口语成份较重,以当前通行的词语为主,有时还夹杂一些方言土语,农村青年尤为突出,一般少用旧词语和文言词。(4)书信中数词的写法经常以阿拉伯数字为主,有时与中文数字两者并用。(5)口气嚣张,有的毫不掩饰其活动的反动性,这是青年人胆大妄为 、敢于冒险特点的具体表现。有的则语言粗俗,甚至随便辱骂人。(6)有的青年作案时有伪装,但由于其经历少,不太成熟,故其伪装的手段也比较简单,常常把地址、姓名编排在文句中。(7)大都会使用现行的标点符号,但有的使用得不太准确,或逗号句号混用,或一逗到底或该用的地方没有用。 3.中年人作案的语言文字特点。(1)书面材料中繁体字或异体字都有一定的比例。(2)有的中年人能使用一些文言词语或者引用一些古文。(3)语气不象青年人那样直截了当,而是委婉、含蓄、客套、虚伪。(4) 经常在明写部分流露出生病、思念子女、儿女婚姻、升学就业等方面的内容,与青少年有很大的不同。(5)书写时比较注意行款格式,署名、称呼比较符合规范,大都能使用现行的标点符号,有的还具有毛笔字的书法基础,或会隶书、行书、草书。(6)伪装最为严重。 4.老年人作案的语言文字特点。(1)书面材料以繁体字为主,不常见的异体字也时有出现。(2)大都习惯使用文言文或半文言半白话,或者大量使用旧词语,喜爱引用古文,有的对当前通行的一些词语不太熟悉,甚至出现一些不伦不类的语句。(3)大都不习惯使用现行的标点符号,有的断句全用逗号或全用圆圈,有的甚至根本不用。(4)各种客套话较多,但语言方面的伪装程度都比较小。 (三)判断作案人的文化程度。 在实际侦查工作中,通常将文化程度分为小学文化程度、初、高中文化程度、大学文化程度和旧学文化程度四类。一般来说,作案人的文化程度与其实际水平大体相当。当然,由于年龄、经历等方面的因素,也就会出现一些差异。 1.小学文化程度的语言文字特点。(1) 文字书写水平很低,不懂行款格式,胡写乱画,随心所欲。(2)错别字极多,即使是一些常用字也经常写错。(3)对词义理解不准确。有时想写得使文化程度显得高一些,文气重一些,反而弄巧成拙。(4)语句冗长,文理不通,表意不清,前言不搭后语,有时还不知所云。(5)标点符号混乱,有的甚至通篇没有一个标点符号。 2.初、高中文化程度的语言文字特点。(1)文字书写水平不高,但基本上会分段落层次,略懂一些行款格式。(2)错别字比较多。(3)词汇贫乏,多用日常口语,故其书面语言显得格外繁絮,还常夹杂一些方言土语词汇。(4)对词义有一定的理解能力,但常常出现用词不当的现象。(5)标点符号使用不准确,有的一逗到底,有的一顿到底,有的则逗号、顿号、句号胡乱使用。 3.大学文化程度的语言文字特点。(1)一般比较少错别字。(2)书写水平比较高,有的人不仅写得工整流利,而且讲究外形美观,并初步形成了自己的字体和风格。(3) 驾驭语言的能力较强,特别是南方各方言区的人,大都能使用一些普通话词语,在书面语言中使用普通话更是运用自如。(4)有的人比较讲究文彩,讲究字句的斟酌和表情达意的准确,会使用排比、对仗等多种手段,注意艺术性和感染力。(5)有的能使用一部分文言词语,甚至还能运用一些历史典故。(6)具有一定的科技文化知识,了解一些科技、外语书名,或具有一定的专业知识,能使用一些专业术语。(7)注意书信的行款格式,篇章结构,能正确使用标点符号。(8) 语言隐晦,有的能使用暗语,有的能运用剪贴手段作案,以进行伪装,有的还能进行摹仿,陷害他人。 4.旧学文化程度的语言文字特点。(1)会写不常用的字、词。(2)能熟练地引用古文,使用比较生僻的成语典故。(3)懂骈体文,书信中经常用对偶、排比等句式。(4) 对古文非常熟悉,有的还能用文言文或半文半白的文体进行写作。 (四)判断作案人的职业。 职业大体上可分为职工、农民、战士及复转军人、学生 、无业人员等五个类型。由于作案人的社会地位、工作和生活环境的不同,往往其语言文字上表现出来的特点也不同。 1.职工作案的语言文字特点。(1)习惯用本行业的习俗字、常用字。如一案件中,作案人把“杀人” 之“杀” 写成了“刹” 字,破案后作案人为一汽车司机。(2)从行业习惯用语进行判断。俗话说“三句不离本行”, 各行业的习惯用语总会被本行业的经常使用。(3)从案件语言材料中描写的工作 、生活环境进行判断。(4)从作案工具、作案时间进行判断。 2.农民作案的语言文字特点。(1)农村人作案受到文化水平的限制,口语成份很重,错别字比较多,并且还常常夹杂一些方言土语。(2)农村人一般使用旧历,如果使用公历,有的人还特别加以说明。(6)农民作案,其书面材料中往往会暴露出其居住地区的某些特点,特点是在署名、落款的地方最容易表现出来。(4)农民作案,常会在书面语言材料中描写一些与自己有关的生产、生活方面的情况。(5)农村人作案在作案时间上往往与农村赶集的日子相吻合。 3.军人及复转人员作案的语言文字特点。(1)由于军队人员来自五湖四海、大江南北,故在语言上显得南北方言混杂,不仅口语如此,书面语也如此。(2)文字书写比较熟练,但错别字较多,常出现生造词和病句。(3) 在案件的书面语言材料中常常使用部队的习惯用语,特别是在落款和署名的时候,常常表现出与军队有关的特点。(4)有的作案人在案件语言材料或在其密写中介绍自己的身份,企图以此获得敌方的信任。 4.学生作案的的语言文字特点。(1)在校学生基本上都使用比较规范的简化字,不会写的常用汉语拼音代替,或者用英语单词代替。(2)常用词语大都与学校生活有关。(3)内容多是自己或同学之间的事,或是与学习有关的事。(4)学生在文字写作方面一般是作业,在发现写错的情况下对文字进行的涂改的时候为讲究页面整洁,一般比较细心,也比较工整。其他人涂改则比较随意。 5.从事计算机操作人员作案的语言文字特点。由于计算机操作人员经常从事计算机操作,平时缺乏动笔,因此在书面中经常出现错别字,在运笔过程中条件反射不强烈,经常出现停顿现象,字体间隔也不均匀。书写内容会出现网络用语或符号。如:酱 (这样子)、 稀饭 (喜欢)、 GG (哥哥)、:) (代表笑脸)。 6.无业人员作案的特点。无业人员指没有正当职业的人员,这种人在时间上很自由,活动范围也不受什么限制,可以随时作案。 (五)精神病患者书面语言的特点。在我国的精神病学和司法实践中,常常发现精神病患者作案,给社会造成严重危害。据已有的统计资料表明,在各类刑事案件的作案人中,约有 10%是精神病患者。可见,研究精神病患者书面语言的特点,具有重大的现实意义。概括起来,精神病患者书面语言的特点有: (1)概念逻辑混乱。由于患者的思维过程不能按正常的逻辑思维规律进行,所以往往表现出概念的混乱和奇特的逻辑推理。 (2)生造字词,病态用语。如有一患者将“凤凰” 写成“**”, 固执地认为这样才形象地表现出凤凰翩翩的神姿。【编者按:此处**是因为原文没有字】 (3)词语重复罗嗦,有时是行文冗长,前后内容大同小异,或是完全重复前面内容,有时则是一些词语重复使用,显得十分繁絮。 (4)随意联想,语句残缺零乱,或是内容荒谬,令人费解,或是只是一些词语的杂乱堆砌。 (5)多余说明,画蛇添足。 (6)标点符号怪异,或乱用一气,或根本不用。 (7)内容荒谬,漫无中心。有的长篇大论却毫无具体目的,有的则完全是受妄想支配,写一些想入非非,既无根据,又无意义的东西。 (8)署名奇特。有的患者作案时留下自己的真实姓名、工作单位,有的还加盖自己的印章。有的作案后使用笔名,但这些笔名都起得格外奇特,如“医学圣人”“太阳升”“冷冻”“苍蝇” 等。 (9) 字迹潦草混乱。有的写得张牙舞爪、字形很大,一张字写不了几个字,有的写得字与字之间几乎没有间隙,上一字的笔划与下一字的笔划部分重迭,显得异常拥挤,格局非常零乱。 (六)聋哑人书面语言的特点。聋哑人指又聋又哑之人,由于其生理缺陷,在学习常会形成一些表面现象,以致发生误解和错觉,从而导致他们在书面语言中不可避免地出现概念不清、词义混淆、语法不通的现象,主要有: (1)形近错别字。聋哑人写错别字,大多都是由于字形或偏首部首相近而引起的。(2)生造词语。如“欢迎接”、“弱柿子”(软柿子)等。还有一种情况是由于对词义的褒贬分辨不清而形成词语错用。(3)词语重复。手势语的动作瞬间即逝,有时需重复或进一步表示,这种影响导致聋哑人书面语出现词语重复现象。如“校园十分非常美丽”。(4)增减句子成份。(5)固定词组的错用。聋哑人缺乏口语实践,其书面语中用如成词 、俗语之类的固定词组时,常会出错。(6)语序颠倒。因为手语动作的顺序和口语的语序有很大差别,所以语序颠倒在聋哑人的书面语里是一个十分突出的问题。如:我们班长开会什么时候 ? (7)心态表述方式。手势语表示思维、情绪等概念,都是用食指指心的动作表示。聋哑人将这一特点也置入了书面语中。即凡是表示此种心态时,都必须加上“心里”、“心想” 一类字样,使句子变得累赘、别扭。如:一个夏天的晚上,我写完作业,就心里高兴地去看电视。(8)接受信息表述方式。聋哑人通过视觉接受信息,“看” 的概念在思维中印象深刻。书面语里凡是表示接受外界信息的,都离不开“看” 这个词。如:上午第三节课,我看刘老师背书和讲故事。 言语识别除有“定向”、“画像” 功能外,于认定作案人、解决并案问题方面也有积极意义,但主要也是据上面内容进行分析,在此就不作详述了。 广东公安科技 2006年第 1 期 总第 82 期 本期编辑 | 王雪枞 本文转载 【主编】 安全话语团队 【编辑】 盛静 林棽 孙致远 吴杨 王雪枞 李俐瑶 李芷珊 柴昕彤 蔡依航 |
|