分享

特稿 | 高然:粤语词典编纂的基本原则

 风吟楼 2023-10-04 发布于广东

粤语词典编纂的基本原则

高然

(暨南大学汉语方言研究中心 广东广州 510632)

【提 要】本文结合2013年发表的《粤语词典编纂的问题与思考》,对粤语词典编纂诸多问题再思考, 参考更多的粤语词典作为实例来分析和探讨, 进而提出个人所认定的粤语词典编纂的十项基本原则:(1)遴选粤语词语的基本原则;(2)遴选词语的基本原则;(3)标音/注音符号遴选的基本原则;(4)释义诸多方面的基本原则;(5)举例的基本原则;(6)俚晋语收录的基本原则;(7)词性标注基本原则;(8)词条查索设计基本原则;(9)外来语词标注基本原则;(10)词典语言/内容表述中性基本原则。

【关键词】粤语 词典 编纂 基本原则

关于粤语词典编纂问题及其相关思考的类似论述,笔者已在2013年《粤语研究》(第十四期)发表过《粤语词典编纂的问题与思考》,还有稍后于2015年《南方语言学》(第九辑)发表了《汉语“青”是什么颜色》。数年过去了,又见新近出版的,或参阅过去已出版的各种粤语词典,笔者的新思路新看法仍涌现不止。因此结合前作,本文拟选数本较常见的粤语字典、词典为材料依据,重新审视粤语词典编纂的诸多问题, 再探讨粤语词典编纂的基本方法和理论, 提出个人所认定的“基本原则”。

Image

一、遴选粤语词语的基本原则

粤语词典既然关乎“粤语”,当然是收录粤语词语。但是,什么是粤语词?甄选的标准是什么?从过去已发表出版的粤语辞书来看,这本来不算是个问题,都大体遵从了不成条文框框的“收集广州话中与普通话不相同的词语⋯⋯”(麦耘等, 1997);“主要收集广州话中跟普通话不同的词语,其中有些词语可能在别的方言里也通行, 但在普通话里一般是没有的⋯⋯”(饶秉才等, 2009);“收录香港粤语中与普通话不同的词语⋯”(郑定欧, 1997);“收录香港方言词语⋯⋯是指流行于香港地区的词语,跟普通话完全一致的不包括在内⋯⋯”(张励妍等, 1999)等, 都含有“广州话/香港粤语与普通话不同的词语”之元素。从上述各词典收词的实际情况来看, 麦耘本收词语约7500条, 基本是粤语口语词,饶秉才本收词语近12000条, 几乎都是粤语词语;张励妍本收词语7000余条, 有极少量普通话词语掺杂其间;郑定欧本却有许多例外, 其词典收词约8000条, 但经不完全统计,词典中与普通话完全相同,而又无其他粤语意义的词语700多条, 占全部词条总数的近10%!例如“花生、学校、学生、学费、鹤、木瓜、木耳、木偶戏、竹竿、竹笋、足球、烛台、绿、绿豆、六、六十、宿营、浴缸、玉、菊花、啄木鸟、剁、疟疾、药方、脚趾、脚尖、脚印、豆腐、豆浆、裁缝、彩虹、胎盘、做手脚”等。“与普通话不同”是遴选粤语词语最基本,也是最重要的依据,是粤语词典存在的理由(否则人人都去查普通话词典就得了)。据不完全统计,与普通话不同的粤语词语(词/某些常用短语) 超过16000条, 加上纯粤语四字成语(非普通话成语)约1500条,谚语约2000条,熟语(含惯用语、歇后语、俗语等)约2000条,还有常用重叠式数百条,总数超过22000条。这个数目的粤语词语/句,除了“与普通话不同”,还得是放之全世界各个角落粤语区里通用的、可行的纯粤语生活中的通用语(不包括粤语区各具特点的,不“通用”的词语用法), 才算得上是需要遴选收录的粤语词语。

接下来, 还得谈及这种粤语词语词形与语音或内涵的标准。传统上, 都以广州话为标准,近来几十年,又加上香港话,以粤港两地为这类粤语的“通行语标准语”。问题是30多年来, 内陆起了翻天覆地的变化,而广州话同样也起了不可逆转的巨大变化:广东珠三角包括广州粤语广播、电视、媒体等, 还有公交车等公共场合的粤语播音等,已几乎只剩6个声调(即阴上35与阳上13合并成35, 如“苑=远”;阴去33与阳去22合并,读33,如“试=事”;中入3并入阳入2, 如“跌=秩、乙=越”),中年或以下的年轻人绝大多数亦如此,想找读9个声调的都属稀罕事。在词语和句式上,更是舍弃了传统使用的大量说法:只说“蜻蜓”而不说“塘蝇”, 只说“螳螂”而不说“马螂狂”, 只说“客人”而不说“人客”, 多说“佢比我高”而少说“佢高过我”等。大量传统、地道的粤语用法因环境发生巨变而改变或消失, 而这种变化仍在飞速进行中, 而且势不可挡!对比中国内陆之外世界各地(含中国港澳)的所谓传统“广州腔粤语”,与吸收大量普通话用法的这种“当代中国内陆广州话”,已远远地、悄悄地拉开了距离,范俊军本《现代粤语词典》(暨南大学汉语方言研究中心词典编纂组, 2021)正是迎合这种背景问世。范本里共收入17000余条词语说法,据初步统计,勉强算得上传统粤语词语用法的仅9000余条, 只占总数约52%,另外约48%的都属普通话及其用法。在这些接近一半的普通话词语中,有部分已成为内陆粤语区特别是珠三角地区中青年的日常用语了, 如说“番石榴”或“芭乐”而不说“鸡屎果”,说“打气”而不说“泵气”, 说“关门”而不说“闩门”, 说“前边”而不说“前便”,说“水泥”而不说“石屎”或“红毛泥”,说“冰箱”而不说“雪柜”,说“溜冰鞋”而不说“雪屐”等。然而,在范本词典里,更有大量的普通话语词几乎可说是有音无实用, 即在实际上基本没人会说的,例如“荸荠(第34页)、尺蠖(第85页)、蜣螂(第604页)、螋螋(第619页)、惶惑(第303页)、鹡鸰(第322页)、雎鸠(第373页)、矍铄(第380页)、咔嚓(第383页)、潋滟(第443页)、蝼蛄(第465页)”等。还有极大量的,不说粤语背景人士,就算普通人也不甚了了的字词,如“垴、峱、鼽、铌、癿、坥、蛸、厍、岫、伈、㙘、窅、靿、椸、匜、艽、峧、亸、秬、稑、辂、膻、腅、噌、猰、屼、䓨、洨、苊、䡚、舣、嫕、⻖皃、硍、𠙶、㞎、珌、锖、漼、齼、鉊、鹾、䗖、踶、沊、㻬”等等。这样一本冠名为“粤语”的词典, 充其量, 只是一本“当代中国内陆中青年广州话词典”,而非传统上, 且通行于世界各个角落的通用粤语之词典了。当今中国内陆广州话的变化非常真实,已然无法承当传统上粤语的代表了。试问:仅有6个声调的粤语又如何代表世界各地仍在使用9个声调的粤语?更遑论其他词语、句式等充斥着普通话的说法, 尽管裹着粤语语音外衣。

“粤语”一词有广义与狭义两种意义,广义粤语指的是包括各粤语方言在内的粤语,如“广府片、四邑片、高阳片、勾漏片⋯⋯”。狭义粤语则仅指传统上以广州话(后加香港话)为主的这种世界性通用粤语(奇特的是,全世界无论哪个角落,哪怕在两广的不同粤语方言区演大戏,即粤剧,语音或词语用法等的高度一致令人叹为观止)。非要算,范本说到底也只是众多粤语词典,如“阳江粤语词典”“南宁粤语词典”等中的一本区域性或仅特殊人群使用的粤语词典而已。

因此,能代表通用粤语的词典,到现在为止,仍只能选用“与普通话不同的词语用法”,并且,最重要的是,在世界各个角落传统粤语群落里能通用的粤语,而非只通行于某区域内的粤语。


二、遴选“词”“语”的基本原则

Image进词典里, 恐怕得较大型词典才能容纳得下, 因此“适量”是符合收录原则的。问题是,“词”的定义明确清楚, 但“语”呢?“吃了、睡了、看着、想着、坐下、放下、提起、说起、快点儿、慢些、学会、看懂、拉紧、绑紧”等算是词吗?抑或算作“语”?范俊军本里便有极大量的该类组合:“跪低(跪下)、趴低(趴下)、剩低(剩下)、为咗(为了)、记起(想起)、钳实(夹紧)、握住(拿着)、闻得(可知/闻)”等,这些都属“词+词”惯用组合,该类组合里的“低、咗、起、实、住、得”大都是助词。若这类“语”都可收入词典,那么“低”组合就可以有“瞓低(躺下)、坐低(坐下)、掉低(丢下)、枕低(扔下)、路低(蹲下)、放低(放下)、留低(留下)……”;“住”也可以有“瞓住(睡着)、坐住(坐着)、枕住(扔着)、跖住(蹲着)、放住(放着)、留住(留着)……”;“咗”则可以有“瞓咗(睡了)、坐咗(坐下了)、掉咗(丢了)、枕咗(扔了)、放咗(放了)、留咗(留了)……”。除了助词组合,范俊军本里还有“嫌少(嫌少)、学晓(学会)、斟满(倒满)、快啲(快点儿)、猛咁(猛地)、猛长(拉长)、抹呤(擦亮)、钳断(夹断)、睇开(开始看)、企定(站稳)、话定(说好了)”等组合。如此收录词/语,该词典应有数万上十万词条而不止。

三、标音符号遴选的基本原则

Image

如“巴ba”等), 如“挨aai、三saam、交gaau”等;[v]标注成单字母a, 如“欧au、分an、不bat”等;[e、ε]则用e代表, 如“你lei、尺tsek、赢jeng”等; [æ、ø]用α两个字母来表示, 如“靴hæ、居gœy、香hæng”等;[ɔ]以字母o代表,如“爱 oi、渴ot”等;[u]以字母u代表, 如“乌u、屋uk”等;[i]以i表示,如“燕jin、适sik”等;[y]以字母y表示, 如“冤jyn、月jyt”等。声调方面, 张本采用的是9个单阿拉伯数字代表法:1阴平、2阴上、3阴去、4阳平、5阳上、6阳去、7阴入、8中入、9阳入,如“分fan¹、焚fan⁴、愤fan⁵、发faat⁸”等。范俊军本与张励妍本声韵母的声调标法都极相似, 但范本不用j而用y, 如同是“腰”, 张本注jiu,范本注yiu,“烟”张注 jin、范注yin等。入声韵尾张励妍本是-p、-t、-k, 范俊军本则标注-b、-d、-g, 如同是“脚”,张本注 gæk,范本注gæg;“急”张注gap,范注 gab等。声调也同样是九个数字, 但范俊军本所代表的调类与张励妍本的有相当大的不同,如表1所示:

Image

前述5本词典有4种相当不同的标音法, 加上未列举的其他标音法(据不完全统计,有超过30种粤语标音方式),对读者而言,不论阅读或词典查索, 都是力不能支的现实。实际上, 汉语及其方言各种拼音方案(不含国际音标), 均是1950年代“汉字拉丁化”运动的产物,即消灭汉字, 使用拉丁宇母(又称罗马字母, 即Aa、Bb、Cc……)来代替汉字作书写符号。本来就是当拼音文字使用, 主要功能是“文字”,而非“拼音”,这是为什么后来粤语拼音方案多达30几种的缘由——就26个字母,如何“拼”都无法如意,东家如此说,西家这样改了,改来改去, 依然毛病多多。光说标声调的阿拉伯数字,在国际音标上标双数字,直观明了, 表示“高平,中升, 低升、中降、曲折”等,如广州话“诗si⁵⁵、时si²¹、史si³⁵、市si¹³,试si³³、事si²²、惜sik⁵、锡sek³、食sik²”,清楚又直观。而单数字也能代表, 但代表什么内容还都不一, 查甲词典得认一种,查乙词典又换一新花样。声韵母的拼音方案所代表的音也不一致,都缺少了国际音标符号的唯一性、排他性,还有最重要的——准确性!

既然拼音方案仅是文字的替代品,而非准确高效的东西, 加上粤语书面语汉字的消失仍遥遥无期, 因此粤语书面语面临的只剩下标音一项。既然仅是标音,又为何不使用汉语及其方言研究,还有各种外语标音都共用的“国际音标”呢? 对读者而言, 学会国际音标并不比学各种拼音方案难多少, 而实际上还高效得多。

使用国际音标标注粤语读音,应是粤语词典应采用的基本方法

四、粤语词典释义的基本原则

Image

这类词典,以粤语为语言文字,还得以粤语文化为认知媒介, 才能读懂词条、释义以及相关例词例句的含义。在已出版的80多种粤语词/语典中,以英、法等外语为释词语言的有几本,除此之外,绝大多数都以汉语作为释词语言、对照、举例、译文语言等。既然能读懂这类粤汉词典,那么读者起码应具备几种基础:①汉语语言及文字基础;②某种程度的粤语基础;③该词典使用的标音符号基础;④普通常识基础。例如“菊花、啄木鸟、学生、花生、木偶戏、钓鱼、跳高、腰、帆船、蚊帐、粉笔”等词语(郑定欧本收录)根本就无需释义, 因其本身不论词形、词义都与普通话(华语)的无差别,而且还都是普通常识, 人人知晓;但郑定欧本不仅收入这些词语,数目上超过700个,而且还都花了不少篇幅来释词说明。有关释义问题,本人曾于《粤语词典编纂的问题与思考》一文中讨论过。参照旧文,添加新料,本文再论该问题。如前述,词典阅读者需具备几种认知基础, 方能基本“读”懂该粤语辞书, 那么释义则尽可能做到如下几点:

Image以指恋爱关系,也可以指婚姻,以及一般的较亲密的关系等。其本义是“扔/摔瓦锅”,缺少该义项,不熟粤语者便无法知晓“掷”和“煲”的含义(此处的“煲”还仅指瓦煲), 因为相应的, 粤语词还有“箍煲k'u⁵⁵pou⁵⁵(复合,言归和好、破镜重圆)”。这里的“箍煲”, 即用铁丝重箍瓦锅以再次使用(如裂缝不扩大的话,煮一两次粥可以填补细缝而不致漏水。过去经济条件不好,重新利用旧/废物的方法很多)(范本未收录 “箍煲”一词)。范俊军本里还有不少这类现象:第591页的“七彩”、第804页的“咸水话”等,都缺少本义项。

(3)释义多义项时应有明确的排列顺序, 即:本义→引申义①→引申义②(如果有的话)→引申义③⋯⋯。范俊军本里有不少顺序混乱的情况:如第634页的“肉”,第①义项先说“瓤;芯儿”,第②义项才是“人和动物体内⋯⋯物质”。还如第659页的“蛇”亦然,第①义项为“懒”,第②义项为“非法入境者”, 最后一项才是“爬行动物”。范本里的“紧(第360页)、浸(第362页)、壳(第391页)、勒(第428页)、仙(第801页)”等都属这类情况。

(4)同义的或几乎同义的要概括成同义项,而不是分成诸多义项。范俊军本里也有大量的类似情况,如第414页的“濑”,第①与第②义项本是相同的, 都是“缓浇/淋(液体)”,而且该词条下所列的“濑粉、濑花、濑洒、漱尿/屎、濑字、濑头撒尾”等中的“濑”都属同一义。第178页的“賦dung”也是, 第①②项义同,即“竖、竖起”;第②项的“支起、抬高”仍旧是“竖直脚(翘起腿脚)”的另说。第③项“同”当量词,应另项(同是“厭”,范本里缺席“厭企、厭厭企企、厭笃企、厭起床板”等词语)。还如“恶,og⁸(第181页),范本里居然有多达6个义项!实际概括一下, ①和⑤都是“凶、狠”;④和⑥都是“坏、恶”;③是“难、不易”;而②“生气”实际上应归①和⑤。范俊军本里这类情况还有不少,如“弊(第38页)、暾(第528页)、澎(第590页)、骑喱(第594页)、肉紧(第634页)、之不过、不过(第943页)”等。

Image

Image

Image


五、粤语词典举例的基本原则

词典里的词条是否都得举例? 或哪些该举例,而哪些又不该举例? 还有哪些不但得举例,一个例子不够还得多举一个或以上的例子, 方能说明被释词条的意义或功能作用等等。本文所参考的5本词典,都没有很好地解决这些问题。与前述第四节“释义的基本原则”相同,不仅释义要参照四种认知基础,举例也应参照、考虑该四种基础而决定是否举例。例如“枱tʰəi³⁵桌子”“日头jet²tᵇeu³⁵太阳”,这些都是常识, 三岁小孩都知道桌子和太阳。但张励妍本举例说“搬~[搬桌子]”;“日头”举例说“今日有出~(今天没出太阳)”;麦耘本举例“~好猛,晒到皮都甩(太阳很猛, 晒得皮都掉了)”;饶秉才本“出~喇(太阳出来了)”;郑定欧本“~唔够,影相唔理想(没提供译文)”等。

举例究竟为了什么?为了进一步说明、用实例说明该词条所含的意义、作用等。而“桌子、椅子、太阳、月亮、星星、下雨、刮风、吃饭、漂亮、丑、走路⋯⋯”,都是任何粤汉词典使用者都认知的常识(粤语与汉语里共享的同一事概念),如果都举例,那应该有多厚的词典才够用?

 一本好书, 或一本好辞书,应该是用最少的篇幅,最简明扼要的语言, 传递最多、最大量的既纯正又精确的信息,而不是相反。如非举例说“这是桌子,那是把椅子”“我在桌子上看书”“今天出太阳而昨天没出太阳”“早上我吃饭,中午我也吃饭,晚上我还吃饭,一天三顿饭”等,究竟为了什么? 麦耘本里是几乎每词/语必举例,如“热头(太阳)、月光(月亮)、飞发铺(理发店)、影相铺(照相馆)、鼻水(鼻涕)、眼泪水(泪水)、口水(唾液)、口水激(唾沫星子)……”;郑定欧本亦然“晒(暴晒)、浊(混浊)、冲(冲泡)、同学仔(小同学)、壮(健壮)……”;饶秉才本“尘(灰尘)、滚水(开水)、过云雨(阵雨)、光(亮)、冷天(冬天)、山坑水(山泉)……”;张励妍本“巴士(公交车)、啤啤(婴儿)、冻冰冰(冷冰冰)、断下眼(眨眼)、自动波(自动档)……”;范俊军本“屎坑(茅厕)、豉油(酱油)、床板、屙肚(拉肚子)、蠄蟧(蜘蛛)、米粉、女仔(女孩儿)、山鸡(野鸡)、铁线(铁丝)……”。这些词语所含的内涵与概念,粤汉并无不同,都是常识,用得着举例吗?上述例子中还不乏两个例子以上。是时候认真审视这个问题了!

反过来说,该举例的词语,却也不乏常见缺席现象:范俊军本第223页的“钢”,本来只当名词使用,而范本的①②义项均把其当动词用, 但如何使用? 是啥状态?词典中一个例子也没有。第226页里的“膏”亦然,也当动词使用, 也有两个义项,也都缺乏例子说明之!第227页的“割禾青”,不仅没有例子, 还缺少了本义项以及引申义①项,在其词典中所列的仅是引申义②项罢了。该词条实际上应为:

Image

六、粤语词典词语词性注释基本原则

纵观已问世的80多本粤语辞书, 还未见对所收录词语之词性/类进行标注者。尽管现代汉语语法或方言语法研究的诸多方面仍存在大量争议,但就基本词性/类的确认,大体争议不大。因此,有条件的话,是时候注明词性/类,以帮助读者进一步认识各词条真实含义与作用等。但是短语或固定用法之类可不必标注,应放置在该词条及各相属词条最后的位置, 例如:

晒,sai³³〈动〉①(日)照,曝(日光): 热头~(太阳晒)。②吸收(光或热):~谷(晒稻谷)|~相(冲洗相底/相片)。③炫(耀),展示:~命(炫示,炫弄)。

Image

七、粤语词典里脏话、詈语、禁忌语等的收录基本原则

该问题笔者在文章(高然, 2013)中曾提过, 而且也在澳门粤语研讨会上讨论过,受到不少与会者认可。即脏话、詈语、禁忌语等,不仅是该语(方)言日常用语的一部分, 也是该语(方)言里十分重要的组成部分, 应该酌情收入词/语典。词/语典既是该语(方)言的语汇、用法之集大成, 又是记录性的、中性的。词典既可以收褒义性词语、中性词语, 也应该收录贬义性成分, 都是该语(方)言文化的沉积物。语/词典具这种中性特性,因此不可能去承载和担当沉重的道德责任, 一如菜刀,既可用于砍瓜切菜,又可用于砍人,责不在菜刀,而在使用者。更何况,许多貌似脏话、詈语的成分,在实际语言应用中还充当多种作用(高然, 2013)。

八、粤语词典的查索设计基本原则

Image


九、小结

(1)粤语词典既然冠名“粤语”,就应选用通行于世界各个角落广为使用的“粤语”,而非仅流行于某局部地区的“区域粤语”,或仅流行于某种人群的社会粤语”。(2)粤语词典的选词应以“词”为主要选录对象,以及适量的短语惯用语、谚俗语等。临时组合的“词+词”或“词+语”并不适合选入词典内。(3)标音符号应直接用国际音标,而非五花八门的各种拼音文字方案。国际音标符号的唯一性、排他性,是标音记录准确明了的前提。(4) 粤语词典释义应尽量利用普通话相应的对照/对应词语,要避免下定义或冗长且啰嗦不清的说明。另外,既然被释义词是粤语词,释文都应先有本义项,否则读者在对本义不甚了了情况下升跃到引申义,则更加一头雾水。释文若有多义项应考虑内在逻辑顺序排列,而非杂乱无序。释义应更深入研究该词语后方归纳概括义项别(高然,2015)。(5)能不用举例的不随便举例,该举例的则不可缺少,一个例子不能说清的得举两个或以上。例子语言应口语化,而且简单扼要,又说明问题。(6)词类、词性要标记出来,以方便读者。(7)詈语、禁忌语要酌情收录, 其是粤语文化的一部分。(8)粤语词典查索正文部分仍以粤语语音查索为主,国际音标标音为优,正文后可附普通话语音查索表。(9)外来语词尽可能注明出处, 没把握的未考证部分可注明“疑”字眼。(10)词典释义语言应为中性色彩, 尽量不带意识形态或个人道德、政治观点等色彩。

参考文献

[1]中国社会科学院语言研究所,1996.现代汉语词典[M].修订版.北京:商务印书馆.

[2]黄伯荣,廖序东,1997.现代汉语(上册)[M].增订2版.北京:高等教育出版社.

[3]上海译文出版社,2000.世纪版新英汉词典[M].上海:上海译文出版社.

[4]李新魁, 黄家教, 施其生,等,1995.广州方言研究[M].广州:广东人民出版社.

[5]麦耘,谭步云, 1997.实用广州话分类词典[M].广州:广东人民出版社.

[6]张励妍, 倪列怀, 1999.港式广州词典[M].香港:万里书店.

[7]欧阳觉亚,周无忌, 饶秉才,2009.广州话方言词典[M].香港:商务印书馆.

[8]暨南大学汉语方言研究中心词典编纂组,2021.现代粤语词典[M].广州:广东人民出版社.

[9]郑定欧,1997香港粤语词典[M].南京:江苏教育出版社.

[10]曾子凡,温素华,2003.广州话普通话速查字典[M].广州:世界图书出版公司.

[11]陈小雄,2005.地道广州话用语[M].广州:羊城晚报出版社.

[12]甘于恩,2007.粤语与文化研究参考书目[M].广州:广东科技出版社.

[13]周长楫, 1993.厦门方言词典[M].南京:江苏教育出版社.

[14]黄雪贞,1995.梅县方言词典[M].南京:江苏教育出版社.

[15]张维耿,1995.客家话词典[M].广州:广东人民出版社.

[16]高然,2013.粤语词典编纂的问题与思考[J].粤语研究(第十四期).

[17]高然,2015.汉语“青”是什么颜色[M]//甘于恩:南方语言学:第九辑.广州:世界图书出版公司.

[18]高然,1997.漳州方言词汇概说[A]//邓景滨.汉语方言论文集[C].香港:现代教育研究社.

(原载《南方语言学》第21辑,刘新中主编,世界图书出版公司,

 2021年6月第一版)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多