分享

张轩湖《诗法例释》(八)

 陋斋闲人 2023-02-20 发布于河南
图片

附录四  搜韵网

搜韵网是目前学习诗词最好的网络工具。创始人陈逸云,号辰窗,为微软中国首席软件工程师,又承家学,故对传统诗词情结很深。历时十年,独自写成搜韵智能化诗词网站,为广大诗词爱好者提供免费服务。自上线十余年来,用户遍及全球,现在年浏览量已超过四亿。

搜韵网从功能使用上看,近89%的流量是为辅助创作服务的;其它11%的流量主要是查阅诗词,部分是出于学习目的,另一部分是出于研究目的。本章主要以创作为出发点,兼以学习和研究,系统概述搜韵网功用,以期对读者有所帮助。

一、创作功用

搜韵网现收录诗词曲等作品103万首,词汇库约50万条,可为创作者提供大量的遣词造句、对仗和用韵建议。

(一)遣词造句

遣词造句涉及到最基础单元,即字的组词法。在《诗中拾缀》里讲到了搜韵里韵字的排列规律,即按照大数据中韵字的使用频率由高到低来排列

搜韵的韵表有三个显著特点:

一是增收字头韵表主要以《佩文韵府》、《词林正韵》和《中原音韵》为基础,再参以历代诗库和《康熙字典》进行增订。搜韵网根据作品用韵与《康熙字典》互相参照,大量增收字头;又通过古人诗例,根据读音相同所属韵部也应相同的原则,使字头达到约两万五千多。虽然与《康熙字典》收字总数(字头46530个)尚有距离,但是未收的多是极冷僻的字,对整体影响甚微,可以忽略。

二是很好的处理了异体字问题。现今的简体字,在韵表里是作为异体字来处理的。正异体如是一对一关系的,并不存在难度。韵表要处理的,主要是一对多的情况。如“饑”和“飢”本是两字,分属五微和四支韵,但是简体化之后,即变成“饥”,一字分属两韵。又如“煇”字,可以是“辉”、“晕”或“熏”字的异体,且分属五微、十三问和十二文三个韵部。也有一些简体字,虽然也是一对多的情况,但由于对应的多个正体字,恰好同属一韵部,所以没造成影响。例如“发”的正体“髮”和“發”同属六月。

三是处理同一字在相同语义下,或不同语义下的异读问题。对于可平可仄的字,如“听”、“看”、“望”等处理起来比较简单。对于非得在具体词汇中才能区分出来的一些读音,如“思”有平、去两读,在“相思”、“思量”等词汇里平读,而在“诗思”,“旅思”,或语义作“悲哀”解时仄读。又如“观”字,在“贞观”一词中仄读,明朝以前的作品,皆是如此。但到了清初,却开始出现平读的例子。如清初毛奇龄五言排律《上李相公》有句“鸿文标正始,嘉绩迈贞观”。搜韵网通过对诗库作品中涉及多音字的词汇在律诗中的关键位置进行自动统计归纳的方法,确立了323个多音字在623个常见词汇中的读音。

了解了韵字的排列规律,韵表的特点,最终要看组词,并用之造句。搜韵网的词汇除来自于对仗词汇外,还有来源于《汉语大词典》、《骈字类编》、《分类字锦》、《典故辞典》和《佛学辞典》等约50万笔。每个韵字的组词都有详细的解释和在诗词里的应用。

还要注意韵字作为一句的末字。搜韵将相同末字的诗句汇总后归纳统计,得到每一个韵字的大量诗例。归纳统计主要从诗句末三字的使用频率、作品体裁、诗句在整首中的位置和作家的知名度等四个方面来确定诗例价值。如同样的末三字,名家名作,且出现在律诗中间两联的句子,或出现在古体诗作中的句子,作为诗例的参考价值就要高一些。

遣词造句里另一重要功能是对仗。对仗是写诗填词的基本功。第三章专门有相关论述。搜韵利用组词法提供了强大的对仗检索功能。

搜韵诗库有律诗39.3万首,排律1.5万首,通过自动分析归纳,可得到单字、双字和三字对仗词汇约265万对。在自动归纳的过程中,主要借助统计和对仗的递推关系来保证精度。通过考察同一组对仗或同一个词汇在多首作品中出现的频度,可得到双字或三字是否成词,以及每一组词汇是否可对仗的置信度。选择置信度比较高的,便可得到对仗词汇库。例如,经统计,有181首作品都以“天地”对“江湖” ,这一对仗的可靠性是毫无疑问的。又诗库中“天地”对“林塘”虽然仅有一例,但 “林塘”也有与其它很多词汇对仗的例子,而且这些词汇,通过链条关系“天地→林塘→风雨→江湖→天地”,最后又可回到 “天地”这一词汇,那么这一对词汇虽然仅有一例,也仍是可靠的。值得一提的是,对仗词汇的链式递推功能,使得计算机不止能提供某一词汇来自古人的对仗词例,还可发掘出大量古人还未使用过的对仗词组。二百多万对仗词汇,又可演变出几百万对新的对仗词组,供创作者参考。

同时,学习韵字的时候,例如一东韵首字“风”,第一个组词为“春风”,注释后面附带了大量对仗词汇,如“夜月、夜雨、晓日……”等,也为读者对仗知识的学习提供了方便。

(二)作品校注

搜韵网带有“律诗校验”、“词格校验”、“曲格校验”、“对联校验”和 “自动笺注”五大功能。写作完成后,作者可将创作内容对应校验,检查存在的问题。

1.“律诗校验”校雠,主要通过内容的自动审查,完成六个方面工作:

一是根据所选韵部,检查用韵是否正确。如出现错误,会有粉红色标识。作者根据标识提示,对诗作进行针对性修改。

二是把不合声律要求的地方标示出来,由人工确认是否有讹误。而讹误处后面提供了大量修改建议。

三是对于常见语病进行标识提示。如三平尾、三仄尾、拗句等,供作者参考修改。

四是对重字进行校雠。

五是校雠相似句子,避免与前人用语高度重复。

六是完成前述所讲的辨音校雠。指出可能的读音错误,依据数据库,结合上下文用字和平仄要求,给出修改建议。

2.“词格校验”校雠,则有钦定词谱和龙榆生词谱进行选择。主要有四个功能:

一是检索填词中存在的声律及用韵错误,附带相关修改建议。

二是用于纠正或找到遗失的词牌名。如《全宋词》收录有“和尚性好耍,贪恋一枝花……空惹旁人话。”一词,题目注“失调名”。借助搜韵网的“词格校验”功能,只须输入这首词,计算机即可从二千多种词格中找到最佳匹配,提议此词调名是《卜算子》。

三是可以把得到的语句进行匹配搜索,以寻找最合适的词牌载体进行创作。

四是在词牌栏目检索关键字,快速寻找契合目的的相关词牌。

3.“自动笺注”校雠,则对作品所用的典故、词汇、地点、人物、动植物等进行系统全面分析。如是古诗文,则起到研究辅助作用。

以上校雠功能,大大提高了写作效率,让作者把更多的时间专注于作品的立意和谋篇,而不是搜肠割肚地寻找词汇或韵字。省去了读书的时间。

二、学习功用

搜韵网不仅提供了强大的辅助创作功能,更自带强大的学习功能。主要有七个方面:

(一)诗词曲等作品集

搜韵网是目前最全面的诗词作品集。截至壬寅年底,共收录了上起诗经、下至当代大量诗词作品共103万首。如宋代有9648 位作者,283494 首作品。作者根据姓氏笔画排名。也可以直接检索名字如苏轼,可以检索到收录作品3242首,并按照五律、七律、五绝、七绝、五排、七排、古风、词、四言、六言、其他、乐府、偈和联进行分类,方便读者有针对性阅读学习。

另外,名篇后附有评注,集中了历代以来的各类相关的见解和评论。作品中涉及典故的地方都有相关注释链接;对作者生平也有相关的链接介绍。

(二)词谱与曲谱

搜韵词谱主要包括钦定词谱和龙榆生词谱,对收录的词牌有较详细的注解。另外还对不同词牌和曲牌的历代作品进行了分类,方便词曲爱好者揣摩声调规律,对照学习。

(三)词汇与韵典

搜韵总共收录了52万多条词汇涉及典故人物2352个,皆可以快速检索查询,也可以从人物里面去搜寻典故,省去了读史书的时间。

韵典主要包括平水韵词林正韵中原音韵,以及后来添加的以普通话为基础的中华通韵。在《诗中拾缀》里讲到一个韵字学习三份法,即重视中间三分之一韵字的组词,这样可以省去大量读书的时间。这里就不重复提了。

韵字作为一句的末字时,以诗句末三字为基础生成了大量诗例,这也是学习韵字的一个非常好的对比平台,同时对炼字有极好学习效果。

(四)诗话词话

搜韵网收录了上起南梁钟嵘的《诗品》,下讫当代部分著述共156篇。方便读者选择学习。

(五)古籍与类书

搜韵是一座大型古籍博物馆,共存各类电子书16181本。

古籍类按照经、史、子、集、佛、道等六个方面进行分类。如经部又细分为礼类、群经总义类、乐类、小学类、春秋类、五经总义类、易类、孝经类、诗类、书类、四书类、经解类、孟子类、论语类和艺术类等,收录专著1829本;而礼类255本又按照年代分别归类,方便检索。

类书按照钦定古今图书集成、渊鉴类函、佩文斋咏物诗选、艺文类聚、广群芳谱、骈字类编、分类字锦和方舆胜览等八个方面进行分类。如广群芳谱又细分为天时谱、谷谱、桑麻谱、蔬谱、茶谱、花谱和果谱等。

(六)简繁转换

搜韵网的简繁转换,是目前网络上智能化最高、出错最少的诗词简繁转换工具。对于甄别异体字及多音字有着很高的可靠度。

(七)搜韵课堂

在自主学习的基础上,搜韵网有目的开展了一系列网课,主要有律绝创作、填词入门和部分公开课。前两者聘请当代诗词名家主讲,收取低于市场价的一定报酬,公开课则是不定期开办的免费教学。

三、研究功用

由于搜韵网具备声律智能化以及诗库和词汇库声律化的技术,并能将声律智能化成果应用于诗库103万首作品中,将声律智能化技术应用于词汇库约50万条数据中,实现了诗词曲的辨音、校雠和辅助创作等功能,形成了千万数据级的数据库。

当把上述资源以声律为纽带集成在一起,将作品每句按平仄句式分类索引,则可为诗词平仄句式研究提供庞大的数据支持;根据整首用韵和格律约束特征,则可协助辨别多音字在各个词汇或人名中的读音;再根据作品创作时间,又可考查某一词汇在各个历史时期的读音演变;根据押韵及诗词格律约束,可辅助诗词编辑校正讹误。

(一)辨音

借助押韵的规律,以及近体诗在每句关键位置的平仄要求,可用于考察含有多音字的词汇或人名读音。如一些人名读音,由于历史资料的缺失,成了当代一些学者的难题。以唐代岑参为例,“参”字主要有cān,shēn两读,分属十三覃和十二侵。究竟应该读作哪一音,从文章的搜索结果可见,学者们各执一辞,但都没有找到有力的证据。叶嘉莹先生在释岑参诗《逢入京使》中认为应读cān,理由是岑参出自名门,家族对其抱有期望,希望他参政。这个是从主观上去推测读音,并没有说服力。另,电视剧《长安十二时辰》则按shēn音读,不知所据。实际上,在搜韵网建立了声律化的诗库之后,这一问题可以很容易地解决。只要以“岑参”作为关键词,限定在律句中搜索,便可很容易地找到以下五个诗例。一是宋孔平仲《子瞻子由各有寄题小庵诗却用元韵和呈》诗:“大隐市朝希柱史,好奇兄弟有岑参”,按年谱,此诗作于公元1083年;二是南宋廖行之《书怀》诗:“闻道秋郊足佳趣,好奇谁复似岑参”;三是南宋刘克庄《又和感旧四首 其四》:“畏垒屡丰愧桑楚,汉嘉虽小屈岑参”;四是元宋褧《初秋苦雨》诗:“憭慄未须悲宋玉,沉吟漫尔忆岑参”;五是清王树楠《定甫上公席中赠伯谦》诗:“从此天山续佳话,大名原不属岑参”。如果不限定诗体,那么还可找到宋洪皓《戏用迈韵呈吴傅朋兼简梁宏父向巨原》诗:“置驿复郑庄,好奇过岑参”。无一例外,这六首诗都是押十三覃,可见古人向无异议,这六位古代学者,皆认为应读cān。而且孔平仲此诗作于1083年,去岑参卒年才313年,不算太远。唐代很多书籍今虽已亡佚,但作为相去不远的宋人,肯定会读到很多今人已经看不到的唐代书籍。孔平仲及另三位宋人皆认为读cān,很大可能是有所根据的。这样为读cān立论,则会可靠很多。又如司马相如的“相”字,时常会听到有作去声读的。“相”字虽然不是出现在韵脚,但是采用同样的方法,根据律诗句式平仄约束的特点,便可很容易地找到古人皆认为应该平读的证据。再如“尚书”,作官职时“尚”平读,作书名时“尚”仄读,也是可以根据律诗句式的平仄约束找到证据。

(二)句式平仄研究

声律化的诗库,为作品的每一句每一字都标示了平仄,据此,学者可很方便地对律句的平仄展开研究。例如,输入本句自救的句式“中仄平平仄平仄”(“中”表示此处不限平仄),即可从历代律诗中,找到18484个句例。再在前面的基础上,把第三字限定为仄声,输入“中仄仄平仄平仄”,又即可找到1985个句例。通过简单的对比就可见到,在七言律诗本句自救的平仄句式中,第三字倾向于用平声字的,将近十倍于用仄声字的。由此可见,前人所提倡的在本句自救的拗救句式中,第三字用平,是有一定依据的。类似的方式,还可用于协助研究三仄尾、三平尾的情况。可以很容易地发现,三仄尾在历代律诗中很常见,三平尾,则要少得多。

对于词谱,读者可以很容易地把历代用同一词谱的作品聚合在一起,方便学者做溯源,或者是对现存词谱句式平仄、押韵要求是否合理,展开研究

(三)诗词地图

通过把某个诗人作品按照创作时间和地点进行数据化和可视化处理,对研究诗人生平及作品的艺术思想起到辅助作用。

搜韵网是人工智能在传统文化领域应用的一个成功范例,并产生了较大影响,具有广阔的应用场景。它大大降低了传统诗词创作的门槛,其智能化与便捷高效吸引着越来越多的诗词爱好者从事创作活动,使传统诗词的创作又重新焕发出蓬勃的生命力。

按:此文由陈逸云先生授权,并得到内容和数据相关支持。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多