分享

关于中医古籍校对问题

 竹根岭一号 2023-05-11 发布于江西

关于中医古籍校对问题

中医古籍,浩若烟海,三坟古书、医学肇始,自秦以降,《内经》始作。历史上的中医古籍分类,早期可见西汉刘向父子的《七略》。东汉班固以此为蓝本编撰了《汉书·艺文志》,其中医学著作专门为一类,即《方技略》。方技著作分作四大类:医经、经方、神仙、房中。

现存“中医古籍”的数量也非常庞大,《中国中医古籍总目》共收录全国150个图书馆(博物馆)馆藏的1949年以前出版的中医古籍13455种,约占我国全部现存古籍的十分之一。其中不乏珍稀版本,包括宋版书16种、元版书43种、明版书1500余种。现存中医古籍分布范围遍布全国各地,大多数保存于国内各中医学院校和研究机构的图书馆、国内省级以上综合图书馆内。

1958年10月,毛主席,在给卫生部党组的批示中,说:“中国医药学是一个伟大的宝库,应当努力发掘,加以提高”。这个中医药宝库,其最重要的载体就是中医药古籍文献。

在我国漫长的历史进程中,中医古籍整理与文献研究可谓“不绝于缕”。但较重要的、组织较多人才进行此项工作,其基本条件是需要取得官方支持的。而若干名医和著名学者,也发挥了他们的重要作用。

据《汉书·艺文志》记载:西汉成帝时,命刘向校阅世传各类书籍,撰成我国第一部目录学著作——《别录》。后由其子刘歆继承遗志编成《七略》,其中的“方技”(医药类)部分,由李柱国负责整理编纂。李氏校阅汉代以前的医经、经方共18家,490卷。《七略》是我国最早的图书目录分类著作,也是历史上较早的一次文献(包括多种中医典籍)汇集整理。隋文帝时,朝廷组织了一些医学家编纂了一部大型方书——《四海类聚方》,计2600卷,惜已佚失不传。

真正能有效整理、传承于世的古籍编纂、辑选与文献研究有以下几次。公元11世纪的北宋年间,当时光禄卿直秘阁掌禹锡、朝散大夫林亿、右仆射苏颂建议大规模整理、校订宋以前医学典籍,获得朝廷批准,专门成立了校正医书局。由掌禹锡、林亿、高保衡(太子右赞善大夫)主持此项工作。

另一次是清代康熙年间,由陈梦雷、蒋廷锡领衔编纂的《古今图书集成·医部全录》,全书约1000余万字,520卷,成书于康熙四十五年(1706年)。这是现存规模恢弘、有较为完善的编写体例,反映当时时代水平的官修医学类书,内容包括《素问》《灵枢》的原文及选注。其后内容又分若干部分,将清以前,历代医学名著的学术临床精粹内涵,予以选辑编纂。

还值得一提的是清代乾隆年间,一代文学大师,纪晓岚,主编的《四库全书》。其中的“医家类”共选乾隆以前历代中医名著97种以上,也是以临床医著为主,选辑也颇精要。

迄于近现代,在上世纪30年代,曹炳章,编纂《中国医学大成》(1936~1937年由上海大东书局出版排印本)。这是一个大部头的医学丛书,曹氏所选为民国以前历代名著(以明、清两代为主,加以点校整理,收书共128种,又以临床医籍为主,并选多种医案著作。值得注意的是,他把少数日本汉方医学家,如“吉益东洞、井村柿、丹波元简”的著作(如《药征》《灵枢识》等书)也选编于内,反映了中外医学交流的情况。再者,曹氏所选医籍中,还有若干“温热病”和一些临床各科病证的专著。总之,《中国医学大成》所选古医籍,卷数较少者占绝大多数。

此外,曹炳章,还编写了一部《中国医学大成总目提要》,1936年上海大东书局出版。

还有很多医学著作,如:

清光绪二十年著易堂刻本《名医类案》1夹12册12卷全、竹纸、手书上版、我国第一部以疾病种类编纂的大型医案专著。

药物学及临床应用!清咸丰八年,日升山房刻本《本经疏证 十二卷 续疏 六卷 附序疏要 八卷》12册全、竹纸、重在讨论本草药性,及其在古方中的运用。

综合性中医理论著作!清光绪十六年,浙江书局刻本《黄帝内经灵枢》8册9卷全、竹纸、为《灵枢》一书的重要版本。

内难经类!清嘉庆十年,艺林堂刻本《黄帝内经素问灵枢合编》1夹16册全、竹纸、版画、多偏于阴阳五行之说。

医书大合辑!清道光二十四年,古香楼刻本《沈氏尊生书》1夹28册全、竹纸、系沈金鳌20年心血的结晶!

中医古籍图文校对中的问题与对策:

中医古籍,传世久远,鲁鱼亥豕之讹在所难免。特别是雕版印刷术没有盛行以前,均为手写传抄,更容易以伪传伪。举凡字体的谬误、缺失,语句的脱落、颠倒,乃至衍文、增句,无所不有。再加上历代的兵火战乱,更使不少医籍散举报泆不全,如不详加考证校勘,势必有许多错讹夹杂其间。所以,为充分挖掘中医古籍的学术价值,中国科学院上海生命科学信息中心(以下简称:我中心)与中国中医科学院中国医史文献研究所签署合作协议,发挥各自技术与资源的优势,合作开展中医古籍数字化建设。

2008年,由该所牵头,争取到科技部科技基础性工作项目经费的支持,开展“350种传统中医古籍整理与深度加工”项目的工作,包括古籍图像采集、OCR文本识别、图文校对、标点、撰写内容提要、在古籍加工平台上,划分“篇次结构、元数据标引、语义关联标引、智能数据挖掘”等工作,我中心参与了该项目的部分基础性工作。

在中医古籍数字化过程中,通过OCR识别,得到的文本格式,有一定比例的差错,因此必须将选定的中医古籍扫描的原始图像与文本核对,即:图文校对。

图文校对,实际上是“死校”,即对所据底本的文字不加更改,图文校对是中医古籍数字化项目的基础工作,其质量的好坏直接关系到整个项目的质量。本文从“分段、撰写、校记、改错字、字体的繁简转化、计算机功能的利用”等方面,总结了图文校对的经验。

一、分段:

中医古籍,通过OCR识别后,从“TXT格式”转化为“Word格式”的文本,文档上的文字,是没分段落的,字迹密密麻麻,无法阅读。因此要将原始图像与文本对照,并以底本为依据,进行分段。

原刻本为了节约篇幅,许多应该分段的地方,没有分段。为了使校对后的古籍格式,规范统一,便于阅读,对于空行、空格、日录的层次和分栏以及方剂的分段、插图间隔符号“○”等情况,作以下具体规定。

1、空行和空格:

序、跋、目录、凡例、正文和每卷的开头,应空一行,以免混淆,其它地方不空行。每个段落首行缩进2个字符。

2、目录要分层次和分栏:

卷次以下类目录,缩进1字符,分栏一般为2栏。如《医方考》目录:

第一卷:        第二卷:

中风(—)      火(八)

指准(二)      斑疹(九)

感冒(三)      疟(十)

暑(四)        痢(十一)

湿(五)        泄泻(十二)

瘟疫(大)      秘结(十三)

大头瘟(七)    霍乱(十四)

3、方剂的分段:

方剂,由“方名、中药”组成,功用主治,由“制药方法、服用方法、加减”等组成。一般以方名和功用主治为一段,中药组成为一段,“制药方法、服用方法、加减”可作为一段,也可以将“加减”作为一段,视文字长短的具体情况而定。

中药组成中的各味药名之间,空1个字符,并熟记中药名。不熟记中药名,就会出现常识性错误。

如“白伏苓、桑白皮”,是2味药,如果不熟悉中药名,就会将其断句,为“白伏、苓桑、白皮”三味药。

4、插图:

如果原文献有插图,在文本中插图的确定位置上,插入一个方框图形,大小醒目就行,不必与原插图匹配,并在方框中标注图号与图名(见图1)。

图2《内经》三部诊候图。

5、间隔符号“○”:

由于原刻本为了节约篇幅,许多应该分段的地方,用间隔符号“○”,或空1 个字符来表示。因此,如果该段文字很长,可以在间隔符号“○”,或空1个字符处分段,视具体情况而定。

二、撰写校记:

一般中医古籍的校勘方法,是先选择一善本作为底本,再选择不同版本进行互校。如果改动主校本上的任何一个字,应一律出校记。中医古籍数字化项目中的校对内容,只是对特定古籍版本进行图文校对,与一般中医古籍的校勘方法不同,所以一般不出校记。有的古籍在长期流传过程中,书页散乱。重新装订时,页码颠倒,或缺页,在校对时发现内容不连接,因此要在校记中,注明××页应在××页之前,或往明该处缺页。校记置于当页之末,统一采用①、②等阿拉伯带圈数字,以横线与正文隔开。

三、改错字:

对在图文校对过程中,发现的文本识别中产生的错误,应均应按底本一一政正。 文本识别致误的原因很多,有字形相近、笔画增损、脱文或模糊不清、造字,异体字、通假字、古今字、避讳字、术语不统一,中药名的不规范,容易混淆的字词,重文符号等。

1、字形相近:

由于古籍刻本中,字迹模糊,字形相近,对其进行OCR识别时,很容易出现错误,根据上下文的文意改正。

如:處虑,些柴,木本,己—巳,阳阴,干于,心—必,置,贾要,背皆,苦若,匕七,川用,自白,曰—日,煎前,甚其,人入,辨—辩,—榖,摸,卬印,适造,古占,面—而……。

2、笔画增损:

有些字本来的差别,就在一两个笔划。古人书写乃至刊刻时,不太注意个别笔划的增损,因而导致文字混淆难辨。如:“穀”、“”,在“胃者五之腑”中的“穀”,根据上下文的文意,应改为“穀”。

文本识别后的繁体字文本,使用计算机中文“简繁转换”功能,不能转化。只标出“?”或空格,则须要对照底本,如能确认,简休字则直接修改,否则照旧。明显的错字、别字,或系一般笔画之误,可以迳改。如:“胃者而?之腑”中的“?”可改为“谷”。

3、脱文或模糊不清:

古籍刻本,由于模板片的断裂,印刷磨损等原因,造成脱文或模糊不清者。以虚阙号“”按字数一一补入,以便其他本子核对时补入。

4、造字:

字库没有的字,需要用墨丁“■”表示,并在其后用括号注清字形组成,根据字的结构采用如下的标注规矩。左右结构:在墨丁“■”后的“【】”中,注清字形组成,如:■【亻亦】;上下结构:在墨丁“■”后的“【】”中,注清字形组成,并用“/”隔开,如:■【宀/取】;有些无法找到直接组成部位的字,用墨丁“■”表示。

5、异体字:

异体字,可以迳改。常用异体字(后一字为正字,下同)如:鲠,徧—遍,仿,藉—借,暖,迳—径,钜—巨,并,嚥—咽。有非异体字,只是意思相同。但为了读者方便,仍以后者为正,如:啜—歠,咳。在校对中发现,有些字库中没有的字,但经专家鉴定,可以确定为异体字,可以迳改。例如■【声/耳殳】为“声”,■【虫歇/虫】为“”,【火苪】为“”,■【去欠】为“呿”。

6、通假字和古今字:

通假字、古今字,一般不改,但少数易混淆的常用字,仍可改正。内—纳(不改),剂—齐(不改)、蚤—早(不改)、絪氤氲(二者相同,不是通假字,不改)。少数通假字,则需要统一改正,如:“畜”改作“蓄”,“王”改作“旺”,“写”改作“泻”,“半身不随”改作”半身不遂”。

7、避讳字:

避讳字根据不同情况,或保留,或回改。回改:“元机”改“玄机”,“元府”改“玄府”、“坵”改“丘”。“陶宏景”改“陶弘景”;保留:清代已经习用成俗的避讳字,或药名,不改。如:黑参、元参(即:玄参),元胡(即:玄胡索)。

8、术语统一:

术语统一(统一改作后者)。藏府—脏腑:(但若是引用《内经》原文,可以不改。如:“藏象”不改“脏象”,足指—足趾,雌痖—嘶哑。

9、中药名的规范:

中药名的规范统一,与保持原貌,举例(后者为正):旋复化→旋覆化,白芨→白及,白敛→白蔹,白鲜皮→白鲜皮,虾蟇→蛤蟆,燕脂→胭脂,磐蝥→斑蝥,茵蔯→茵陈,黄檗(蘖)→黄柏,人蓡(蔘薓)→人参,莪茂→莪术,硃砂→朱砂。消石→硝石。芒消→芒硝,硫磺→硫黄,藊豆→扁豆。针灸六名统一用字:瞳窌→瞳髎,蹻→跷。原为药物异名、或体观时代用药特征的药名不改:“括楼”不改做“瓜蒌”,”连軺“不改做“连翘”。

10、容易混淆的字词:

蹇、謇:音同义不同。“謇”下为言,指言辞不顺利,用于语言謇涩;“蹇”下为足,指动作不顺利,舌蹇或足蹇。躁、燥:音同,义不同。“烦躁”——“秋燥”。(喎)、歪:中医用“口眼(喎)斜”。症、证:尽管现代,对“症”、“证”用法,有争议,但中医古籍各随本字,不强求统一。

11、重文符号:

重文符号,改回原字,例如在中医古籍中,“郁而生涎,涎结为饮”中,后面的“涎”用“”或“匕”代替,应改回“涎”。

四、汉字的繁简转化:

为了尽可能减少“阅读、书写、使用”中医文献的困难,需要进行字体的繁简转化。

1、繁简二者 字义不能完全重合,大多数汉字简化,可以迳行转换,有的字表示两者字文不能完全重合,替换及简化需谨慎!当视文意而定。

如:乾隆的“乾”。乾坤的“乾”。转化为简体字,则变成“干”。

如:“柰”,确定文句中的“柰”,做奈何之文时,可将其改作“奈”;而若作果物之义时,则应仍你持其项样“柰”。其余字组替换,可仿此。

2、中医常用的繁体改简体(后一字,为正字):

採—采,觔—斤,闢—辟,噉、啗—啖,稜—棱(如有疑问,一般以《现代汉语词典》为准)。注意:涩(澀、澁)、濇二字,都有简化字,意思相近,各随本字;于(yu)、於(yu,wu)二字多数地方,可通用,“于”还可作姓,“於”也是一个姓,同时“於潜”是浙江一个地名,以产白术出名,所以“於(白)术”,必须用“於”,“於(wu)菟”,是老虎的别名;“耆”、“芪”,“蘹”、“茴”不是简化关系。

五、计算机功能的利用:

由于中医古籍中,很多字不规范,有“古通行字、古简体字、古繁体字、古俗体字、古异体字、古讹字”等情况。因此,用OCR软件识别后的文本中,有的繁体字使用计算机进行中文“简繁转换”功能,不能转化为简休字,因字库中有的字没有,只能造字。

1、用计算机对字体的繁简转换后,在校对过程中,注意收集未能转换的繁体字,并通过各种辞典找到简体字,把它制成表格,并按—定规律排列,同时,为了在简化字体时,被免误将繁简两者字义不能完全重合的字,转化为简体字,请中医文献学专家,对这些字进行鉴定,做到准确无误。对于暂时无法确定的简体字,则保留繁体字。这样就可以用这些字,对每种需要繁简转换的古籍逐字进行批量替换,提高工作效率。

2、利用计算机的“复制、粘贴”功能,在平时校对过程中,注意收集常用的造字,把它制成表格,按一定规律排列。在计算机上这样操作,就不需要对每个常用的造字,进行拼写,只需“复制、粘贴”就可。

六、小结:

图文校对,是整个中医古籍数字化项目的一项基础工作,其质量的好坏,关系到每本书的质量。经过几年工作实践,我们认为,要保证校对质量,必须注意以下几点:

一是,图文校对时,必须以底本作为依据进行改动,为读者提供可靠的文献资料。

二是,在改错时,特别注意字形相近,笔画增损,脱文或模糊不清、造字、异体字、通假字、古今字、避讳字、术语统一、中药名的规范、容易混淆的字词、重文符号等情况,应根据原文意改正;如无法确定的字,应请专家进行鉴定,不能自作聪明而想当然的改,错改不如不改!

三是,可以利用计算机的“替换、复制、粘贴”等功能,提高工作效率。

校对中医中药书稿要注意哪些事项?

中医中药源远流长,有几千年的历史。有些中医学著作,始自远古,字义深奥自不必说。即使一般中医中药书稿,也有不少它独有的术语和生僻字,再加上中药品类繁多,有好些别名,中医中药著作中,字体繁简混杂,同音字、形似字又多,所以校对起来,更要仔细。如经络穴位的名称,有些很相像,或只有些许差别,如:三阴、三阳,少阴、少阳,太阴、太阳;手三里、足三里,天突、天鼎,少海、小海等等。

古典中医中药类稿件的校对,注意事项,可以参考古籍校对条目。另外要注意一些古代医学作品的名称、作者和年代,以免相互混淆。例如,中药统称:本草,关于本草的著作,最有名的为明代李时珍的《本草纲目》,同类书籍,还有早于它的《神农本草经》汉代)、《神农本草经集注》南北朝陶弘景)、《新修本草》唐代),及晚于它的《本草纲目拾遗》清代,赵学敏)、《本草求原》清代,赵寅谷)等。

下面再列举几位古代名医及其作品。《内经》是《黄帝内经》简称,现分《素问》、《灵枢》两书,可算是我国最早的医学著作了。战国时的扁鹊,姓秦名越人,所著《内经》《外经》已失传。现传《难经》是后人伪托之作。汉末的华佗,精“内、外、妇、儿、针灸”各科,外科尤擅长,首创“麻沸散”及“五禽戏”,现存《中藏经》系后人托名之作。汉代张仲景,其名著《金匮要略》及《伤寒论》。唐代孙思邈,有名作《千金要方》及其续编《千金翼方》。他在世102年,这样的高龄,不要说在那个人约寿命,只40~50岁的时代极为罕见,就是在如今科学发达,人约寿命以到70~80岁的时代,也极少有,可记住以免校到他的生卒年份时,又生疑窦。

中药处方,过去是竖写的方式,现在为横写方式了。它的写法是先写药名,紧接着用(小1号的字)附写剂量(在校样上,最好各行药名对齐,回行顶格写)。中药过去所用单位,是“斤、两、钱、分、厘、毫”(旧市制1斤合16两),处方所用剂量多以钱为单位。现在则改为以公制计量单位,以“克(g)”为主单位,“毫克(mg)”为辅,,也可用中文名称。1两等于50克,所以每味中药剂量数,大多在50克以下。药名、剂量,关系到用药的正确和效果,校对时要做到根据原稿绝对正确,以保证用药患者的安全,遇有疑问,要及时提出来。

中医中药书稿中的插图,也是校对注意重点之一。如针灸图上的穴位及其名称的正确是很重要的,错了一点,就达不到治疗的效果。有的穴位用注码代替,注文与注码要严格核对,保证无误,又如中草药图,有的形态很相似,稍稍疏忽,便会张冠李戴。校对时要再三审视,以免差错。

中医中药书中,有些术语,有它的特定含义,它的“词序、用字”,都是不能随便更动的,如:“望、闻、问、切”、“辨证施治”、“如法炮制”等,常被误写或误排为“望、问、闻、切”、“辩证施治”、“如法泡制”等。类似的易于错排的字,还有(括号内是不正确的):黄连(莲)、枸(构)杞、针灸(炙)、当归(旧)、茵(荫)陈、苦楝(栋)、黄芩(苓)、芒硝(消)、川芎(弓)、茯苓(芩)、柴(紫)胡、便溏(糖)、消渴(喝)、咯(呕)血、背痈(痛)、疱(泡)疹、溢脓(浓)、咳嗽(漱)、癔(臆)病、黄疸(疽)、脉搏(膊)、器官(管)、药剂(济)、肾盂(孟)、中枢(躯)、痉挛(栾)、松弛(驰)、脓胸(脑)、钝(纯)痛…遇到这些词时,校对时,务必小心在意。

关于:

校对价格:这要根据书籍校对的难易程度和工作量,标准不一。校对难度低的,是每一万字60~80元,难度中等的,是每一万字90~110元,难度较大的,是每一万字120~150元。难度特别大的,是每一万字180~200元。

字数计算:这个字数,不是Word计算出的字数,是按照出版业的习惯,字数=每页行数×每行字数,即便存在空白,也按照满版计算。所以每本书版权页上的字数,实际上都要比Word计算的字数,多出20%~30%(如:字号,为:五号,满屏的话,大约每页有44行×每行有55个字,包括标点符号,除去段首缩进2个字,总共约为2400个字),这在出版业中,称为“涨版”。

日校对量:一般刚开始校对的校对员,每天(八小时)的校对量(校对难度中等的),大概在二万字左右,校对了一个月的校对员,每天的校对量,在二万二千字左右,校对了二个月的校对员,每天的校对量,在二万五千字左右,校对了三个月以上的校对员,每天的校对量,可达三万字左右。有几年工作经验的校对员,每天的校对量,可达四万字左右。

校对误差率:规定差错率在万分之一以上,即为不合格品。即每万字最多允许有一个差错,当然,这里的字数是指版面字数,而不是指实际字数。错一个字,计一个;错一个标点符号,计0.5个。

工作收入:一,这个工作相对长期稳定,时间自由,在家兼职都可以做。二,没有什么技术门槛和难度,只要你有一台电脑,会打字即可(不会打字的,用手写板,写字也可)。三,工作简单,只是逐字对照,查找“多余的字、漏掉的字、错误的字”,把它们修改即可。四,收入可观,多劳多得,月收入可轻松过万,甚至几万。

工资结算:你每校对完一本,在电脑上发给我们,我们核对无误后,大约7个工作日之内,会把钱打到你的卡上。

热诚欢迎有志之士,加入到我们之中,为抢救“中医古籍”发一份光和热!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多