分享

数据挖掘在方剂学研究中的应用与发展

 369蓝田书院 2019-05-24
计算机挖掘技术能精准、迅速地找出医学辨证与治法的规律,适用于方剂学的研究,提出在方剂学研究过程中,要对收集的信息进行有效数据预处理、采用多元化挖掘方法、确立评价体系等发展对策,方能从挖掘出的成果中领悟到方剂学的理念和精髓。

[摘要] 阐述了数据挖掘技术在方剂学研究中的常用方法和在方药配伍及用药规律中的应用,说明其在方剂研究中存在缺乏规范化、评价方法和研究人员知识结构差异性等问题,并提出了建立数据库和研究系统标准化、进行数据预处理、采用多元化挖掘方法、确立评价体系、培养兼备中医药知识与计算机技术研究人员的发展对策。

数据挖掘是一种多方位、多领域、多技术相互交错的研究方法,可以对信息库中的数据进行分析和管理,能极大降低数据科研分析难度,在各学科广泛使用。它对数据的高度抽象与概括,使数据由感性升华到理性认识的特性,在对中医药资源进行知识的获取研究时具有去伪存真、去粗取精的功能,是中医药现代化研究的重要组成部分,在方剂学研究中也具备较高适用性。方剂学文献中广泛包括治法治则、配伍规律及临床应用,其中蕴含着大量可信数据。在数据挖掘技术的支持下,能够对中医药理论的方剂配伍及应用规律进行有效筛选和整合,系统地将各类信息加以归纳,高效研究古今验方,在方剂研究中实现高效组织、存储、管理及深刻整合、挖掘,为我们深入研究方剂学创造了新的路径。如今,数据挖掘技术已渗透到方剂学研究的各个领域,其良好的适用性使得方剂学研究更具成效。

1  数据挖掘技术在方剂学应用的现状

作为从庞大的模糊数据中提取有用信息的新兴信息处理技术,数据挖掘技术使数据整合处理步入了更高级时段。这项技术不仅能对从前的数据资料进行查阅,还能搜寻出数据间微小的潜在联系,促进了信息的传播。中医经过几千年的发展,大量临床经验得以保存,并积累了许多方剂资源。如今,我国已创建了庞大的方剂数据库。合理利用数据挖掘技术,在方剂数据库中检索研究,可以迅速加快中医方剂组方配伍的研究,更能精准提取到各家方剂中存在的组方配伍规律,探寻临床疾病的辨证审因与组方配伍的关系,从而为方剂学的数据信息研究提供新的有效方法。

数据挖掘的过程中所利用的技术越多,则得出的结果越为精准。中医药研究中常用的数据挖掘方法种类繁多,可分为关联规则、聚类分析、频数分析、粗糙集和人工神经网络等。邢泽欣提出,数据挖掘对于方剂学可进行数据库设计、方剂配伍、方剂功效等研究。而在方法的常用性上,邓宏勇等则通过检索文献挖掘历年方药数据,经过人工的收纳整合分析后,发现在方剂配伍使用中最广泛的当为关联规则,其次是频数分析和聚类分析,而人工神经网络则是中药现代研究的常用方法。

与此同时,不同研究领域所涉略的探寻方向及数据挖掘方法各有不同。王静等提出了如何将数据挖掘应用于方剂学研究中,认为在利用数据挖掘技术对方剂学进行研究时,可应用医学多元统计学,具体包括聚类分析法、判别分析法、回归分析、利用数据仓库专业的分析工具及关注频繁项。或可采用人工智能方法,包括模糊数学模型应用、基于神经网络的运用。邬锡琴等则归纳总结了数据挖掘应用于方剂学的领域,认为在具体应用中可分为方证规律探讨、基于类方分析的方药配伍规律、医家药物使用特色,同时可适用于方药对于疾病的特异性研究。

数据挖掘的各种方法与方剂学相互结合,在研究的过程中相辅相成,取得了较好的研究成果。例如,基于方剂的配伍规律,阮时宝等探寻的结果主要有两个:第一,药对药组配伍规律的研究。该研究验证了一些古籍与民间经验流传的药组配伍,除此之外,更是发现了许多特殊的药物配伍,这项药对药组的研究极大推动了方剂学的发展。第二,方-药-证的规律探讨。方剂是一门综合性学科,它将中医之理、法、方、药囊括其中,彰显了辨证审因、治疗方法及用药理论。方剂的配伍规律不仅体现在对药物的熟练运用上,亦表现在对患者的辨证论治中。运用数据挖掘技术可以研究中药的性味归经、药物功效、炮制用法、功效主治和方剂类别的归纳对比,将传统的君臣佐使理论与现代的临床运用结合分析,从整体上完成从辨证察因到组方论治的过程。杨雪梅等采用分类关联规律方法,挖掘出明清时期脾胃湿热方的用药组方及辨治规律。雍小嘉等在研究的过程中采用《中医类方辞典》中所收纳的方组为样本,将药对组方进行数据量化,从而确认了以药物高维数据归纳方法判明方剂功效的可行性。蒋永光等则从《中医大辞典·方剂分册》中选取1355首脾胃方,通过运用关联规则、分类分析及聚类分析等多种手段,从性味、归经、剂型、功效、主治等,从多层次多领域进行总结,最后分析出多种规律。综上所述,各类数据挖掘方法适用于方剂学研究,并取得了可喜成绩。

由此可见,方剂研究人员利用数据挖掘技术,致力于研究方剂功效、方剂聚类和方剂关联规则,进行频繁的数据模式挖掘,并皆有成效。方剂学者应正确使用数据挖掘技术,通过计算机软件和虚拟智能等多种方法,对信息库中的资料进行创新性整合,从而获得预期的研究成果。若想进一步完善和证实中医的理论及经验,可通过数据挖掘对中医药方剂文献数据进行探索,创新中医药基础理论研究。

2  存在问题与对策

2.1  存在问题

由于方剂学研究数据不仅包含了经方药对、实验结果记录,还包括了现代临床组方、配伍疗效对比等,学者们若能运用数据挖掘技术对其进行研究,必能推演出方药规律并从中获益。但是,数据不等同于知识和学术,方剂的关键是配伍与运用,对它的领悟及使用决定了临床组方是否合理,并与中医辨证论治时方剂的效用休戚相关。就目前而言,方剂学数据挖掘研究仅仅满足于挖掘局限的表面规律和单调地归纳数据,却不对方剂系统内最重要的机制或内涵进行深入探讨。不仅如此,数据挖掘技术应用于方剂学研究属于新兴技术,其研究系统仍存在纰漏和不完整性,不少学者在使用数据挖掘技术探讨方剂研究时出现许多不足。例如阮时宝等提出方剂学在数据挖掘运用上,存在缺乏规范化、规律验证性和研究人员知识结构差异性的问题,其中规范化问题又具体类分为数据的预处理问题及数据源的规范化问题,并将所有问题进行详细说明。

2.2  解决方法

如何在方剂学数据信息进行挖掘和提炼时,进一步压缩数据结构和提高算法效率,是今后研究中亟待解决的问题。根据以上情况,笔者提出如下几点解决方法。

2.2.1  数据库及研究系统的标准化  学术界应重视方剂数据库的建立,对数据库中的资源进行统一及标准化,并设计出适合方剂学研究的分析系统,便于研究者有效地完成方剂搜查。研究者在尝试将数据挖掘技术及机器学习相关算法用来寻求方剂的配伍关系、病证方药的证治规律时,推出了若干方剂分析系统。但是由于科研领域中方剂数据库中的缺漏,这些方剂分析系统对半结构化数据支持、数据的规范化和信息的共享方面均存在不足,成熟的方剂分析系统比较少。故而中医学者在进行方剂学数据挖掘时,经常遇到一些无法忽视的问题:数据库中的数据错误或不完整,不同数据库检索结果不一致,数据库中存在错误的、冗余的、无效的和不一致的噪声数据,对结果进行分析时部分结论与中医理论不符合等。这些问题不仅造成中医学者在数据挖掘过程中研究的繁琐化,而且需要进行数据预处理,增加了研究难度,如果数据预处理不到位,会使得研究结果缺乏可信度,难以达到预期要求。建立数据库资源标准化及研究系统的标准化能有效地解决这个问题。

2.2.2  进行数据预处理  方剂学者在收集研究数据时应避免疏漏,对遗失数据进行有效处理,并重视患者隐私保护工作。方剂学研究数据来源广泛、跨时较大、千差万别,不仅包含了文献古籍、实验数据,而且还有医生对患者开具的处方用药以及方剂中迥然相异的中药配伍等,具有数据量大和数据类型复杂的特性。研究人员在系统而完整的方剂学数据库规范化出来之前,应尽可能收集可用数据,并合理解决部分数据的缺损问题。例如,在对方剂学临床数据的整理上,研究人员应对非规范的原始数据进行有效的预处理,整理患者遗失的病案记录,消除数据中的错误和不一致,使数据规范、准确和有序,便能在方剂学研究中顺利挖掘出其中的规律。此外,在收集临床数据时研究人员应注意患者个人私密性问题,将保密工作贯彻于数据提取全过程中。

2.2.3  采用多元化的数据挖掘方法  数据挖掘技术是一种从众多有效数据中获取有价值信息的研究手段,能否全面地分析数据与结果的可信度息息相关。然而,目前有关方剂配伍理论的研究多是采用单一方法,这就使得研究结论不可避免地带有一定的局限性。其主要表现在对相同的数据缺乏不同方法间的比较,而整体数据又缺少不同方法间的联合应用等。中医学者在对方剂学研究数据进行数据挖掘时,若只选择一种方法,便会使挖掘出的研究结论缺乏完整性,降低了结果的可信度,不能科学全面地说明问题。因此,研究人员在运用数据挖掘技术时,应做到多种方法共施,或将文献规律研究和数据挖掘的多种技术相结合,既能弥补单一方法的不足,又能充分发挥各种研究方法的优势。

2.2.4  确立评价体系  由于目前在方剂学研究中挖掘出的方药配伍、用药规律等结果,在幂律分布拟合、节点相似性分析等方面存在主观性的经验判断,必须由经验丰富的临床医生或权威专家评价其准确性,缺乏必要的理论分析及证明。这种反馈迟缓、客观性差的验证手段,造成了研究结果的正确性难以验证、有效性评判滞后的现状,学者在做研究时应该避免一些人为的因素。因此,建议确立一套适用于中医药数据挖掘研究的科学性评测指标机制,验证性的实验方法也是可以考虑的。

2.2.5  培养兼备中医药知识与计算机技术的研究人员  平衡中医药知识与计算机技术的能力,使研究成果既具备中医理论的整体性,又体现数理方面的客观性。研究人员往往分为两种:一是中医学者,擅长治病方药等理论经验,对数据操作稍显薄弱;二是计算机研究人员,专于数据搜查归纳,而缺乏中医知识。方剂学数据挖掘的结论应该是详尽而规整的,若不能平衡中医理论和数据的使用,则会造成结果的偏颇。数据挖掘专业与中医药专业交流少,行业信息不能互通。所以,培养一批兼备二者知识结构的研究人员刻不容缓。

3  小结

方剂有独特的配伍规律,文献研究可整合药物组方进行归纳,临床研究依靠配伍对各种疾病进行有效治疗。由于医学领域的复杂性和延伸性,中医各家所记载的各类组方,其配伍规律所涉信息量庞杂,故而对方剂资源进行信息化研究必定是个繁琐而庞大的工程,仅仅依靠传统的人工查阅的方法是不可能实现的。为了能对方剂进行详尽而系统分析,我们必须使用最先进的现代信息处理技术去认识、去分析、去探究。计算机挖掘技术能精准、迅速地找出医学辨证与治法的规律,适用于方剂学的研究。中医学者将数据挖掘所得出的结果和方剂学理论知识的相互融合,不仅可以把自己所掌握的中医理论与计算机挖掘出的结论结合起来,使临床辨证疗效倍增,还能加强自身对名老中医独特的个性化诊疗方法的领悟,吸收内在的新理论、新手段、新技术,使珍贵的方药和组方经验得到有效传承。在研究过程中,注意对收集的信息进行有效数据预处理,并合理规范地使用数据挖掘技术,方能从挖掘出的成果中领悟到方剂学的理念和精髓。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章