分享

国际主流卫生信息模型一览

 铃儿响叮当 2006-10-17

国际主流卫生信息模型一览


■ 刘丽华 金水高 胡凯 梁子柱



对信息模型的研究和分析一直是卫生信息标准化研究的重要组成部分。发达国家早在上个世纪九十年代就对卫生信息模型进行了系统化的研究,并且形成了一些在一定领域和范畴之内得到广泛认可、经历了实践检验并不断完善的信息模型。

我们以美国公共卫生概念数据模型(PHCDM)为重点,对国外一些主要的卫生信息模型进行了分析与研究,并对这方面工作已有的研究成果和先进经验进行了总结和借鉴。

国际主要卫生信息模型基本框架

1.美国HL7的参考信息模型

在HL7的参考信息模型(Reference Information Model,RIM)中,主题域包括实体(Entity)、角色(Role)、角色链接(Role link)、参与(Participation)、动作(Act)和动作关(联)系(Act Relation-ship)。其中“动作”(Act)是这个主题域的核心部分,也是RIM的灵魂。目前很多国家卫生信息模型都参照或以RIM为元模型,建立自己的模型,例如美国的PHCDM,加拿大的CHIM等等。

2.加拿大的卫生信息模型

加拿大卫生信息模型(Canadian Health Information Model, CHIM)较侧重于管理和资源,把管理和资源作为重要的主题域单独提取出来。加拿大卫生信息模型的主要实体包括: 人、管理、资源、环境和事件,模型主框架如图2所示:

● 人: 卫生系统所关注的个人、群体,以及他们的特征。

● 环境: 某个特定场所一系列特征,包括地形地貌的、微生物的或人造的物理环境特征。

● 管理: 为了规范和约束人们行为所确立的具体准则。

● 资源: 指有价值的事物,例如包括人力资源、财务资源、设备资源等。

● 事件: 指已经或正在发生的事件。

3.澳大利亚的国家卫生信息模型

澳大利亚自1989年出版了“卫生保健基本数据集”后,认识到编制数据字典时,如果仅仅按照卫生保健字典来编制字典的话,容易造成遗漏或杂乱无章的现象,于是就提出了通过研发信息模型来对卫生数据字典提供支持这一现实的迫切需求。澳大利亚国家卫生信息模型(National Health Information Model, NHIM)目前已经发展到了第2版,其功能已经远远超出了“组织字典”而成为国家卫生信息的基本架构,并且在澳大利亚的许多国家级大型项目中起着结构性的支撑作用。图3是澳大利亚国家卫生信息模型第2版的宏观结构图:

● 参与者状态: 卫生部门中的人或团体所扮演的角色,以及他们可观察到并且能够进行定义和测量的特征。

● 状态变化事件: 在卫生部门内或相关团体间发生的事情或事件,以及它们的特征。

● 环境因素: 管理的、物理的或社会的环境,指的是在生活中或卫生部门工作中所处的实际环境。

● 分类体系: 能够用于分类、编码或评价卫生因素、状态或事件。它包括了值域、编码体系和工作指标。

美国公共卫生概念模型

1.PHCDM的研究目标

美国的公共卫生概念数据模型(PHCDM)是为国家电子疾病监视系统(NEDSS)项目的启动而进行研究和开发的,它的总体目的是整理、归档公共卫生所需的信息资料,并作为NEDSS起步的一部分,促进数据标准化的发展。其主要作用包括: (1)为组织数据标准和指南提供一个框架; (2)降低公共卫生信息系统的开发强度; (3)通过一致性来增强数据共享; (4)满足在国家标准框架中描述公共卫生数据的需求; (5)促进CDC与政府和地方合作者间在公共卫生领域的协作。

2.PHCDM中提出的模型层级理论

PHCDM提出的信息模型层级结构,将信息模型划分为主题域模型、类关系模型、概念数据模型、逻辑数据模型、数据库设计模型和物理数据库模型,分别处于上、中、下三个层级。这几种模型的定义与功能如下:

● 主题域模型(SAM): 主题域模型只包含了主题域和它们的关系,通常作为一个大型域(例如一个主要功能域)的模型。它可以被用于工程范围内的高层次计划和设计。

● 类关系模型(CRM): 类关系模型只包含主题域、类和关系,通常描述一个有限的领域(例如单个项目领域)。它被用于项目层次的高层面分析与评估。

● 概念数据模型(CDM): 概念数据模型包含主题域、类、属性、数据类型、关系和一个计划项目领域(如公共卫生、财政、物资管理)的通常模型。它是由相对细节层面的分析组成,而且经常是一个首先交付的项目。

● 逻辑数据模型(LDM): 包含主题域、规格化类、极小属性、关系和候选/主键。经常作为项目领域中的企业详细执行的内容。它表示了最详细层次数据分析的完成和数据库设计启动。

● 数据库设计模型(DDM): 包括表空间、表、列、数据类型和主/外键,通常表示一个计算机信息系统现存或者正在设计的数据库。它表示了数据库构建的开始和数据库设计的开始。

● 物理数据库模型(PDM): 包含生成表和索引所需的数据定义语言(DDL),还包括数据库管理系统(DBMS)强迫的约束。它是一个计算机信息系统现存的或者计划的数据库处理规范,对应于数据库设计和构建的最终步骤。

如果根据这六种模型的目标对象和细节描述水平从上到下排列,又根据它们规范说明的严格精密程度从左向右排列,就可以得到如图4所示的排列方式:


图4 PHCDM所提出模型层级中具体与详细的方向

PHCDM是概念数据模型的一个特殊例子,其优势在于: (1)它可以独立于技术之外被多部门使用; (2)避开了通常在创建物理数据模型中诸如数据结构、主键和外键、字段规范等等经常出现的许多技术细节,确保了对公共卫生重要概念的充分描述和记录; (3)由于PHCDM使用了一个合理的、高层面抽象的方式来记录公共卫生概念,所以扩展了模型的应用范围,并使得对维护的需求降到最小。

3.PHCDM的开发过程

PHCDM的开发始于1999年5月,首先是构造一个高级数据模型用于描述PHCDM所包含的主题域。主题域数据模型是在对美国疾病控制中心(CDC)的电子疾病监测系统、HL7 RIM和其它有关卫生数据模型进行分析的基础之上发展起来的。

1999年6月,PHCDM的开发者创建了该模型的第一个“类”图; 1999年7月,CDC流行病学家对类图进行了评价,在意见反馈基础上对其进行了修订; 同年8月,属性被增加到这个类模型中; 1999年9月到10月初,CDC内部以及国家、地方相关部门的专家共同对类模型进行了研讨和评价,并基于此作出了通过以下方式继续完善和增强该数据模型的决定: (1)开发一个公共卫生程序模型,为数据模型提供语境和分类范围; (2)采用HL7 RIM表示相关卫生行为; (3)通过建立一个原型数据库(基于CDC对疾病管理和监测系统子集的信息需求)的方法,来验证这个数据模型的正确性。

2000年1月,有关模型的基本原理、目标的详细描述和出版物得到公认。PHCDM是满足NEDSS数据标准化目标启动的关键,其各种模型的活动有着多重目标,但主要强调应用其处理CDC及合作伙伴的数据标准化问题。

4.PHCDM的主要内容

(1)主题域

主题域是一个聚合类模型划分出来的、具有一定意义的部分,是在允许范围内用子集的方式把一个模型划分为若干更容易理解的区块。PHCDM中有四个主题域: 卫生相关活动、位置场所、客体和参与者。

● 卫生相关活动主题域: 包含健康服务、健康环境和影响健康行为的信息。一个卫生相关活动可以是一个观察、干预、治疗安排/处置或者信息发布通告。

● 位置场所主题域: 包含与参与者、卫生相关活动或者客体相关联的地点信息。可以是一个邮政地址、一个通讯地址或者一个物理地址。

● 客体主题域: 包含与卫生相关活动和参与者有关的物资、设备和产品信息。如食物、药品以及与公共健康相关的物理实体和其他有形内容。

● 参与者主题域: 包含卫生相关活动的参与对象信息。他可以是一个独立的个人和非人生命有机体,或者一个正式或非正式组织。

(2)PHCDM的类与关联

类可以是人、地点、物品、概念或者事件等能够被采集的信息。

PHCDM种共包含有29个类,其中包含四个核心类。这四个核心类对应于四个主题域,其内容是卫生相关活动、位置、客体和参与者,图5是四个核心类的示意图:

PHCDM中的29个类的信息都是互相关联的,PHCDM使用了UML建模语言定义了三种类关联方式:

● 父/子类关联

在父/子类关联中,更普通、泛化的类被指定为父类,可以有一个或多个具体、特化的子类。父/子类关联在数据模型图中用连接父类和子类的连线表示。线的箭头指向父类。图6为PHCDM四个核心类的父/子类关联示意图:

● 关系关联

关系关联是一个特殊关系类型,用以反映同一个核心类或其子类中某个实例与另一个实例之间的关系。图7为表示关系关联一个例子的模型图,两边的长方形代表关系类,通过一对关联线连接关系类(活动关系)和与之类相关的核心类(卫生相关活动):

上图中,“活动关系”中每一个实例与且只与一个“卫生相关活动”关联,而每个“卫生相关活动”可能与零个或更多的“活动关系”关联。

● 参与关联

参与关联是PHCDM中专用于描述核心类之间相互关系的关联,每个核心类与其他核心类之间都有着多对多的关系。参与关联用参与类来描述,PHCDM中有五个参与类: 个体参与、对象参与、参与者位置参与、材料责任和材料位置参与。

(3)属性与数据类型

属性是特殊的数据条目,每个属性都有其名称、描述和赋予的数据类型: 名称表明了属性含义; 描述包括了属性的定义、示例以及相关的讨论; 数据类型是属性值允许格式的说明,它同时扩展了属性的定义。

属性和赋予它的数据类型在数据模型图中描述类的长方形框的下部分列出(图8):

要说明的是,一个父类属性必定被其子类所继承。在上述例子中,参与者父类中的“参与者标识”属性也同时是参与者个体子类(以及所有参与者其他子类)的属性。

属性名称依照以下格式:

[Class Name][{qualifier name}]Attribute-Type Name

由括号中的Class Name表示属性的简称; 大括号、中括号中的Qualifier Name表示可以有0个、1个或者多个限定名; 每一个属性都有一个“属性-类型名称(Attribute-Type Name)”,它提供了属性传送的数据类型标识。用于PHCDM中的属性-类型名称有: 数量、代码、日期、种类、标识符、名称、数据、量、文本、时间范围和值域。

在数据模型图中,数据类型采用属性名称后面用冒号隔开的数据类型标识符描述,PHCDM中的数据类型是以下三种形式之一: (1)属性名: 数据类型名; (2)属性名: SET〈数据类型名〉; (3)属性名: IVL〈数据类型名〉。PHCDM收录的数据类型来自于HL7定义的数据类型集。

数据类型名称前置“SET”并且被括在括号里,表明该属性可以重复,也就是说该属性可以有一组含有一个或者更多的值。例如,参与者标识符属性是一个集,这表明一个参与者类中的单个实例可以有多个标识符。

数据类型名称前置“IVL”,表明这个属性描述了一个从低到高的值域区间。PHCDM中,一个数据类型前置IVL就限定了间隔次数。例如,日期时间范围属性是一个间隔值域,其含义表示相关日期时间描述了一个从开始到结束的范围。

(计算机世界报 2006年10月16日 第40期 B21、B22)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多