配色: 字号:
数据库系统基础
2022-09-14 | 阅:  转:  |  分享 
  
第五章数据库系统基础

空间数据管理(地图数据库)是地理信息系统的重要组成部分,因为地图是地理信息系统的主要载体。地理信息系统是一种以地图为基础,供资源、环境以及区域调查、规划、管理和决策用的空间信息系统。在数据获取过程中,空间数据库用于存储和管理地图信息;在数据处理系统中,它既是资料的提供者,也可以是处理结果的归宿处;在检索和输出过程中,它是形成绘图文件或各类地理数据的数据源。然而,地理与地图数据以其惊人的数据量与空间相关的复杂性,使得通用的数据库系统难以胜任。为此,就要用当代的系统方法,在地理学和地图学原理的指导下,对地理环境进行科学的认识与抽象,将地理数据库转化为计算机处理时所需的形式与结构,形成综合性的信息系统,以便为越来越广泛的社会部门与领域服务。

5.1数据库的概念

数据库的英文是DataBase,其意义为数据基地,即统一存储和集中管理数据的基地。它有些类似资料库,实际上资料库的许多特征都可以从数据库中找到。在资料库中,各类资料都有严格的分类系统和编码表,并存放在规定的资料架上,为管理和查找资料提供了极大的方便。当资料的数据形式存放于计算机时,失去了直观性,因此更需要建立严密的分类和编码系统,实现数据的标准化和规范化。

5.1.1数据管理的文件方式

数据库系统是运用计算机技术管理数据的系统,在此之前,计算机数据管理经历了文件管理方式时期,亦称为文件管理系统,包含在计算机的操作系统中。文件管理系统有下列特点:

(1)数据文件是大量数据的集合形式,每个文件包含有大量的记录,每个记录包含若干个甚至多达几十个以上的数据项,文件和文件名面向用户并存储在计算机的储存设备上,可以反复利用;

(2)面向用户的数据文件,用户可通过它进行查询、修改、插入、删除等操作;

(3)数据文件与对应的程序具有一定的独立性,即程序员可以不关心数据的物理存储状态,只需考虑数据的逻辑存储结构,从而可以大量地节省修改和维护程序的工作量;

(4)数据文件的缺点是只能对应于一个或几个应用程序,不能摆脱对程序的依赖性。数据文件之间不能建立关系,呈现出无结构的信息集合状态,往往冗余度大,不易扩充、维护和修改。

5.1.2数据库系统管理数据的方式

数据库系统(DBMS)是在文件管理系统的基础上发展起来的系统。DBMS在用户应用程序和数据文件之间起到了桥梁作用。DBMS的最大优点是提供了两者之间的数据独立性。即应用程序访问数据文件时,不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序。数据库管理系统的特点可概括为:

(1)数据管理方式建立在复杂的数据结构设计的基础上,将相互关联的数据集—文件赋予某种固有的内在联系。各个相关文件可以通过公共数据项联系起来。

(2)数据库中的数据完全独立,不仅是物理状态的独立,而且是逻辑结构的独立,即程序访问的数据只需提供数据项名称。

(3)数据共享成为现实,数据库系统的功能保证了多个用户可以同时使用同一数据文件,而且数据处于安全保护状态。

5.1.3数据库系统的构成

综合上述,我们可以把与数据库有关的几个概念理解为:数据库是存储在计算机内的有结构的数据集合:数据库管理系统是一个软件,用以维护数据库、接受并完成用户对数据库的一切操作;数据库系统指由硬件设备、软件系统、专业领域的数据体和管理人员构成的一个运行系统。

5.2数据模型

数据模型是描述数据和数据之间联系的工具,这是衡量数据库能力强弱的主要标志之一。数据库设计的核心问题之一就是设计一个好的数据模型。目前在数据库领域,常用的数据模型有:层次模型、网络模型、关系模型以及最近兴起的面向对象模型。下面以两个简单的空间实体为例(见图7.1),简述这几种数据模型中的数据组织形式及其特点。

5.2.1层次模型

层次数据库模型是用树型结构来表示实体间联系的模型。它将数据组成成一对多(或双亲与子女)关系的结构,其特点为:①有且仅有一个节点无双亲,这个节点即树的根;②其他节点有且仅有一个双亲。图7.1所示多边形地图可以构造出图7.2所的层次模型。

层次数据库结构特别适用于文献目录、土壤分类、部门机构等分级数据的组成。例如全国一省一县一乡是一棵十分标准的有向树,其中“全国”是根节点,省以下的行政区划单元都是子节点。这种数据模型的优点是层次和关系清楚,检索路线明确。

层次模型不能表示多对多的联系,这是令人遗憾的缺陷。在GIS中,若采用这种层次模型将难以顾及公共点、线数据共享和实体元素间的拓扑关系,导致数据冗余度增加,而且给拓扑查询带来困难。

5.2.2网络模型

用丛结构(或网结构)来表示实体及其联系的模型就是网络模型。在该模型中,各记录类型间可具有任意个连接关系。一个子节点可有多个父节点;可有一个以上的节点无父特点;父节点与某个子节点记录之间可以有多种联系(一对多、多对一、多对多)。图7.3是图7.1的网络模型。

网络数据库结构特别适用于数据间相互关系非常复杂的情况。除了上面说的图形数据外,不同企业部门之间的生产和消耗联系也可以很方便地用网状结构来表示。

网络数据库结构的缺点是:由于数据间的联系要通过指针表示,指针数据项的存在使数据量大大增加,当数据间关系复杂时,指针部分会占用大量数据库存储空间。另外,修改数据库中的数据,指针也必须随着变化。因此网络数据库中指针的建立和维护可能成为相当大的额外负担。

5.2.3关系模型

关系模型的基本思想是用二维表表示实体及其联系。二维表中的每一列对应实体的一个属性,并给出相应的属性值,每一行形成一个由多种属性组成的多元组,或称元组(tupple),与一特定实体相对应。实体间的联系和各二维表间的联系采用关系描述或通过关系直接运算建立。元组或记录)由一个或多个属性(数据项)来标识,这一个或一组属性称为关键字,一个关系表的关键字称为主关键字,各关键字中的属性称为元属性。关系模型可由多张二维表形式组成,每张二维表的“表头”称为关系框架,故关系模型即是若干关系模型组成的集合。图7.1所示的多边形地图,可用表7.2所示关系表示多边形与边界及节点之间的关系。

关系模型应遵循以下条件:

(1)二维表中同一列的属性是相同的;

(2)赋予表中各列不同名字(属性名);

(3)二维表中各列的次序是无关紧要的;

(4)没有相同内容的元组,即无重复元组;

(5)元组在二维表中的次序是无关紧要的。

关系数据库结构的最大优点是它的结构特别灵活,可满足所有用布尔逻辑运算和数学运算规则形成的询问要求;关系数据还能搜索、组合和比较不同类型的数据,加入和删除数据都非常方便。关系模型用于设计地理属性数据模型较为适宜。因为在目前,地理要素之间的相互联系是难以描述的,只能独立地建立多个关系表。例如,地形关系,包含的属性有高度、坡度、坡向,其基本存储单元可以是栅格方式或地形表面的三角面;人口关系,含的属性有人的数量、男女人口数、劳动力不从心、抚养人口数等。基本存储单元通常是对应于某一级的行政区划单元。

表7.1关系表

关系1:边界关系关系2:边界一节点关系关系3:节点坐标关系

多边形

边号(P) 边号

(E) 边长

(L) 边号

(E) 起节点号

(SN) 终节点号

(EN) 节点号

(N)

X

Y I

I

I a

b

c 30

40

30 a

b

c

d

e

1

2

3

4 2

4

3

4

1 1

2

3

4 19.8

38.6

26.7

9.5 34.2

25.0

8.2

15.7 II

II

II b

c

d 40

25

28 关系数据库的缺点是,许多操作都要求在文件中顺序查找满足特定关系的数据,如果数据库很大的话,这一查找过程要花很多时间。因此搜索速度是关系数据库的主要技术标准,也是建立关系数据库花费高的主要原因。

5.2.4面向对象模型

面向对象的定义是指无论怎样复杂的事例都可以准确地由一个对象表示。每个对象都是包含了数据集和操作集的实体,即是说,面向对象的模型具有封装性的特点。

1、面向对象的概念

(1)对象与封装性

在面向对象的系统中,每个概念实体都可以模型化为对象。多边形地图上的一个节点、一条弧段、一条河流、一个区域或一个省都可看成对象。一个对象是由描述该对象状态的一组数据和表达它的行为的一组操作(方法)组成的。例如,河流的坐标数据描述了它的位置和形状,而河流的变迁则表达了它的行为。由此可见,对象是数据和行为的统一体。

一个对象(Object)可定义成一个三元组:

Object=(ID,S,M)

其中,ID为对象标识,M为方法集,S为对象的内部状态,它可以直接是一属性值,也可以是另外一组对象的集合,因而它明显地表现出对象的递归。

(2)分类

类是关于同类对象的集合,具有相同属性和操作的对象组合在一起称为类。属于同一类的所有对象共享相同的属性项和操作方法,每个对象都是这个类的一个实例,即每个对象可能有不同的属性值。可以用一个三元组来建立一个类型:

Class=(CID,CS,CM)

其中,CID为类标识或类型号,CS为状态描述部分,CM为应用于该类的操作。显然有:

S∈CS和M=CM(当Objet∈Class时)

因此,在实际的系统中,仅需对每个类型定义一组操作,供该类中的每个对象应用。由于每个对象的内部状态不完全相同,所以要分别存储每个对象的属性值。

例如,一个城市的GIS中,包括了建筑物、街道、公园、电力设施等类型。而洪山路一号楼则是建筑物类中的一个实例,即对象。建筑物类中可能有建筑物的用途、地址、房主、建筑日期等属性,并可能需要显示建筑物、更新属性数据等操作。每个建筑物都使用建筑物类中操作过程的程序代码,代入各自的属性值操作该对象。

(3)概括

在定义类型时,将几种类型中某些具有公共特征的属性和操作抽象出来,形成一种更一般的超类。例如,将GIS中的地物抽象为点状对象、线状对象、面状对象以及由这三种对象组成的复杂对象,因而这四种类型可以作为GIS中各种地物类型的超类。

比如,设有两种类型

Class1=(CID1,CSA,CSB,CMA,CMB)

Class2=(CID2,CSA,CSC,CMA,CMC)

Class1和Class2中都带有相同的属性子集CSA和操作子集CMA,并且

CSA∈CS1和CSA∈CS2及CMA∈CM1和CMA∈CM2

因而将它们抽象出来,形成一种超类

Superclass=(SID,CSA,CMA)

这里的SID为超类的标识号。

在定义了超类以后,Class1和Class2可表示为

Class1=(CID1,CSB,CMB)

Class2=(CID2,CSC,CMC)

此时,Class1和Class2称为Superclass的子类(Subclass)。

例如,建筑物是饭店的超类,因为饭店也是建筑物。子类还可以进一步分类,如饭店类可以进一步分为小餐馆、普通旅社、宾馆、招待所等类型。所以一个类可能是某个或某几个超类的子类,同时又可能是几个子类的超类。

建立超类实际上是一种概括,避免了说明和存储上的大量冗余。由于超类和子类的分开表示,所以就需要一种机制,在获取子类对象的状态和操作时,能自动得到它的超类的状态和操作。这就是面向对象方法中的模型工具——继承,它提供了对世界简明而精确的描述,以利于共享说明和应用的实现。

(4)联合

在定义对象时,将同一类对象中的几个具有相同属性值的对象组合起来,为了避免重复,设立一个更高水平的对象表示那些相同的属性值。

假设有两个对象

Object1=(ID1,SA,SB,M)

Object2=(ID2,SA,SC,M)

其中,这两个对象具有一部分相同的属性值,可设立新对象Object3和Object2,Object3=(ID3,SA,Object1,Object2,M)

此时,Object1和Object2可变为

Object1=(ID1,SB,M)

Object2=(ID2,SC,M)

Object1和Object2称为“分子对象”,它们的联合所得到的对象称为“组合对象”。联合的一个特征是它的分子对象应属于一个类型。

(5)聚集

聚集是将几个不同特征的对象组成一个更高水平的复合对象。每个不同特征的对象是该复合对象的一部分,它们有自己的属性描述数据和操作,这些是不能为复合对象所公用的,但复合对象可以从它们那里派生得到一些信息。例如,弧段聚集成线状地物或面状地物,简单地物组成复杂地物。

例如,设有两种不同特征的分子对象

Object1=(ID1,S1,M1)

Object2=(ID2,S2,M2)

用它们组成一个新的复合对象

Object3=(ID3,S2,Object1(SU),Object2(SV),M3)

其中Su∈S1,Sv∈S2,从上式中可见,复合对象Object3拥有自己的属性值和操作。它仅是从分子对象中提取部分属性值,且一般不继承子对象的操作。

在联合和聚集这两种对象中,是用“传播”作为传递子对象的属性到复杂对象的工具。即是说,复杂对象的某些属性值不单独于数据库中,而是存于弧段和节点文件中,多边形文件仅提供一种组合对象的功能和机制,通过建立聚集对象,借助于传播的工具可以得到多边形的位置信息。

2、GIS中的面向对象模型

(1)空间地物的几何数据模型

GIS中面向对象的几何数据模型如图6.4所示。从几何方面划分,GIS的各种地物可抽象为点状地物、线状地物、面状地物以及由它们混合组成的复杂地物。每一种几何地物又可能由一些更简单的几何图形元素构成。例如,一个面状地物是由周边弧段和中间面域组成,弧段又涉及到节点和中间点坐标。或者说,节点的坐标传播给弧段,弧段聚集成线状地物或面状地物,简单地物组成复杂地物。















(2)拓扑关系与面向对象模型

通常地物之间的相邻和关联关系可通过公共节点、公共弧段的数据共享来隐含表达。在面向对象数据模型中,数据共享是其重要的特征。将每条弧段的两个端点(通常它们与另外的弧段公用)抽象出来,建立应该单独的节点对象类型,而在弧段的数据文件中,设立两个节点子对象标识号,即用“传播”的工具提取节点文件的信息,如图6.5所示。

区域文件弧段文件节点文件

区标识 弧段标识 弧标识 起节点 终节点 中间点串 节点标识 X Y Z 1 21 21 11 11 … 11 100 90 100 2 22,24,25,23 22 12 15 … 12 90 85 120 3 23 23 13 13 … 13 60 88 110 4 24,26,28 24 14 12 … 14 55 82 150 5 25,26,27 25 16 14 … 15 30 80 130 26 15 14 … 16 52 20 90 27 16 15 … 28 16 12 … 图7.5拓扑关系与数据共享

这一模型既解决了数据共享问题,又建立了弧段节点的拓扑关系。同样,面状地物对弧段的聚集方式与数据共享和几何拓扑关系的建立也达到一致。

(3)面向对象的属性数据模型

关系数据模型和关系数据库管理系统基本上适应于GIS中属性数据的表达与管理。若采用面向对象数据模型,语义将更加丰富,层次关系也更明了。可以说,面向对象数据模型是在包含关系数据库管理系统的功能基础上,增加面更对象数据模型的封装、继承和信息传播等功能。

图7.6是以土地利用管理GIS为例的面向对象的属性数据模型。

GIS中的地物可根据国家分类标准或实际情况划分类型。如土地利用管理GIS的目标可分为耕地、园地、林地、牧草地、居民点、交通用地、水域和未利用地等几大类。地物类型的每一大类又可以进一步分类,如居民点可再分为城镇、农村居民点、工矿用地等子类。另外,根据需要还可将具有相同属性和操作的类型综合成一个超类。例如工厂、农场、商店、饭店属于产业,它有收入和税收等属性,可把它们概括成一个更高水平的超类——产业类。由于产业可能不仅与建筑物有关,还可能包含其他类型如土地等,所以可将产业类设计成一个独立的类,通过行政管理数据库来管理。在整个系统中,可采用双重继承工具,当要查询饭店类的信息时,既要能够继承建筑物类的属性与操作,又要能够继承产业类的属性与操作。

属性数据管理中也需用到聚集的概念和传播的工具。例如,在饭店类中,可能不直接存储职工总人数、房间总数和床位总数等信息,它可能从该饭店的子对象职员和房间床位等数据库中派生得到。





5.3地图数据模型总论

地图数据是一个基于空间参考的数据,它以定点、定线或定面的方式与地球表面建立位置联系。图像数据如遥感数据等,图形数据如普通地图、专题地图等,地理统计数据以及环境监测数据等,均是地图数据的主要代表数据。

5.3.1地图数据的基本组成

空间物体是地图数据的首要组成部分,此外,地图数据还包括发生在不同时间与地点的地理事物与现象。因此,地图数据包括三个主要信息范畴:空间数据、非空间数据和时间因素。

1、空间数据

根据空间数据的几何特点,地图数据可分为数据、线数据、面数据和混合性数据4种类型。其中混合性数据是由点状、线状与面状物体组成的更为复杂的地理实体或地理单元。

空间数据的一个重要特点是它含有拓扑关系,即网结构元素中节点、弧段和面域之间的邻接、关联与包括等关系。这是地理实体之间的重要空间关系,它从质的方面或从总体方面反映了地理实体之间的结构关系。

综上所述,空间数据的主要内容包括:

(1)空间定位——能确定在什么地方有什么事物或发生什么事情;

(2)空间量度——能计算诸如物体的长度、面积、物体之间的距离和相对方位等;

(3)空间结构——能获得物体之间的相互关系,对于空间数据处理来说,物体本身的信息固然重要,而物体之间的关系信息(如分布关系、拓扑关系等)也同样重要,因为它是空间数据处理中所特别关心的事物,涉及全面问题的解决;

(4)空间聚合——空间数据与各种专题信息相结合,实现多介质的图、数和文字信息的集成处理,可为应用部门、区域规划和决策部门提供综合性的依据。

2、非空间数据

非空间数据又叫做非图形数据,主要包括专题属性数据和质量描述数据等。它表示地理实体的本质特性,是地理实体相互区别的质量准绳,如土地利用、土壤类型等专题数据和地物要素分类信息等。

地图数据中的空间数据,表示地理物体位于何处及与其他物体之间的空间关系;而地图数据中的非空间数据,则对地理物体进行语义定义,表明该物体“是什么”。除了这两方面的主要信息外,地图数据中还可包含一些补充性的质量/数量等描述信息,有些物体还有地理名称信息。这些信息的总和,能从本质上对地理物体进行相当全面的描述,可看做是地理物体多元信息的抽象,是地理物体的静态信息模型。

3、时间因素

地理要素的空间与规律是地理信息系统研究的中心内容,但是空间和时间是客观事物存在的形式,两者之间互相联系而不能分割的。因此,往往要分析地理要素的时序变化,阐明地理现象发展的过程和规律。时间因素为地理信息增加了动态性质。在物体所处的二维平面上定义第三维专题属性,得到的是在给定时刻的地理信息,在不同时刻,按照同一信息采集模型,得到不同时刻的地理信息序列。

若把时间看做是第四维信息,可对地理现象进行如下划分:

·超短期的:如地震、台风、森林火灾等;

·短期的:如江河洪水、作物长势等;

·中期的:如土地利用、作物估产等;

·长期的:如水土流失、城市化等;

·超长期的:如火山爆发、地壳形变等。

地理信息的这种动态变化特征,一方面要求及时获取并定期更新信息,另一方面要求重视自然历史过程的积累及对未来的预测和预报,以免使用过时的信息,导致决策的失误,或者缺乏可靠的动态数据,而不能对变化中的地理事件或现象作出人事科逻辑的预测预报和科学论证。

5.3.2图形数据的构模

1、矢量数据模型

在矢量数据中,单个地理实体是基本逻辑数据单位。根据在数据模型中所反映的实体间联系的程度,可有两种基本实施方案:无结构的面条模型和反映实体间空间关系的拓扑模型。

(1)面条模型

在面条模型中,仅仅把实体的空间信息定义成坐标串,不存储任何空间关系。因此,这种模型仅适用于简单的图形再现,不能用于空间分析,对共位物体还会产生数据冗余,从而难以保持有关数据的一致性。从这个意义上讲,这种模型只能用于彼此分离(不共位)的图形或作为空间数据输入的预备结构。

(2)拓扑模型

拓扑模型在空间数据模型中得到了广泛的承认,不少著名的数据模型都是围绕着这个概念建立起来的。因为拓扑模型不仅能保证共位物体的无冗余存储,而且还可利用结构法则检索物体间的空间关系异常。例如,我们可以为河流网、交通网、电力网、给水网和排水网等建立拓扑关系,这样,就可以根据网线的关系来达到跟踪、检索和分析等目的。

2、面片数据模型

在这类模型中,基本数据元素是基于一个空间单元的。实体信息是按照这种空间单元进行采集的。面片数据模型主要表现为网格系统和多边形系统两种形式。

(1)网格系统

网络系统是用规则的小面块集合来逼近自然界不规则的地理单元。数据采集与图像处理中普遍采用正方形,这就意味着正方形砌块是分割二维空间的实用形式。

(2)多边形系统

多边形系统借助任意形状的弧段集合来精确表达地理单元的自然轮廓。它是表达面状地理要素的重要手段。多边形系统不像网格系统那样使用简单的二维阵结构,各个面域单元之间的关系不是系统所有的,而需要专门建立,即要建立多边形网结构元素之间的拓扑关系。

5.3.3专题属性数据的构模

各种地理信息系统,除了管理图形数据系统外,还在不同程度上管理和处理与图形数据相关联的专题数据。在层次、网状和关系模型中,最常用的专题属性数据构模是关系数据模型。

5.3.4图形数据与专题属性数据的连接

在空间数据库系统中,图形数据与专题性数据,一般采用分离组织存储的方法存储,以增强整个系统数据处理的灵活性,尽可能减少不必要的机时与空间上的开销。然而,地理数据处理又要求对区域数据进行综合性处理,其中包括图形数据与专题属性数据的综合性处理。因此,图形数据与专题属性数据的连接也是很重要。图形数据与专题属性数据的连接基本上有4种方式。

1、图形数据与专题属性数据分别管理

这种方式没有集中控制的数据库管理系统,它有两种管理形式:

①属性数据是作为图形数据记录的一部分进行存储的。这种方案只有当属性数据量不大的个别情况下才有用。大量的属性数据加载于图形记录上会导致系统响应时间的普遍延长。显然,主要的缺点在于属性数据的存取必须经由图形记录才能进行。②用单向指针指向属性数据,此方法的优点在于属性数据多少不受限制,且对图形数据没有什么坏影响。缺点是仅有从图形到属性的单向指针,因此,互相参照是非常麻烦的,并且容易出错,如图7.7(a)所示。

2、对通用DBMS进行扩展以增加空间数据的管理能力

通过扩充通用DBMS来增加空间数据的管理能力,将空间数据和属性置于同一个DBMS管理之下的方法,不仅可使空间和属性数据之间的联系比较密切,还便于利用某些DBMS产品的现成功能(如多用户的控制,客户机/服务器的运行模式等),但为了使空间数据适应关系模型,却需牺牲软件运行的效率,如图7.7(b)所示。

3、属性数据与图形数据具有统一的结构

此结构中有双向指针参照,且由一个数据库管理系统来控制,使灵活性和应用范围均大为提高。这一方案能满足许多部门在建立信息系统时的要求,如图7.7(c)所示。

4、图形数据与属性数据自成体系

此方案为图形数据和属性数据彼此独立地实现系统优化提供了充分的可能性,是适合于不同部门的数据处理方法。这里,属性数据有其专用的数据库系统,很多情况下是用于事务管理的商业数据库,并且在它基础上建立了能够从属性到图形的反向参照功能,如图7.7(d)所示。

当然,在许多GIS系统中,图形数据和属性数据并不是使用单一的连接方式,而是根据具体情况使用多种方式。例如,MAPGIS以第三种方式为主,但也包含第四种方式。





5.4矢量数据模型

5.4.1地理实体向数据处理目标的转化

地理实体是指含义完整的物体,而地图数据库中所处理的独立逻辑单元是目标(Object)。引入目标的概念,是为了减少或避免数据冗余。这个术语来自图论(计算机科学的基础理论),原意为“边”或“弧线”,是描述是两上顶点之间联系的弧段。地图上有表示物体形状的各种各样的线,它们均是重要的制图对象。目标的特点是在整个线段范围内只能有同一类属性,不允许其中一段具有属性A,另一段具有属性C等。例如图7.8中的一条道路,应划分成三个目标:AB、CD两段的特征码均为“道路”,BC段有“道路”和“境界”两个特征码。

采用边(目标)作为地图数据结构的基本单元有如下优点:

(1)将多种对象(要素)的地理实体抽象概括为一类对象——边,可使数据记录具有统一的逻辑结构,便于存储管理。

(2)这种基于图论的抽象表示,能较好地体现地理分布的空间联系,易于导出多种关系信息。

(3)能减少冗余存储,属于同一条边(几何位置重合)但具有多种属性的要素只需存储一次。

由此可知,一个目标是一条线段或一个点,它代表某个地理要素的全部或一部分。通常,在同一目标上,应连续、同质(属性相同),除两端外,不存在节点。

5.4.2实体信息的数据化

有关地球实体的各种信息内容,可表示为描述实体记录数据项的集合,这种便形成一种信息框架,表示实体信息的逻辑构成。例如,一个地理实体的信息结构可表示为如图7.9所示的两种形式。

其中,图形信息用来描述实体的图形特征,如实体为一条线,则其图形信息描述的是该线的线型、线宽、线色等信息。专题属性信息表明该裕本属于哪一些物体,即表明该目标“是什么”,如为水系、道路、居民点、境界、地貌及土壤植被等类型,在各个类型中,又根据其他特征进一步细分,此外还可包括表示其质量、数量、强度等属性的信息。空间信息描述物体的位置与形状,这种信息可通过一系列直角坐标对来描述。关系信息描述该目标与其他物体的联系,这可用存储与该物体有关系的那些物体的关键字来实现,比如,组成一个面域的若干个弧段号,一个弧段的左、右面域号等。

5.4.3实体间关系的逻辑实现

建立实体间关系是数据结构的主要任务,在大量的物体之间的关系中,通常我们必须建立两种直接关系,即定性(分层或分类)关系和定位(开窗处理)关系。视需要与可能,可建立第三种关系——拓扑关系。

1、定性关系的建立

定性关系的建立就是按照物体的分类标志来组织数据文件。可通过两种模型来组织数据文件。

(1)层次模型。定性关系中的层次模型通过要素分类/分级编码表来实现,对编码值域进行规则的划分,形成多组层次树结构,主要用来反映物体之间的类别与等级的归属关系。

(2)网状模型。由于不同类型记录之间有时会发生共位现象,这就导致一个目标会同时具有多重分类属性,从而在数据结构上分属多个数据文件,即一个子女节点有多个双亲节点,形成一种网状数据模型(见图7.10)。









2、定位关系的建立

定位关系是物体间的空间关系之一,是一种面向位置的数据结构。它用近似的方法表示物体间的接近度。建立定位关系的目的是为地图数据库系统配备定位(开窗)检索的功能。

(1)栅格索引

地图数据处理的特征之一是通常要按给定的空间范围进行分块考察与处理。为此,在建立地图数据库时,需要用一个平行于坐标轴的正方形数学网格,覆盖在整个数据库数值空间,将后者离散化为密集栅格的集合,以建立制图物体之间的空间位置关系。通常是把整个数据库数值空间划分成32×32(或64×64)的正方形网格,建立另一个倒排文件——栅格索引。每一个网格在栅格索引中有一个索引条目(记录),在这个记录中登记所有位于或穿过该网格的物体的关键字,可用变长指针法或位图法实现。在图6.11中有三个制图物体:一条河流、一个湖泊和一条省界,它们的关键字分别为5,11和23。河流穿过的栅格为2,34,35,67,68;湖泊覆盖的栅格为68,69,100,101;省界所通过的栅格为5,37,36,35,67,99,98,97。这种物体与栅格的关系可用位图法来表示。物体与栅格的关系亦可用变长指针法表示,如图6.12所示。由图6.13可看出,一个栅格中包含的物体个数就是该栅格在栅格索引的对应记录中存储的比特“1”的个数。这是定位(开窗)检索的基本工具。























1 2 … 5 … 34 35 … 68 …

(2)目标整体性特征中的范围信息

虽然用栅格索引的方式能比较有效地表示各目标的空间位置关系,如图7.13所示。如果一个地图中,目标数量很多,成千上万,则栅格索引文件将会很大,且其表示的范围也会对目标个数有所限制。另一种表示目标位置关系的方法,是在目标整体性特征信息(参见图7.9)中放入目标的范围信息(即目标所跨的一个矩形区域)。设计数据结构时,可将目标整体特性信息设计成等长记录形式,且在打开数据库文件时,可先将目标整体性特征信息放入内存。当需要进行开窗检索时,系统可

首先依次判断自目标的范围信息,这样会较快地确定要检索的目标。















3、拓扑关系的建立

如第2章所介绍的,多结构元素的拓扑关系是GIS中非常重要的内容。利用它我们可以建立区域和弧段、节点之间的数据结构;可以对数据库信息进行各种空间分析和拓扑检索,帮助用户作出正确的决策。

到目前为止,人们已经研究和使用了多种拓扑关系的表示方法,其目的就是想有效地表示区域和弧段的关联关系、区域和区域的包含关系、弧段与弧段的邻接关系以及弧段与节点的关联关系等。

一般建立拓扑关系有两种方法:手工建立和自动建立。前者是人机交互操作的方式,用户通过操作输入设备(鼠标器或键盘),在屏幕上依资助指出构成一个区域的各个弧段、一个区域包含了另外哪几个区域、组成一条线路的各个线段等等;而后者则利用系统提供的拓扑关系自动建立功能,对手扶跟踪数字化或栅格数据矢量化得到的数据进行分析判断,从而得出网结构元素的拓扑关系。

自动建立面域、弧段以及节点之间的拓扑关系多采用弧段跟踪法。首先,由原始线段数据建立弧段的邻接关系,同时也确定了弧段与节点的关联关系;其次,按一定规则(顺时针或逆时针)沿弧段跟踪形成闭合环(区域),同时记下每个区域的编号;再次,根据点是否在多边形内的判断法则,依次找出区域与区域之间的嵌套关系。

手工建立或自动建立拓扑关系的方法各有优势和不足。手工建立拓扑关系的方法操作复杂,工作量大,但对原始数据要求不严,修改时不必重复计算;自动建立拓扑关系的方法生成速度快,但对原始数据要求严,即要求弧段端点(节点)匹配好。

5.6GIS的地理分析模型

近年来,GIS开始向空间决策支持系统方向发展,对应用模型的依赖,特别是对模型分析、模拟能力的依赖表现得更为明显。应用模型的使用和发展,已成为GIS进一步发展的重要前提和现代GIS发展水平的重要标志。

GIS中的应用模型大多为数学模型,它们除了具有数学模型的一般特征之外,还具有由GIS的性质和任务决定的一些如下突出的特点。

(1)空间性:GIS应用模型所描述的现象或过程往往与空间位置、分布以及差异有密切关系,因此,需特别注意模型的空间运算特征。

(2)动态性:GIS应用模型所描述的现象或过程也与时间有密切的联系,具有不同动态性的模型在系统中使用的效率有很大的差别,所以,在模型设计时需考虑时间对模型目标的影响及数据的可能更新周期等问题。

(3)多元性:通常GIS应用模型将会涉及到自然、社会、经济、技术等多种因素,如地理环境、资源条件、人口状况、经济发展和政策法规等等,应注意通过因素分析去调整模型状态。

(4)复杂性:GIS所需要处理的问题可能是相当复杂的,且往往存在人为的干预和影响,很难用数学方法全面、准确定量地加以描述,所以GIS应用模型时常采用定量与定性相结合的形式。为此,在模型设计时,应给人为干预留出一定的余地。

(5)综合性:一个实用的GIS应用模型往往涉及多种模型方法,且与多个子系统中的数据有关。如一个投资环境评价模型,往往是指标量化模型、层次分析模型、综合评价模型等的结合体,而所涉及的数据可能来自地质、气候、能源、交通、工业、农业、商业等诸多方面。因此应注意模型变量、结构的协调,并保证有充足的数据量。

综上所述可以得出如下结论:

(1)应用模型是GIS分析问题、解决问题的基础,在扩大GIS范围,提高GIS应用水平的过程中,需特别注意发展GIS应用模型,因为应用模型,因为应用模型的发展水平将始终决定GIS的应用水平。

(2)在GIS应用模型发展过程中,面向不同专业的数学模型正在进一步分化,单纯的统计分析模型已不再是GIS应用模型的主流,为此,应进一步加强专业知识与数学、计算机技术的联系,提高专业研究支持的力度。

(3)模型库的研究是实现GIS模型有效生成、管理和使用的必由之路,为促进GIS技术的全面进步,特别是使用GIS对解决问题的数据层次的支持向更高层次的决策支持发展,应更加重视模型库系统的研制和开发。

(4)开发模型自动生成、半自动生成技术,发展具有智能水平的构模工具和模型管理系统,将是今后GIS模型库系统研究的主要内容和方向,因此,需要进一步研究人工智能和知识工程方法在GIS模型库系统中的应用途径。

(5)GIS模型表示的三个层次的语言,即自然语言、数学逻辑语言和计算机语言之间的差异,造成了很大的信息损失和误差,如何在GIS模型库系统中建立三者之间的良好接口。增强模型的生命力,应在GIS模型库系统研究中引起特别的关注。

5.7海量空间数据的组织与管理

随着GIS应用领域的不断扩大,如城市规划系统、地下管网管理系统、土地管理系统、公安警用系统等,由于其管理的数据量很大,且比例尺也大,所以,靠对单幅图的管理已不能适应应用的需要。目前,像上述这样的一些GIS应用系统,多数都是以图幅为单位进行管理,即按图幅将大区域空间数据进行分割。现在世界各国一般都是采用经纬线分幅或采用规则矩形分幅,如图7.18所示。

采用分幅管理空间数据,就势必造成一个空间实体会分属多个图幅,对于整个空间而言,就不能保证正确的拓扑关系。怎样才能做到既能按分幅数字化录入、存储和管理空间数据,又能够使分属不同图幅的同一目标建立起正确的联系,以利于对整个空间数据进行正确的检索、分析和统计等功能的实现,正成为GIS开发人员讨论的话题。下面介绍数据库中图幅的组织方法和图幅间被分割目标的组织方法。













5.7.1数据库中图幅的组织方法

前面讲过,海量空间数据库是以图幅为单位进行管理的。即在数字化录入和数据编辑等操作时,均是对单幅图处理,然后再将这些图幅组织到一个空间中。

在组织这个大区域空间时,首先得为此空间的组织形式进行定义。其中包括坐标单位、经度和纬度跨度(用经纬线分幅时)、比例尺、图幅的宽和高(用矩形分幅时)、地图投影类型和椭球体参数等。这就意味着在数据库中的所有图幅都需按定义的形式进行录入。

在大区域空间的组织形式确定后,就可逐一将图幅输入库中。输入时需指出该图幅的文件名(可能一个图幅含有多个文件)和用于确定图幅在库中的位置的横向纵向序号(矩形分幅)或左下角经纬度(经纬线分幅)。

对系统而言,当用户要求按某局部范围进行检索时,系统可对所指定范围对应的图幅文件进行检索;当用户要求按分类要素进行检索时,系统可根据图幅之间的邻接关系将所有需要的要素检索出来。

5.7.2图幅间被分割目标的组织方法

按上所述将图幅输入库中时,还未建立相邻图幅间同一目标的联系。这种联系可以在用户做相邻图幅的拼接时通过自动或人工方式进行相邻图幅间同一目标的连接),由系统将这种联系记入系统中。系统中以什么样的形式来组织和管理被分割目标的联系,是海量空间数据库管理系统的一个重要内容。我们认为,可以有两种方式来组织这种联系:统一建立与管理整个空间的所有目标的联系和只建立与管理被分割目标的联系。

1、整个空间的目标统一组织和管理方式

这种组织方式是建一个全库索引表,将整个空间的所有目标及其分属的图幅号均放入索引表中,如图7.19所示。





















空间目标 图幅1 1,① 图幅2 1,① 图幅3 1,① 1,② 图幅4 1,① 图幅5 2,②,③ 1,① 1,④ 图幅6 1,② 1,① 1,③ 图幅7 1,① 图幅8 1,① 图幅9 1,①













图中,Ⅰ,Ⅱ,Ⅲ,Ⅳ和Ⅴ分别表示全库中的目标编号,①~④分别表示各图幅中的对象编号。在全库索引表中,存放的是同一目标在各图幅中的对象个数和编号。如Ⅱ号目标在图幅6中有一个对象,其在图幅6中的编号为2。

除了全库索引表外,还应建立一个区域嵌套关系表,如Ⅲ号区嵌套在Ⅱ号区内。

这种用全库索引表来表示不同图幅间目标的连接关系,比较简单、明了。缺点是索引表比较大,而大多情况下,真正被分割到多个图幅上的目标却是少数。

2、只建立和组织被分割目标的方式

这种方式是只将被分割的目标放在索引表中,显然,此索引表比上述的全库索引表要小得多。

在建库和图幅入库时,索引表是空白。当进行图幅拼接时,每拼接一个目标,就将该目标的信息(包括该目标分别在两个图幅中的编号)插入索引表中的适当位置(有可能该目标还与第三个图幅有关,且已记入索引表中)。

在检索目标时,可根据所要检索的图幅号来查询索引表,从中找出符合要求的完整的目标对象。对索引表中没有的目标,直接查询该图幅中的目标信息即可。

5.7.3地图数据库管理

地图数据库管理,可以说是影响地图数据库应用效果的重要问题。目前采用的传统数据库技术,在地图数据库建设中发挥了重要作用,但在满足许多新的包括地图数据库领域中模拟复杂对象和模拟复杂行为的要求方面,也确实存在许多缺陷。正是这些新的应用需求的驱动和传统数据库技术的缺陷,推动了新的地图数据库技术的研究和发展,其中最活跃的一个研究方向,就是把面向对象的技术与数据库技术结合起来,研究一种新型的地图数据库系统——面向对象的地图数据库系统。

由于地图数据库的重要性,有关地图数据库的研究,都格外受到各国政府和应用部门的重视,无论是在技术进步还是在地图数据库建设方面,都取得了可喜的进步。美国、俄罗斯、英国等许多发达国家已经或正在大力建设大规模的国家地图数据库。我国的地图数据库建设也在大规模进行,而且在国民经济和国防建设方面取得了明显效益。

国外关于面向对象的地图数据库的研究起步较早,取得了一些理论和实际成果。近两年国内在这方面的研究进展较快,面向对象的多媒体数据库系统、面向对象的微机地图数据库系统、面向对象的数据结构与数据模型等,都是这一时期的优秀成果。根据目前国内外的研究状况,面向对象的地图数据库的设计与实现,主要包括改造现用的关系数据库和独立开发全新的面向对象地图数据库两个方面的4种方法。可以预见,面向对象的认知方法和面向对象的程序设计方法,将在地图数据库技术中得到全面应用,面向对象的地图数据库技术将有效的发展。































































图幅1图幅2图幅3



①.Ⅰ①.Ⅱ

①②

②①.Ⅲ

图幅4①.Ⅳ①③②图幅6

④③

① ①

①V



图幅7图幅8图幅9



图7.19不同图幅间目标的连接及其全库索引表





















(a)经纬线分幅(b)矩形分幅



图7.18图幅之间邻近关系示意图





















































关键字序号

123456789101112…20212223…

1

2 1



栅5 1

格┆

序34 1

号35 1 1



67 1 1

68 1 1







图7.13栅格索引





















图6.13栅格索引















































图7.12变长指针法



23…



5



5



23…



11…



5…



5…



(5)





… … … … … … … (23) 99 100 101 … 128 65 66 68(11) … 96 33 34 35 37 … 64 1 2 3 4 5 … 32

图7.11数据库数值空间的栅格网





……













图7.10定性关系中的网状模型







目标



境地文件



河流文件

















目标整体性特征 专题属性信息 空间信息 关系信息 键号 几何范畴 图形信息 长度 首址 长度 首址 长度 首址 点、线、面

(a)

目标整体性特征 语义信息 度量信息 结构信息 键号 几何范畴 数量特征 首址 末址 首度 末址 首址 末址 点、线、面















(b)

图7.9地理实体的信息框架



A





B







CD





图7.8目标的划分



属性













属性数据库

管理系统



图形













空间数据库

管理系统



GIS

应用软件



属性



图形







系统单位





数据库管理

系统



GIS

应用软件



属性



图形













数据库管理

系统



GIS

应用软件



商有数据库



属性



图形













数据库管理

系统(扩展空间数据管理功能)



GIS

应用软件





































(a) (b) (c)









(a)(b)(c)















































(d)



图7.7图形数据与属性数据的连接













































































图7.6面向对象的属性数型













饭店设施库

操作:



属性:

房间

床位



职员库

操作:



属性:

职员编号

姓名

工资



邮局



银行



商店



工厂



饭店



居民住宅



学校



医院



建筑物



操作:

查询

插入

删除



属性:

标识码

区号

街道号

房主

建筑日期

功能





电力设施



公园



控制点



街道



耕地



农村居民点



城镇



水域



交通用地



居民点



物草地



未用地



林地



园地



耕地



GIS

























图7.4面向对象的几何数据模型



简单

地物



弧段



面域



面状地物



节点



线状地物



点状地物



空间地物



空间地物































图7.3网络模型



4



31



2



1



a



b



c



e



b











M































图7.2层次模型



4



3



3



2



4



21



4



1



4



2



2



1



a



d



b



e



c



b











M





















7.1地图M及其空间实体





M1

a

eⅠ2

b

4Ⅱc



d

3













献花(0)
+1
(本文系昵称5709980...原创)