分享

松辽流域水资源保护数据库建设初探

 GXF360 2017-11-09

松辽流域水资源保护数据库建设初探

刘媛媛1,任祖春1,李鸿业2,陈思奇3

(1松辽水利委员会水文局(信息中心),吉林长春130021;2松辽流域水资源保护局,吉林长春130021;3水利部松辽水利委员会,吉林长春130021)

[摘 要]根据流域水资源保护近期工作需求,以松辽流域国家水资源监控能力建设项目数据库成果为基础,并参照其数据库建设标准,完成了松辽流域水资源保护数据库初步设计和建设,梳理整编了九类水资源保护基础对象数据,完成了对象编码,发布了空间地图服务。数据库的初步建成,初步改善了数据存储分散、无法更新、版本不一致等问题,改变了数据的存储、管理和对业务工作的支撑方式,并已在相关业务系统建设中得到了应用。

[关键词]水资源保护;数据库;松辽流域

0 引言

松辽流域水资源保护局“十三五”水资源保护工作的总体思路是“一个目标、两个平台、三个能力、四个重点”。以推进流域水生态文明建设为目标,加快完善水功能区监督管理体系和松辽水系保护机制,全面提升水环境监测能力、突发水污染事件应对能力和水资源保护信息化支撑能力,着力推进水功能区限制纳污红线考核、入河排污口管理、饮用水水源地保护以及水生态系统保护与修复。在业务信息化建设方面,提出了提升水资源保护业务协同水平,运用信息化手段提高水资源保护的监控、预警和管理能力,提升信息共享程度的要求。经过“十二五”期间的一系列项目建设,数据资源得到了一定程度的积累,但数据存在多头建设、分散管理、未结构化入库、应用效率低等问题。为完善数据一致性,提高数据利用率和服务支撑能力,参照国家水资源监控能力建设项目数据库结构,以松辽流域国家水资源监控能力建设项目数据库成果(以下简称“流域水资源项目”)为基础,完成了流域水资源保护基础数据库设计和数据整编入库。

1 数据源和采用情况

按照水资源保护近期工作需求,初步的数据库设计和数据整编共涉及九类对象,主要包括水功能区、水质监测断面、入河排污口、水源地、污水处理厂、水功能区区界、水资源分区、取水口和自然保护区。除流域水资源项目提供水资源分区和行政分区等基础区界数据外,原始数据主要有两类存储方式,即Esri产品系列数据及以excel存储的带经纬度信息的表格数据。

Esri产品系列数据主要包含个人地理数据库(geodatabase,9.0版本)和地图工作空间文件(★.mxd)两种。个人地理数据库主要存储了原有的水功能区空间数据,共有5个源数据库,包含注记库、境内要素、境外要素、流域分区数据库和流域全区数据库。前三项主要包含了对象名称注记信息、行政区等图层,该项工作以水利部“一张图”提供的天地图空间服务为准,不采用原有数据格式。此外,地图工作空间文件包含了共22个水源地保护区出图文件,数据包含了以shape(.shp)存储的矢量数据和以grid存储的栅格数据(.dat、.adf),业务工作中需要作为一个整体使用,如果直接转换到地理共享平台的数据标准下,可能会出现空间数据的偏移和变形,且对分层要素的建设没有大的作用,因此仅采用作为22个独立地图服务的数据源,原始比例尺和投影参数等保持不变。

除上述数据外,此次整编和建库工作综合采用了个人地理数据库分区数据库的莫莫格向海要素层、全区数据的水功能区断面、水质监测断面、排污口等12个图层的数据,以及水功能区编号资料、嫩江流域污水厂情况表、松辽流域水源地名录等7张数据表的基础数据。

2 整编方案

2.1 工作原则

按照《松辽流域水资源保护局“十三五”信息化建设方案》要求,在数据建设方面,遵照统一标准、互联互通的原则,遵照与松辽委信息化建设总体标准一致的原则。有国标和行业标准的,采用行业标准;没有行业标准的,参照国家水资源能力建设项目相关标准和委内规范执行;均没有,自行制定,并向水利部松辽水利委员会报备。数据库建设基于国家水资源监控能力建设项目建成的五大基础数据库进行完善,国控未包含的数据库自行建设,并纳入国控数据系统中。

2.2 工作流程

由于原始数据没有统一的、规范的可作为数据库主键的编码,且数据表的属性项组成与入库要求存在较大差距,为满足数据库建库技术要求和业务工作需求,工作主要分为数据属性对比拆分、数据库表结构设计、数据名录核对与编码、数据库建库和数据入库、地图服务制作发布5项主要工作流程。对比原始数据项内容与流域水资源项目数据库的字段,进行逐一的拆分、匹配和整合,在此基础上扩展设计松辽流域水资源保护数据库表结构,核对数据名录,完成对象编码和整编,编制脚本建设数据库实体并装载数据,最终发布空间服务,同步完成水资源保护数据库的基础数据和空间数据、空间服务建设。

3 数据库实施

3.1 数据属性对比拆分

由于原始数据表中基础类数据、空间信息和业务数据、阶段性监测信息糅杂在一起,因此首先参照流域水资源项目数据结构进行数据属性对比和属性项归类拆分,提取出基础类属性项并按照业务实际需求进行本地扩展,作为该类对象的基础数据表源列,其次将原始数据中的空间信息属性项提取出,作为空间数据表源列,经空间数据匹配、完善或生成后,以流域水资源项目基础空间数据的界线数据为依据,通过空间分析,获取该类对象与三级水资源分区、行政县、二级水功能区等面状区域要素的关系,形成关系表源列。水功能区、入河排污口、取水口、水源地等数据均按照上述流程进行了属性对比拆分和源列完善。水功能区区界是业务意义上人为定义的数据要素,与水质监测断面均可归类为河道断面,并按照河道断面的表结构进行比对拆分。污水处理厂和自然保护区由于几乎无可以匹配的字段,表中业务数据属性项在实际工作中支撑作用较明显,因此采用原数据表结构,仅规范字段名称和数据类型。

3.2 数据库表结构设计

由于该期数据源中的非基础、空间属性类数据,大多数属于统计类业务数据,且数据时效性不十分明晰,两者结构不能相互匹配适应,因此该期数据库表结构设计中,基础数据库在流域水资源项目数据库的基础上对部分字段和数据表进行扩展,空间库结构沿用流域水资源数据库表结构,对于统计类业务数据,则单独建表。在扩展的部分,除一部分表格的字段扩展外,扩展了水保局水功能区与流域水资源项目一期水功能区代码对照表、河流与水质监测断面关系表、县级行政区与水质监测断面包含关系表等,初步解决现阶段本地业务规则与上级单位业务规则的差异,满足本地对象基础数据与流域水资源项目监测数据、业务数据的关联查询要求。对没有表结构可参考的基础信息和业务数据属性项,在规范字段的前提下,分别新建了基础信息表和有关业务信息表。

3.3 数据名录核对与编码

数据名录核对与编码是水资源保护数据库建设工作中最重要的一个环节,由于原始数据中大部分要素都没有编码,只是以流水号、序号、页码或对象ID作为顺序码存储,无法直接进行名录匹配,因此对每一项要素,按照实际数据的情况和需要,进行了数据名录核对,之后按照需要整理、编制数据编码。在完成数据名录核对的同时,也同步完成了空间数据对象名录的核对、与国控一期数据对象的比对。

3.3.1 采用业务编码,并建立对照表

一些对象在原始数据中有编码,不适宜作为数据库主键,但业务实际工作中,由多方达成共识和共同使用,同时这类对象在流域水资源项目中也有标准编码规则和表结构,对这类对象在建设中保持原有编码,并建立与流域水资源项目的对象编码对照表,如水功能区对象。水功能区原始数据仅有以“G167”开头的11位编码,取自某文件页码,在流域机构与省区相关部门的业务工作交互中,均以此编码为准,属于用户惯性编码,按现状需求必须予以保留,待流域水资源项目完善后,再修订编码对照表。由于此编码来源于文件报告,在业务逻辑中具有一定的权威性,因此也以这个编码进行空间数据的核定。松辽流域共有739个水功能区,其中一级区438个、二级区481个,二级区是一级区中的开发利用区,二次划分为7个子区,因此一级区中有180个为嵌套对象,水功能区对象数为919个。由于空间数据的属性表中存储的一级区编码存在格式不一致、编码重复、空值等问题,无法直接进行匹配处理,对象数量也与基础数据不一致,而提供的参考资料《A0辽河区流域水功能区划图2015》和《A0松花江区流域水功能区划2015》均为印刷出图的PDF文件,水功能区的名称已经改为注记,无法直接进行搜索,因此核对整理过程主要以纸质功能区划图作为位置基准和参考,按照基础数据名录,以二级流域分区为搜索单元,以河道干支流为搜索脉络,以“地毯搜索”的方式,逐记录搜索空间数据,并对于核对无误的数据,在空间数据属性表的“水保局一级区编码”和“水保局一级区名称”两个字段中,录入相应编码。一级区中共有5组水功能区编码存在重复,5个水功能区编码没有实体空间对象匹配;二级区中有2组功能区编码存在重复,1个水功能区没有实体空间对象匹配,3个水功能区空间对象没有编码对应。参照水利部“一张图”平台信息、业务辅助资料和业务人员的人工核对确认,调整修改了相应信息,进行了对象切分、合并、边界修改等空间数据处理,确保水功能区名录与空间数据能够一一匹配。向海和莫莫格两个国家级自然保护区水功能区对象原本存储于独立图层中,在本次数据整编中,由于业务工作需求,保留与霍林河科尔沁自然保护区的空间重叠关系,暂时不进行切分和调整。

3.3.2 扩展和调整标准编码规则

对于一些对象在原始数据中没有编码,在流域水资源项目中有编码规则,但现行数据无法立即完成与流域水资源项目成果匹配的,为满足业务应用调用的时效需求,以流域水资源项目编码规则为基准,在字段的某一枚举项上进行定义扩展,如水质监测断面和入河排污口数据。水质监测断面的数据源采用的是空间数据及附属属性表,因此首先将空间数据属性表导出后,参照流域水资源项目编码标准,由16位大写英文字母与数字的组合编码进行标识,即12位河流编码+1位断面位置码+3位流水号,考虑水质监测断面的特殊性,断面位置码设置了“7”作为水保局水质监测断面的类型码。入河排污口数据遵循的是第一次全国水利普查的编码规则,此次整编中,考虑实际情况,将原规则中“所在县的行政区6位码”调整为“所在市的行政区6位码”进行对象编码。

一些对象数量较少,此次建设中可以完成与流域水资源项目成果的匹配,业务需求中也不存在已有编码的,直接采用流域水资源项目编码,并完成对象匹配。如水源地,流域机构目前无直管水源地,经核对,《水利部关于印发全国重要饮用水水源地名录(2016年)的通知》(水资源函〔2016〕383号)附件《全国重要饮用水水源地名录(2016年)》中原始数据中水源地名录基本一致,因此采用流域水资源项目对象编码规则,对可以匹配的对象直接采用编码,对需要拆分的大伙房-桓仁水库水源地、白石-闹得海水库水源地和流域水资源项目暂时没有建设的水源地,按照编码规则进行编码。当编码存在跨区时,向上调整一级行政区。

3.3.3 自定编码规则

一些对象数据并非来源于水利系统,一些对象是业务中人为设计的对象,流域水资源项目成果中没有可参考的对象,业务使用中暂无可关联数据和明确关系需求,整编中采用自定义编码,待有可参考规则后,再进行完善,如水功能区区界,是指某个水功能区的起止点或两个水功能区的分界点,无实体对象可与之对应,但在实际业务工作中,又在业务应用系统的地图展示中充当水功能区的“虚拟界碑”。综合分析数据情况后,确定编码格式为17位,所在河流编码12位+“9”+流水号4位(松花江流域片以“s”+3位流水号,辽河流域片以“l”+3位流水号)。又如污水处理厂对象,采用“wscl+2位流水号”规则进行编码。从环保行业获得的自然保护区数据,按照省级行政区划编码3位+级别码1位+主管部门类型编码1位+省内流水号4位进行编码。

3.3.4 其他重要调整

由于编码过程中大量使用到了对象与所在河流关系信息,但原属性字段中仅有“所在水体”属性指标可用,统计出“所在水体”属性值几乎全部为河流,因此将该字段与河流基本信息表进行匹配,获取对象所在河流编码。受第一次全国水利普查工作成果约束,原数据指标值中部分河流、河段名称已经做了调整,利用水利部“一张图”平台、业务辅助资料和百度等信息源,进行了比对,最终有乌尔逊河、五道白河等7条河流进行了对象调整,30项水体名称进行了归并调整,35条河流人工确认编码。在空间位置方面,由于松辽流域国境线较长,受精度影响,个别沿界对象的空间位置超出了水利部“一张图”的国界范围,对这部分地物进行了位置微调或错误位置修正,以确保空间关系的正确获取。

3.4 属性数据库建库

根据数据属性对比拆分和数据库表结构设计情况,沿用和扩展表结构的,复制流域水资源项目成果表结构,扩展后加载数据;对于新建表的,编制建库脚本,建库后加载数据。数据库版本选择了oracle 11g,与松辽委整体数据库平台保持版本一致。

3.5 空间数据库建库和服务制作

为满足空间数据与水利部“一张图”、松辽委有关空间数据标准一致的要求,对除22个水源地外的空间基础数据进行了投影调整,统一采用CGCS2000坐标系。并通过数据格式转换、地图投影变化、融合、剪切等对象处理及拓扑关系检查等步骤后,完成空间数据库建设。以空间数据库成果为基础,在制图软件上进行地图配图后,发布成地图服务,提供给业务应用系统访问和调用。比例尺按照《关于使用国家水资源监控能力建设项目空间数据库地图服务的通知》(水资源办〔2014〕43号)中要求的20个层级进行设置,符号化参照了SZY402-2013《空间信息图式》。服务发布和服务注册遵照松辽委地理信息共享平台的有关技术标准和要求进行。共制作单要素服务10个,专题服务22个。

4 结语

通过数据整编和数据库建设,除直接应用流域水资源项目的12张数据表外,共整编建设8类水资源保护业务数据,包含739个水功能区(将开发利用区计入则为919个对象),水功能区区界断面646个,水质监测断面773个,入河排污口473个,地表水水源地43个,地下水水源地5个,污水处理厂42个,取水口4 640个,自然保护区222个(空间对象29个),制作地图服务32个。目前,数据建设成果已经应用在松辽流域水资源监控能力建设(二期)项目应急系统和松辽流域水功能区监督管理系统建设中,为流域水资源保护工作提供了数据支撑。

通过松辽流域水资源保护数据库的初步建设,初步解决了原本分散存储、格式不一致、无法更新和共用的问题,规范了名录、结构和数据表达,改变了原有数据存储和管理服务方式,更易于为业务应用系统提供数据支撑。但个别数据对象之间的关联关系,从业务管理逻辑上并未能完全明确,仍需要不断完善。数据库建设和数据维护是一项长期且复杂的工作,业务需求与数据库结构之间的适应性和匹配、支撑程度极大的影响了数据库的生命周期。及时、适度的按照业务应用需求,维护数据库结构,是延长数据库生命周期的重要措施。

[中图分类号]TP392;TV213.4

[文献标识码]B

[文章编号]1002—0624(2017)10—0059—04

[收稿日期]2017-08-10

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多