分享

数字政府智慧政务大数据治理体系顶层设、应用体系可研方案

 学习一生 2023-03-24 发布于山东

原文《数字政府智慧政务大数据治理体系顶层设、应用体系可研方案》WORD格式。

政务大数据治理体系顶层设计

政务大数据治理体系核心概念

目的

政务大数据治理的目的包括改善决策支持、降低数据风险、提升数据价值、推进数据有效流通、推动数据共享开放政务大数据治理数据体系

文章图片1

图 13 政务大数据治理数据体系

政务大数据治理数据体系包含从数据来源、数据生命周期和数据等级三个维度。数据来源是对数据治理对象的范围界定,主要包括政府部门数据以及行业、互联网和物联网中与政务相关的数据。数据生命周期是指政务大数据治理体系中数据所处不同阶段的划分,包含原始库、资源库、主题库、知识库和业务库五个阶段。数据等级是指根据数据内容对数据密级的划分,可分为非密数据、秘密数据和机密数据三大类和对应的七小类。

政务大数据治理安全体系

文章图片2

图 14 政务大数据治理安全体系

政务大数据治理安全体系由安全规范标准、安全技术保障体系、安全运维保障体系、安全管理保障体系组成,规范标准用以指导整个安全体系的构建。具体来讲,安全运行保障体系保障数据治理平台建设开发、运维过程中的安全,安全技术保障体系从技术的维度对政府数据治理平台进行全方位的安全防护,安全管理保障体系从制度、人员和机构设置的角度来对信息系统进行保障。

政务大数据治理标准体系

政务大数据治理标准体系的建设对于推动政府信息资源整合、体制机制的建立、制度标准规范的制定乃至于保障数据治理体系的稳定运行,都有着不可或缺的指导意义,也是推进政府数据治理工程的基础性和保障性工作。标准规范建设包括制定数据接口类标准、元数据标准、数据交换流程规范、信息管理类标准、信息安全规范。

文章图片3

图 15 政务大数据治理标准体系

政务大数据采集平台

总体架构

政务数据采集平台总体架构如图 16所示,数据采集平台包含可视化ETL系统、可视化网页数据采集系统、任务调度中心三部分组成。针对不同数据源类型,使用数据库接入的方式接入可视化ETL系统或使用URL访问的方式接入可视化网页数据采集系统。通过便捷的可视化配置操作,生成ETL配置项及网页数据获取脚本。建立任务调度中心,用于解析、调度、运行ETL、网页数据采集脚本,同时对采集任务进行监控,可视化调度任务、数据获取统计,最终将采集数据装载到对应的数据存储载体。

文章图片4

图 16 政务大数据采集平台总体架构

功能架构

政务大数据采集平台融合可视化ETL系统、可视化网页数据采集系统以及采集调度系统,均采用前后端分离思想。可视化ETL系统主要负责ETL配置参数库获取以及持久化工作,为后续的ETL调度任务奠定参数基础,如元数据信息配置:源数据、目标数据库以及可以用于抽取的表、字段、转换规则、清洗规则、抽取规则等信息以及相关函数的定义等等;可视化网页数据采集系统主要功能是提供前端的交互式网页信息标注,后端解析标注并生成网页数据采集脚本,为采集调度系统中网页数据采集调度模块提供任务函数;采集调度系统实现ETL与网页数据采集任务的调度管理,如数据的抽取、清洗、加载、存储、爬取等核心功能以及数据监控展示等功能。


政务大数据接入平台

总体架构

政务大数据接入平台总体架构自底向上依次为数据层、支撑层、接入适配层、交互层。除此之外还包括标准规范、安全保障两个理论支撑体系。

交互层:主要为用户和管理者提供政务大数据接入可视化交互页面。

接入适配层:支持主流数据库数据协议,采集非结构化文件和处理特定业务协议数据,并能编程定制特殊通信数据接入协议。

支撑层:为政务大数据接入运营提供高质量的服务环境,具体包括支撑软件、硬件环境层面。

数据层:数据层主要为政务大数据采集平台以及各委办局提供的各类结构化、半结构化、非结构化数据。

功能架构

政务大数据接入平台功能架构主要包括应用层、接入适配层、通道层、存储适配层。

应用层:主要包括业务应用开发接口、FTP Server、开放文件接口、业务接口改造、开放数据库直连、安全管理、组件管理、日志管理等。

接入适配层:支持主流数据库数据协议,采集非结构化文件和处理特定业务协议数据,并能编程定制特殊通信数据接入协议。适配的协议包括MySql、Oracle、FTP、HBASE等。

通道层:MQ作为消息传输中间件产品,具有独特的安全机制、简便快速的编程风格、卓越不凡的稳定性、可扩展性和跨平台性。对消息的传输,做到不丢失、不复传。

存储适配层:对所存储的结构化、NoSQL数据提供高可靠的、安全的数据提取和访问服务。

技术架构

政务大数据接入平台采用Web服务模式,技术架构包括交互层、服务层、平台层和数据层。

政务大数据接入平台技术架构

交互层:为用户和管理者提供可视化交互页面。政务大数据接入平台采用前后端分离的架构,前端采用React框架,该框架是一个构建数据驱动的 Web 界面的渐进式框架。

服务层:是接收交互层和数据请求的统一处理模块。API网关是微服务架构标准化服务的模式,实现对政务大数据接入平台系统众多服务接口管控,对访问服务的身份认证、防报文重放、防数据篡改、业务鉴权、响应数据脱敏、流量与并发控制。由于政务大数据接入平台在提供服务时,可能会出现请求时间较长的情况,因此引入消息队列机制来控制高并发的请求。

平台层:政务大数据接入平台后台服务基于SpringBoot微服务架构,采用Mybatis进行数据持久化。授权证书服务是基于JWT的密钥管理和签名验证模块。后台服务基于SpringCloud实现微服务管理。基于ETL的数据抽取和转换工具支撑平台的所有数据和数据集操作功能。平台的数据库进程、服务进程都是基于Docker进行容器化。

数据层:数据层主要为采集平台以及各委办局提供的各类结构化、半结构化、非结构化数据。

政务大数据融合平台

总体架构

如图 28所示为政务大数据融合平台总体架构图,通过全面梳理政务大数据业务场景,构建通用域数据模型、公共域数据模型、结构域数据模型和领域数据模型,针对采集汇聚的多源异构政务数据,采用数据融合算法,形成政务大数据融合数据库,如基础库、主题库和业务库,支撑政务大数据融合分析应用。

数据采集接入平台为数据融合提供多源异构数据接入,包括结构化数据库表以及非结构化文本、图像、语音和视频数据等。针对政务大数据业务逻辑,构建形成政务数据模型标准,采用加权平均、高斯滤波、D-S证据理论、逻辑模糊理论、贝叶斯估计等算法实现结构化数据的融合分析,以及典型相关分析(CCA)、核相关分析(KCCA)、非负矩阵分解和基于深度学习的跨媒体关联等方法实现非结构化的关联融合。政务大数据融合平台通过数据模型与融合算法两大核心模块,构建输出融合政务数据库,包括基础库、主题库和业务库。

功能架构

政务大数据融合平台系统包括数据模型、融合算法和融合数据库三个核心模块,如图 29所示,数据模型包括通用域数据模型、结构域数据模型、公共域数据模型和领域数据模型;融合算法模块包括结构化和非结构化数据融合挖掘分析基本算法;融合数据库提供了政务应用所需的基础库、主题库和业务库。

(1)数据模型

核心数据模型由三部分组成:通用域数据模型、公共域数据模型和结构域数据模型。通用域数据模型定义的是在所有领域内具有普遍意义,并在语义上具有高度一致性和稳定性的数据类型,如时间与日期、地址、组织机构、活动与事件、人员和物体等等;公共域数据模型定义的是在多数领域中使用比较广泛,并得到一致认同的数据类型;结构域数据模型是所有其他域数据模型定义的基础,它是对XML模式语言中的基本数据类型的扩充,增加了元数据定义等内容。

业务领域数据模型定义的是特定领域的数据类型,由各业务领域根据自身业务信息交换需求,在核心数据模型的基础上进行继承和扩展而形成的,如精准扶贫数据模型、生态数据模型、应急管理数据模型等。

(2)融合算法

结构化数据融合算法:

加权平均法是最简单、最直观方法数据级融合方法,该方法将多源数据进行加权平均,结果作为融合值,该方法是一种直接对数据源进行操作的方法。卡尔曼滤波算法主要用于融合低层次实时动态多源时序数据。贝叶斯估计是在最大似然概率上做进一步拓展,不直接估计参数的值,而是允许参数服从一定概率分布。D-S理论是对贝叶斯推理方法推广,主要是利用概率论中贝叶斯条件概率来进行的,需要知道先验概率。适用于:信息融合、专家系统、情报分析、法律案件分析、多属性决策分析。

非结构化数据融合算法:

典型相关分析法(CCA)是跨媒体数据关联分析的典型方法,它在计算生物学、金融分析和信息检索等领域有着广泛的应用。基于任务的共享子空间学习方法同时学习多个相关的任务,通过提取不同任务中不同模态间的共享子空间,以提高各个任务的总体泛化性能。基于深度学习的跨媒体数据融合方法是当前的主流方法,通过深度网络的非线性建模能力来分析不同媒体类型数据间的复杂关联关系。这类方法的特征表达能力强,可以抽取出高层的语义信息,能够解决复杂的非线性问题。

(3)融合数据库

融合数据库包括基础库、主题库和业务库。基础库是包括人口、法人、电子证照、地理空间与宏观经济等基础数据库;主题数据库是面向业务主题的数据组织存储,包括政务事项库、信用库等;业务库包括城市态势库、安全业务库、交通业务库。

人口基础信息库是指围绕自然人形成的有关基础信息、婚姻信息、医疗健康信息、社保保险信息、驾驶人信息的数据集合。人口基础信息库是经济社会发展中支撑各部门应用系统的重要基础,对劳动就业、税收征管、个人信用、社会保障、人口普查、计划生育、打击犯罪等信息系统的建设具有非常重要的意义。

法人基础信息库是标识法人不可缺少的基本元素,是使用最频繁、最基础、最重要的信息,主要包括法人基础信息数据、主要人员信息、自然人出资信息、法人扩展信息数据、非自然人出资信息。

电子证照基础信息库的建设有利于通过电子证照共享平台,将电子证照与电子批文等应用到行政审批流程中。企业、民众在申报行政审批事项无需提供前置证照的纸质材料,而由受理部门窗口通过电子证照共享平台查验。

宏观经济是反映经济状态的主要数据,对指导经济政策、调节经济指标有着至关重要的作用。宏观经济从宏观上理解社会经济活动的总体情况,依赖于各统计部门的统计数据。宏观经济基础信息库需要根据宏观经济关注的重点,设计了接口良好的数据模型,方便统计部门快速上报数据。宏观经济基础信息库包括了经济发展、社会就业、公共事业、科技创新、可持续发展、重大投资项目。

自然资源和地理空间基础信息库项目是“十五”期间国家电子政务重点建设的四个基础信息库之一。自然资源和地理空间基础信息库是我国规模宏大的地理空间信息资源建设项目,是我国国家地理空间信息基础设施的重要组成部分,其建设对于加强和完善我国高层地理空间信息基础设施具有重要的作用。

技术架构

政务大数据融合平台技术架构主要由数据模型、融合算法与融合数据库部分构成。

数据模型:利用数据采集接入平台获取的数据,通过PowerDesigner,Open ModelSphere等数据建模工具,构建政务应用业务数据模型,用于支撑数据融合。

融合算法:基于已构建的政务数据模型和多源异构政务数据,利用Tesorflow、Guetzli等算法工具实现加权平均、高斯滤波、非矩阵分解、贝叶斯估计等数据融合算法,实现结构化与非结构化数据的融合关联。

融合数据库:基于政务数据模型和融合算法,形成融合政务数据集,同时对融合数据集进行分类别、分主题、分业务的归类存储。融合数据库包括基础库、主题库与业务库,根据不同数据类型、数据格式,采用MongoDB、Oracle、MySql等数据库进行存储,为政务大数据资源管理平台提供数据资源支持。

文章图片5

图 30政务大数据融合平台技术架构

政务大数据资源管理平台

总体架构

政务大数据资源管理平台以数据为核心,主要提供数据资源从分析、治理、应用到运维管理等不同阶段的能力。总体架构设计如图 38图 38所示。

交互层:为用户和管理者提供政务大数据资源管理平台可视化交互页面。

功能层:包括元数据管理、数据资源分析、数据资源治理和数据资源运维等服务。

支撑层:为数据资源化运营提供高质量的服务环境,包括支撑软件、硬件环境。

数据资源层:数据层主要为政务大数据接入平台提供的各委办局的结构化、半结构化、非结构化数据。

功能架构

政务大数据资源管理平台主要包括元数据管理、数据资源分析、数据资源治理、数据资源运维等功能,功能架构设计如图 39所示。

元数据管理:为数据资源管理的重要基础,其通过人工采集方式或从已有信息系统中提取方式,完成用户所关注的各类元数据的获取,提供元数据变更、统计、自身质量稽查、使用情况分析、版本和生命周期管理等基本功能。同时提供血缘分析、影响分析、实体关联分析、指标一致性分析等元数据分析功能。

数据资源分析:提供资源成本评估分析,主要包括资源盘点和资源成本评估两大类功能。其中,资源盘点实现标签类别管理,支撑资源标签和业务分类、数据分类关联等功能,最终生成全局的数据资源概览和资源地图;数据资源成本评估通过评估分析模型,提供数据资源构成分析、资源活性分析和分布情况分析功能,持续沉淀核心数据资源。

数据资源治理:为数据化运营提供高质量的数据环境,具体包括数据标准管理、数据模型管理、数据质量管理三大功能。其中,数据标准管理实现数据资源格式、命名的准确性和口径一致性,提供数据标准维护与发布管理功能,支持数据标准与数据间的关系维护,具体包括数据架构规划、数据标准化和指标标准化等功能;数据建模管理提供数据模型管理、比对、分析、展示等功能,具体包括数据模型基线管理、模型变更评审、模型稽核等功能;数据质量管理提供自动化、智能化质量核查工具,能够实现从数据分析到现状分析、问题诊断、优化、处理管理优化,一直到效果反馈全过程质量管理,形成质量治理闭环。

数据资源运维:数据资源应用具体包括资源生命周期管理、资源安全管理和资源评估应用等功能。其中,资源生命周期管理实现数据从产生、应用、归档到销毁的整个生命周期全过程自动化管理,具体包括资源发布变更管理、数据全链管理和资源下线等功能;资源安全管理保证数据资源使用和交换共享过程中的安全,对数据和信息进行适当的认证、授权、访问和审计,具体包括安全策略管理、数据脱敏、数据安全审计等功能;资源评估应用实现全链路的数据资源监管和价值追踪,具体包括资源使用评估、资源价值评估和敏感数据评估等功能。

技术架构

政务大数据资源管理平台采用Web服务模式对外提供数据服务,技术架构包括交互层、服务层、技术组件层、数据持久层和数据存储层。

交互层:为用户和管理者提供可视化交互页面。政务大数据资源管理平台采用前后端分离的架构,前端采用React框架,该框架是一个构建数据驱动的 web 界面的渐进式框架。

服务层:是接收交互层和数据请求的统一处理模块。API网关是微服务架构标准化服务的模式,实现对政务大数据接入平台系统众多服务接口管控,对访问服务的身份认证、防报文重放、防数据篡改、业务鉴权、响应数据脱敏、流量与并发控制。由于政务大数据接入平台在提供服务时,可能会出现请求时间较长的情况,因此引入消息队列机制来控制高并发的请求。

支撑层:政务大数据资源管理平台后台服务基于SpringBoot微服务架构,采用Mybatis进行数据持久化。授权证书服务是基于JWT的密钥管理和签名验证模块。后台服务基于SpringCloud实现微服务管理。基于ETL的数据抽取和转换工具支撑平台的所有数据和数据集操作功能。平台的数据库进程、服务进程都是基于Docker进行容器化。

数据持久层: 采用Hibernate、iBatis和JDBC相结合的方式,对于量不大且结构比较严谨的数据,Hibernate、iBatis是一种比较实用的存取方案。对于量大且性能要求高的批量元数据存取,由于Hibernate、iBatis性能上无法保障, 因此,采用JDBC直接读写方式。另外,针对文件类数据提供单独的文件访问组件。

数据存储: 主要是对平台资源模型、元数据、采集配置数据、及平台支撑数据的存储。

政务大数据应用体系

政务大数据共享交换平台

总体架构

文章图片6

图 42 政务大数据共享交换平台总体架构

政务大数据共享交换平台遵循面向服务体系结构(SOA)进行框架设计,基于国家标准电子政务模型,结合政务大数据应用体系实际需求,综合考虑存量、条线业务对接等问题,实现数据实时快速传输、交换、编目、管理等要点,依据国家相关数据共享交换政策法规与数据标准,进行总体设计。

功能架构

文章图片7

图 43 政务大数据共享交换平台功能架构

政务大数据共享交换平台系统由以下三个部分组成:

政务公用数据资源库:政务公用数据资源库主要由元数据库、基础库、主题库构成。元数据库主要包含数据库定义、标准规范、数据处理过程定义等基础配置信息,为基础库和主题库提供数据标准化支撑服务。基础库主要用于存放国家标准及各地方标准制定的自然人、法人、地理信息、宏观经济等数据信息。主题库主要针对特定领域、特定行业进行业务分析,通过动态数据抽取,完成数据从基础库到主题库的重组工作,将数据根据各个主体进行分类存储。

数据共享交换系统:数据共享交换系统是数据共享交换平台的核心组件,将数据经过数据管理后形成的数据资源库,通过数据目录查询数据,利用Web Service接口、前置库接口等技术手段,实现数据的实时共享交换。从而保证数据共享交换的完整性、时效性、准确性和可用性。

共享交换平台门户:共享交换平台门户是基于以上三个部分,面向用户提供数据共享交换API服务与相关数据可视化统计服务的网络平台,用户可通过该门户查询数据、申请获取API,从而实现数据的共享交换。

技术架构

文章图片8

图 44 政务大数据共享交换平台技术架构

政务大数据共享交换平台是基于SOA(面向服务体系)搭建体系框架,利用ESB(服务总线技术)、前置库交换技术等,采用松散耦合的方式构建政务大数据共享交换平台。在数据的传输与转换过程中,提供集中统一的控制和管理。

(1)数据层:主要用于数据存储、数据备份与数据安全保障,为数据共享交换提供数据基础。

(2)连接层:提供丰富的数据连接器、适配器,根据一定的数据抽取策略,对需要共享交换的数据进行数据抽取,为数据传输做准备。

(3)传输层:将连接层抽取的数据,发布在信息总线上,在所有系统之间传输路由和消息,实现数据上传和下达。

(4)转换层:将通过信息总线传输的数据,进行数据获取、数据处理,对异构数据进行转换、有效性检验和分析,并利用数据资源编目对数据进行数据的分类分级,完成数据的转换。

(5)应用层:将转换完成的数据,通过API接口进行共享开放,供用户进行调用获取数据集。

(6)监控管理层:针对数据共享交换技术流程体系,进行统一管理、调度、安全保障、维护和控制。

关键技术

(1)分布式异构数据组织与管理技术

为实现大数据的共享与开放,满足广域网环境下海量、多源、异构数据的快速发现、准确定位的需求,开展针对分布式异构数据的虚拟化组织、统一化管理等方面的技术研究,重点突破基于数据语义特征的元数据自动抽取、分布式数据资源虚拟化组织、分布式数据资源联合检索、基于元数据的无中心资源目录同步等关键技术,制定多维数据分级分类标准,支持海量分布式数据的快速定位,迅速地发现与需求匹配的数据资源,建立具有明确层次结构的数据体系、全局资源视图、数据资源目录体系,明确政府部门向社会公开数据的内容、格式和途径,形成政府部门和事业单位等公共机构数据资源开放清单,为数据共享与开放提供技术支撑。

(2)面向跨域共享交换的数据服务技术

面向数据提供方和使用方之间跨地域、跨部门、跨系统的数据共享交换需求,开展面向服务的跨域共享、数据开放、访问控制等领域研究,重点突破分布式数据服务注册发布、数据目录同步、数据服务接口自动构建、基于细粒度访问控制的数据服务访问、基于发布订阅机制的数据智能分发推送等关键技术,制定面向服务的数据共享规则、数据开放规则和相关的接口规范,提供数据访问接口调用、订阅分发、内容主动推送、按需下载等数据服务,解耦数据供需关系,实现全局数据资源的发布和授权访问。

(4)微服务技术

微服务作为一种新兴的软件架构,把一个大型的单个应用程序和服务拆分为数十个微服务,系统中的各个微服务可被独立部署,各个微服务之间是松耦合的。每个微服务仅关注于完成一件任务并能很好地完成该任务。

在政务大数据共享交换应用场景中,以微服务技术为支撑的数据服务体系,通过微服务总线技术模式,实现数据共享交换服务。满足调度中心对数据调度过程的可控、可溯,对经由微服务总线的所有数据接口、数据流进行全程监控,并能够对整体流程进行审计。

技术路线

文章图片9

图 45 数据共享交换平台技术路线

政务大数据共享交换平台搭建任务主要分为三个阶段。第一阶段为多源异构数据组织管理技术的研究工作与工程实现,将多源异构数据进行组织管理,并利用数据编目进行数据分类分级,实现跨层级、跨领域、跨地区数据的整合管理。第二阶段为跨域交换共享服务技术研究与实现,该阶段将政务大数据资源库中数据根据需求进行数据抽取,并研究利用共享交换的前置交换、交换桥接等技术方式,对数据跨域共享交换进行分配与调度,构建相关API接口,为平台最终建设做好技术支撑工作。第三阶段为平台搭建与功能集成阶段,该阶段将政务大数据资源库中数据进行数据分类分级、目录管理,利用共享交换技术,设计高性能实时数据传输API接口与相关应用体系,搭建政务大数据共享交换平台。

政务大数据开放平台

总体架构

文章图片10

图 46 数据开放平台总体架构

政务大数据开放平台的搭建是为了能够将政务数据经过脱敏脱密后,面向公众进行数据开放,公众可通过调用平台设计提供的API接口服务获取政务大数据公开数据集,也可下载已使用本平台API接口的应用,同时本平台鼓励开发者进行数据API接口申请与调用,更大限度的提高政务大数据的利用效率,并开发数据背后的潜在价值。

该平台遵循SOA模式进行框架设计,结合实际设计需求,综合考虑实时数据传输效率、数据传输容量、高性能API设计等问题,基于脱敏脱密后获得的政务大数据开放资源库,构建政务大数据开放平台,最终面向用户提供政务大数据开放平台门户,主要包含数据接口服务、应用市场服务和开发者服务等。

功能架构

文章图片11

图 47 数据开放平台功能架构

政务大数据开放平台主要依据互联网架构体系与政府数据开放五级技术成熟度模型进行平台构建。其系统主要分为以下六个方面:

(1)数据信息采集阶段:在该阶段针对政务大数据进行实时或非实时数据采集,并利用ETL技术进行数据采集处理。

(2)数据信息处理阶段:在该阶段针对采集后的数据,基于元数据库中数据策略与指标,进行统计、分析,并针对于政务大数据进行数据的脱敏、脱密,将处理后的数据进行数据同步,存储于政务大数据开放资源库中。

(3)数据应用设计阶段:是根据实际平台设计需求,结合已获取数据,利用URI定位等技术,进行数据深层次分析,获得数据间关系,同时设计高性能API接口,用以支撑上层应用。

(4)数据信息开放应用阶段:该阶段主要利用下层提供的技术支持,将平台所需功能集成于web平台,通过Web Service模式,使用户可以在该门户平台通过调用API等方式,灵活利用公开政务数据,高效率深度挖掘数据的深层价值。

(5)数据生态构建阶段:该阶段是基于政务大数据开放平台,综合跨层级、跨地区、跨领域数据,搭建大数据开放生态体系。

(6)数据信息服务阶段:该阶段贯穿整个系统流程,为政务数据开放提供服务支持,流量监控,安全保障等系统,全方位监督数据的开放流程,并保障数据的安全可靠性。

技术架构

文章图片12

图 48 数据开放平台技术架构

政务大数据开放平台技术架构参考互联网架构进行设计,用以支撑政务数据准实时开放。

(1)数据采集层:通过多种渠道采集政务大数据,并对数据进行脱敏脱密等处理,获得可供开放的政务大数据资源库。

(2)数据管理层:该层在安全标准管理下,利用统一协调调度平台,对多源异构数据进行集中管理、集中处理,利用URI等技术获得数据定位,并对数据间关系进行分析整理。

(3)数据服务层:该层利用nodejs等方式对服务进行封装处理。

(4)数据应用层:该层通过服务层,将数据管理层数据获取,并进行URI定位与数据间关系分析,将各项功能集成于web平台,让用户可以通过该平台门户进行交互,从而获取相应的数据信息或相关的数据应用、数据分析结果。

关键技术

(1)非结构化数据的智能识别与脱敏技术研究

1)结合人工智能和语义分析等方法,实现政务文本数据的敏感数据自动识别;

2)研究非结构化的图像数据,实现图像中的敏感数据自动识别;

3)研究非结构化的音频数据,实现音频中的敏感数据自动识别;

4)研制基于大数据分析技术的静态与动态数据脱敏工具,实现政务数据共享交换过程中的敏感数据脱敏。

技术路线

文章图片13

图 49 数据开放平台技术路线

政务大数据开放平台搭建技术路线分为两个阶段,第一为关键技术研究与实现阶段,针对于多源异构政务数据,进行数据清洗与脱敏脱密技术研究,面对结构化数据、非结构化数据(视频、音频等类型数据),利用人工智能、语义分析、图像处理、音频处理等技术,对数据进行脱敏脱密,构建政务大数据公共资源库。第二阶段为平台构建阶段,将数据URI定位技术、数据间关系分析技术、网站平台构建技术进行结合,搭建政务大数据开放平台门户网站,为用户提供政务大数据开放API接口与相关应用服务。

来源网络,旨在交流学习,因转载众多,无法获知最终出处,如有侵权,联系速删。

更多参考公众号:优享智库

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多