分享

政务案例(十七):云计算、大数据、人工智能赋能金财工程

 weiwarm 2019-05-19

导读

我国电子政务建设围绕“两网一站四库十二金”展开,“金财云”建设紧紧围绕我国电子政务建设十二金中的“金财工程”建设,为金财工程赋予云计算、大数据、人工智能等。

4月份在个人公众号分享了关于金财工程数据中台建设思路,今天在数据工匠俱乐部借此机会分享金财工程的大数据技术方案落地篇,欢迎大家相互交流学习。

引言

我国电子政务建设围绕“两网一站四库十二金”展开,金财工程是“十二金”信息化系统建设的重点之一,金财工程是财政工作信息化和财政管理现代化的必然要求。它的建立与实施将管理超过全国GDP20%的资金流动,对于加快社会主义市场经济体制的建立和促进国民经济管理的现代化,规范财政预算管理,提高国库资金使用效率,增强财政决策的科学性和财政工作的透明度,加强廉政建设实现依法理财等都具有十分重要的意义。

财政制度在中国体现在政府与市场、政府与社会、中央与地方关系,涉及政治、经济、文化、社会等各个方面。建立现代财政制度,是党的十八届三中全会立足全局、面向未来提出的重要战略思想,是党中央把握现代国家发展规律做出的重大决策部署,新一代的财政制度建立,需要与大数据、人工智能、云计算等先进技术作为支撑。

背景

财政部门是中国政府的大管家,金财工程的信息化建设水平高低直接影响着中国政府宏观调控的落地成果,但是财政行业的信息化建设,属于典型的烟囱式系统。近几年,财政行业提出了通过一体化应用平台实现财政体制改革,网上一体化应用平台方案理论研究到处可搜,但是各地政府的财政部门还没几个真正落地,显然信息化推动改革不是一件易事。以省级财政信息化建设为例,现状如下:

1)财政一体化平台快速落地:随着财政改革的深入,金财工程建设的不断完善,目前各省全面启动财政应用一体化平台建设,随着一体化平台的深入应用,将会彻底改变财政业务数据的管理方式,财政数据由分散式管理向集中式管理转变。

2)金财工程在大数据时代面领的困境:历经各级财政多年的数据积累,当前各级财政部门已经沉淀了大量的信息资源,这就是常说的“大数据”,这些资源无疑是各级财政亟待开发的“宝藏”。大数据时代的来临对财政部门而言都是一次难得的历史机遇和挑战,财政部门只能迎头赶上,用科学的数据挖掘方法深挖各类信息,为中国转型发展提供不竭动力。

3)财政相关部门对数据价值认识不高:我国财政部门对数据挖掘的认识还不够深刻。以中央财政为例,只有少数司局在运用宏观计量经济模型来进行宏观经济运行分析并对财政收支进行预测分析财政数据最集中的国库司也是近年来才开始运用数据挖掘,而且还处于起步阶段,因此,对一些挖掘技术的掌握运用以及数据仓库的构建都还有相当多得工作要去做。多数财政部门的数据分析仍然主要以报表等传统的工具为主,相当于数据的初次利用,是一种“平面化”的分析。而数据挖掘的主要方式既包括报表统计,也包括数据建模分析和潜在的知识挖掘,相当于数据的二次利用或多次利用,是一种“立方式”的分析。

综上所述,金财工程融入云计算、大数据、人工智能技术,需要从数据、部门、厂商三个维度进行分析,具体如下:

建设目标

为进一步贯彻落实财政部全国财政信息化“三化五统一”要求,通过云计算、大数据、人工智能等技术建立“金财云”,构建财政管理新模式;以大数据为抓手,遵循顶层设计、承上启下的原则,以网络信息安全及统建统管为保障。依据财政部编制的《财政业务基础规范3.0》和财政业务系统一体化为着力点,在平台之上构建财政数据资源池。着力实现管理流程一体化、数据标准一体化、信息资源一体化、部省市县一体化。并以此为基础推动建立业务规范、决策科学、运行高效的新型财政管理与服务模式。

建设内容

1)盘点数据资产,构建财政数据一张图

以元数据智能驱动,通过数据探查财政内部数据,定义外部数据、互联网数据,针对三类数据资源形成数据资源一张图。

2)落地数据标准,构建本地数据资源标准

结合盘点数据资源工作,依据财政部编制的《财政业务基础规范3.0》为依据,落地省级数据资源库标准池。向下提供省级标准规范,向上实现与部标进行比对,横向提供政务资源目录。

级财算管理数据资产录样列图

3)异构数据汇集,汇聚数据资产池

通过网络爬虫、数据交换、数据集成等技术手段实现内部数据、外部数据、互联网数据的收集,针对内部数据中的停用数据和生产数据用不同的存储区域进行分类存储。

4)全域数据处理,建设财政数据资源库

针对汇集的数据资产池,结合财政部数据标准规范和国际政务资源目录要求以及财政决策分析需求,将财政资产库分为原始库、基础库、主题库,在原始库中按照停用数据和生产数据分别存储到不同区域,基础库按照财政全业务数据通过领域模型、逻辑模型、物理模型的过程构建财政基础业务主题,在主题库依据领导驾驶舱、财政收支、反不正当支付、脱贫攻坚等应用主题实现维度建模。

5)提升数据质量,实现资源库旁路治理

针对数据资产池实现,按照原始库、基础库、主题库进行数据质量6大维度(及时性、完整性、准确性、一致性、规范性、唯一性)进行数据质量评估。在原始库主要以完整性、及时性等基础校验;在基础库主要以数据标准进行规范性、唯一性数据质量评估;在主题库主要以一致性、准确性进行数据质量评估。针对数据处理过程的数据处理任务,实现数据对账评估、链路完整性等进行质量评估。

  • 建立数据安全,动态构建数据服务

针对数据访问、数据生产、数据管理实现三权分立;构建字段级别的数据超市,实现数据结合资源目录进行动态发布。

总体设计

在“金财云”之上构建的大数据服务管控平台分为数据接入、数据资源库、数据治理平台、财政内网数据共享服务门户等几部分组成。

1)数据接入

针对财政业务的内部数据、外部数据以及互联网数据结合电子政务外网、互联网、财政内网等网络环境现状,需制定多种数据接入方式,具体如下图所示:

  • 财政内网的内部数据

采用中间库方式、直连方式、数据文件、数据备份/恢复等方式。

  • 电子政务外网的外部数据和部分内部数据

采用数据交换平台、人工刻盘等方式。

  • 互联网的网络数据

采用网络爬虫方式后,通过数据交换平台方式。

2)数据资源库

财政内部数据和外部数据分析主要通过从预算、指标、计划、支付、税收、非税、决算等各项核心业务系统中提取的财政业务应用数据,进行全财政视角展现,实现财政数据的统计分析,支持多维度、多角度定制分析,为财政预算编制、执行和监督提供依据,提高管理和决策水平。财政行业资源库数据分为结构化数据和非结构数据;非结构化数据主要依据大数据平台存储表单、票据、凭证、文书等内容,结构化数据主要依据MPP存储预算编制、预算执行、国库支付等业务系统数据,通过财政标准、领导驾驶舱、政务信息资源目录针对数据资源库划分为原始库、基础库、主题库三层资源库,资源库建设思路按照自上而下的维度建模方式。

  • 原始库:针对原始库划分为生产区和历史区,生产区基于当前在用和新建的系统;历史区主要针对已停用的系统。

  • 基础库:基础库建设划分为标准区和整合区;标准区依据财政部3.0规范结合财政业务按照预算编制、预算执行、决算报告、绩效监督、综合报告建立基础资产目录进行标准提炼;整合区按照财政基础业务依据主数据进行高度抽象为:人员信息、单位信息、银行信息、项目信息等。

  • 主题库:主题库利用财政数据中心,通过构建数据分析算法模型对财政内部数据和财政外部数据,按照一定的口径进行统计分析,以财政内部和外部数据构建财政态势分析、收支综合分析、财政专题分析等主题库数据。

3)数据治理平台

数据治理平台的功能包括元数据管理、数据标准、数据集成、数据预处理、数据仓库管理、数据模型管理、数据资产管理、数据服务管理等功能。

4)财政内网数据共享服务门户

主要针对财政业务部门提供数据标准查看、数据资源目录浏览、申请、数据服务获取等功能。

建设成果

当前已经完成34个系统的信息梳理,依据输入、输出的信息资源梳理出11个核心业务系统比较重要,具体如下:

1)完成原业务系统接入10多万张表接入,内部数据接入上亿条数据,政务数据完成十几万数据对外共享。

2)标准落地情况:形成省级本地数据标准,编制出接近万个数据元,针对万余数据元进行编目,形成部门类、基础类、主题类三大资源目录体系。

3)在主题库层面:构建了单位画像、专项资金预警、领导驾驶舱等应用主题分析。

结束语

关于财政大数据治理方案落地呼吁

财政信息化水平本身就不高,客户数据认知度也不高;我们需要循序渐进,着重解决1~2个数据应用主题问题,避免吃一口大胖子,建设成果反而不理想。“金财工程”数据中心建设属于起步阶段,很多地方都没经验,摸着石头过河,希望有更多的企业和专家为我国财政信息化建设添砖加瓦!

作者简介

刘俊良,某公司大数据产品部技术委员会主任,负责公司整体产品规划,带领数据治理产品连续两年(17/18)在数据管理领域大数据企业排行榜排名第一。中国大数据产业生态联盟大数据专家。参与工信部信通院组织编写的《数据资产管理是白皮书》和工信部信标委组织编写的《大数据标准白皮书》。参与多个国内大数据基础平台的厂商功能和性能测试。从事10年左右工作经验,在公安、工商、检察院、法院、高等院校等领域主导多个上亿数据项目的落地。


联系我们

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多