分享

数据标准的一套完整操作

 weiwarm 2019-05-17

小菜是刚入职两天的实习生,外向的他很快和前辈们熟络了,这天他在去茶水间的路上顺便瞅了一眼旁边前辈的电脑,见前辈正在整理数据标准管理系统需要改的bug需求。小菜心里就开始嘀咕:“数据,我知道是什么意思。标准,我也大概能明白,但是整合到一起——数据标准?这是个什么鬼?难道是数据的标准?给数据一个定义?“

01

什么是数据标准

自己苦思不得,从茶水间回来后小菜终于忍不住了。

小菜:“哥啊,这个数据标准是什么啊?”

前辈:“数据标准就是数据的标准呗,就是给数据一个统一的定义,让各系统的使用人员对同一指标的理解是一样的。”

小菜听到和自己心里想的差不多,不屑的说:“定义就定义呗,有那么重要吗?”

02

为什么数据标准很重要

前辈:“因为啊......”,前辈看到小菜满脸的不屑,“那你说说,你觉得对一个银行来说,它的客户是什么?”

小菜:“啊,客户不就是办了他们银行卡的人么?”

前辈:“那我也可以认为是在他们的银行网站注册过的、或者通过这个银行转账过的人都是客户呀。而且由于数据需求缺乏规范,可能会造成同一数据对象多份存储,存储结构不一致等问题。比如,某个公司的业务部门和财务部门都有客户信息这项数据,但可能由于建设时期或者团队的不同,他们对客户编号长度的定义不一致,业务系统中定义的是6位,财务系统定义的是8位,这就会造成同一客户在业务和财务信息中不能很好打通,严重影响数据共享”

小菜瞬间明白了,原来如果数据没有一个标准,那么人与人之间的理解就不一样,有时为了确定自己的理解是否有误就会询问其他人,这个人如果也不清楚又会再找别人来确定,无疑增加了沟通成本,而且有时技术人员偷懒连问都不问,那可能就与需求有所偏差,导致项目的结果与业务需求相差甚远,就很麻烦了。

前辈看到小菜恍然大悟的表情,哈哈大笑:“这下你知道数据标准的重要性了吧!现在这个大数据时代啊,数据应用分析项目那么多,如果数据本身存在非常严重的问题,如数据统计口径不统一,数据质量参差不齐,数据标准不统一等,往往会影响到项目正常交付,甚至后续数据应用和战略决策。因为在整个项目实施过程时,应用系统之间需要上传下达、信息共享、集成整合、协同工作。没有数据标准,那不乱成一团了嘛。

小菜狂点头:“是的是的,知道了。”但是马上又疑惑了:“那就成文规定一下,让使用人员都清楚明白不就行了,还非得搞个平台?”

03

为什么要有数据标准平台

前辈:“成文规定一下?大数据耶,数据多如牛毛难找得很,我们这个数据标准平台啊,有一套统一的数据命名、数据定义、数据类型、赋值规则等的定义标准,还能提供搜索功能,帮助客户快速找到标准。而且你想啊,你认为标准定了就定了,你就能保证不会更改?还保证它一直有用?你就能保证别人都是按着这个标准来的?”

小菜脸一红,挠挠头:“哇,我确实没想到那么多,原来有这么多的用处啊,哥,你再多讲讲呗!”

看到这小子这么好学,前辈的兴致也来了:“一般,我们认为的标准就是一套规范,但数据标准不仅仅是一套规范,是实现数据信息标准化的过程。通过指定数据标准,可以明确数据定义,避免歧义;通过标准使数据具有相同的结构,使数据共享和交换更容易,减少数据清洗工作;数据标准提供完整的,高质量的数据,为决策支持和精细化管理等提供支撑。”

”那数据标准什么时候会变呢?“小菜继续追问。

前辈:”数据标准不是一成不变的,比如企业在拓展新业务的时候就需要增加相应的标准,另外对于没有价值的标准也要及时废弃。当然了,这就需要我们对数据标准不断进行改造,让标准满足现有业务。我们的数据标准平台对每个版本修改都做了管理,以便于持续维护改进,方便问题查找。而且为了直观的查看标准的变化情况,这个平台还提供了数据标准监控模块,以图表的形式,直观的展现三个月内标准各方面的变化情况,实时监控。”

小菜听到这里,激动地挥动双手,感叹到:“原来数据标准不仅仅是一套共同使用和重复使用的规范,而是通过一套由管理规范、管控流程、技术工具共同组成的体系逐步实现信息标准化的过程啊,牛!”

小菜:“说了这么多,那怎么建标准呢?需要填写什么信息?”

04

4

怎么建立数据标准

前辈:“不同类别的数据标准可能需要设置不同的信息,所以在建立标准之前呢,我们可以先建个标准集,对标准进行分类,设置其需要填写的属性,每个标准集都可以自定义属性。而且我们除了有单条新建标准的方法,即在新建标准页面设置标准属性值然后保存即可,也支持从excel文本中导入在表格中编辑好的标准到系统中,还提供了标准文档管理,你可以上传和管理任何格式文档的标准。另外还支持从元数据拾取生成数据标准,用户选择元数据及元数据下的字段信息,设置元数据属性与数据标准属性的对应关系,自动获取元数据属性信息填充到标准中,形成标准。”

前辈看了看表:“你感兴趣的话可以看看数据治理相关内容,刚才我们讨论的数据标准,其实就是数据治理中的重要环节。想做大数据治理,首先要把数据标准做好,否则匆忙建设各种数据仓库、数据集市,最后发现标准有问题,质量不高,这时候再去建数据标准就会导致投资浪费问题。我们的数据治理管理平台睿治有9大产品,从元数据、主数据、数据标准、数据质量再到数据处理、数据资产、数据交换和数据安全,可以打通数据治理的整个流程。所以了解数据标准的同时也该了解一下数据治理,你慢慢看吧,小伙子,我先去吃午饭啦。”

嗯哼,听君一席话,胜读十年书。前辈离开后,留下若有所思的小菜,默默地打开亿信华辰官网,仔细研读数据治理专题页面克了......


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多