分享

以元数据为基础的数据治理策略

 昵称16619343 2019-08-22

什么是数据治理策略?

数据是公司资产。为了更快地做出决策,用户必须信任它。数据治理打破了整个企业中不同系统的数据孤岛,并建立了一套流程,标准和策略,以使企业范围内的数据可以消耗。自动数据治理平台可以快速安全地将可信数据提供给需要它来执行工作的业务用户。协作是整个组织成功使用数据的关键。所有业务用户都需要知道在哪里可以找到正确的数据,并对数据的含义有共同的理解。可用业务数据的数量,种类和范围呈指数级增长,使得查找,理解和信任变得越来越困难,尽管这对于从中获取价值至关重要。

系统就位 - 就像受管理的数据目录一样 - 使用户能够以业务术语理解数据,同时还建立数据集之间的关系和关联。要做到这一点,首席信息官需要与首席数据官(CDO)合作,管理以治理为基础的数据战略,将正确的数据传递到正确的手中以推动业务转型。

CIO和CDO必须在提供业务方面相互支持,而且两者都不能单独成功。要使数据治理策略取得成功,每个业务负责人必须在其DNA中拥有数据。CDO的任务是构建这些组织实践和行为,以协调这一基础变革,从而成为一个数据驱动的组织。

为了确保在正确的时间掌握正确的数据,组织必须通过快速采取敏捷数据流程,使业务更快地移动并对内部和外部更加敏感,从而无情地识别和减少不良数据孤岛。数据需求。最重要的是,他们需要确保团队与共同愿景保持一致,并以务实的方式推动预期结果。

数据几乎渗透到业务的每个方面,是数字化转型的基础。治理工作应与数字化工作紧密相关。深入研究云,物联网,人工智能和机器学习等技术,在组织能够充分发挥这些技术的全部潜力之前,必须采用数据治理策略。在实施新技术时,数据通常是最大的问题,而且越来越多的消费者受到数据驱动决策的影响。数据必须正确且无偏见,才能使技术产生正确的影响。有缺陷的数据只会减缓数字化转型。

例如,在Forrester首届数据战略和见解会议上,我们了解到人工智能支出由于缺乏对算法数据的信任而停滞不前。数据治理是这个问题的解决方案,提供数据可见性和数据质量的好处 - 如果不实施健全的治理,就不会对AI产生信任。

元数据管理

数据治理操作模型可以支持业务和技术元数据的捕获和管理。我和很多公司的人交谈过,他们表示他们不知道他们的数据在哪里以及它意味着什么。可以使用许多不同的工具创建技术元数据。理想情况下,可以提供强大的数据目录和谱系。此信息很有用,但该数据的业务定义是一项关键需求。

数据治理办公室可以协调公共业务语言的开发,甚至是受影响业务领域的业务术语表,利用数据域所有者和业务数据管理员,并确保将此信息与技术元数据集成以获得企业数据的完整视图,无论它居住在哪里。这种努力可以为组织带来的价值是巨大的。

无论是与新开发还是持续监控/维护相关,数据治理和数据质量自然相互补充。强大的数据质量管理程序需要数据分析,定义业务规则以确保“正确”数据,实施这些业务规则,持续监控关键数据项,并确保采取纠正措施以继续提供高质量数据。

数据治理办公室是协调和确保数据质量管理流程持续发展的重要领域。上述许多活动最好由业务数据管理员和技术数据管理员执行。如果没有数据治理计划,很难找到任何人“拥有”正在进行的流程以确保持续的高质量数据。

亿信华辰的元数据管理平台内置全文搜索引擎,让各层次用户可快速定位自己所关心的元数据。该管理平台支持基于名称、基本属性、元数据间关系查找的同时,还支持全文搜索。通过多种组合条件的模糊查询,即可在整个元数据环境中随时检索所需元数据。

场景二:快速定位问题

1、无法实现快速定位

假如你是某业务部门经理,有一天,当你拿到公司的业务数据时,忽然发现有一些数据不太合乎逻辑甚至存在造假嫌疑,这时候就需要找出问题出在了哪个环节。而你的第一反应就是向相关业务部门反应,当然他们也响应了需求。但事实上一般的数据加工链往往比较长,数据之间类型不同,甚至属于不同的业务系统,问题排查起来耗费较多的人力与时间,效率低下。

2、元数据血缘分析实现定位和预测

那么,如何才能够快速的定位问题?毕竟只有向上寻找数据的来源,逐步排查数据问题并找到后才能“对症下药”。这时候就要用到元数据的血缘分析功能了。

血缘分析是指从某一实体出发,往回追溯其处理过程,直到数据源接口,可快速追溯数据来源和加工过程,影响分析可掌握元数据之间的相互关系。它可以提供字段级的数据,以图形化的方式展示数据链路的关系,逐步向上将分析的问题数据定位在特定的几张表的某些字段上,最后排查问题的所在。如此便简化了数据问题的分析,减少人力成本,一步定位问题所在。

对数据操作过程的分析不仅能快速定位问题,还能应用于预测数据的变化,与血缘分析类似,元数据系统提供了分析数据流向的功能,因此当前数据源发生变化时,数据图形的流向会分析与此数据源有联系的数据都有哪些变化。比如亿信元数据管理平台(EsPowerMeta)就提供了图形化的元数据基础分析以及高级应用分析。

场景三:快速采集所需元数据

随着大数据技术的崛起,企业的数据量正急剧增加,许多企业已经意识到元数据建设的重要性,但面对多样化甚至跨系统的业务数据,怎样才能够快速采集到所需的元数据呢?

对于不同样式的业务数据可以通过元数据来规范记录数据的信息,而对于不同库表的数据,需要将这些数据从不同的库表中取出。这时候很容易想到用适配器,通过不同的适配器采集不同库表中的数据。

那就不得不提亿信华辰的元数据管理系统,它完美地实现了数据的自动化采集,提供多种数据库适配器,实现元数据的管理、分析与采集,可以从Oracle、MySQL、SQL Server等数据库中采集数据,从excel文本中采集,并且还内置Hbase等分部署数据库采集适配器,可满足不同场景的业务需求。

数据生命周期管理

数据生命周期以多种方式定义。简而言之,数据是(1)创建,(2)存储,(3)使用,(4)存档或销毁。数据治理有助于制定支持此生命周期的策略和过程。

例如,数据域所有者与公司的适当领域(风险,法律,合规等)合作,可以定义有关数据存储,数据架构,数据标准,数据质量,数据分类,数据访问,数据使用,数据共享和数据保留。然后,数据管理办公室可以与数据域所有者合作,在实施这些策略后确定适当的监控指标。如果没有数据治理运营模式,协调这些要求并确保合规是一项复杂的工作。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多