分享

数据项目面临的六大挑战

 沧浪之歌66 2018-04-18

   

企业在实施BI、数据仓库和其他与数据相关的项目时或多或少都会遇到困难。我们将这些挑战分为六个类别:①性能;②数据质量;③集成;④数据定义;⑤安全;⑥架构和管理。

每一个类别在从单份报表到整个数据仓库的使用案例中的重要程度都有所不同。分类没有绝对的标准,它们多多少少出自我个人经验的判断。因此,每个企业都应该有自己不同的看法。

既然如此,是什么定义了这六个类别呢?我们来分析一下:


1. 性能
    在实施使用案例的过程中,只有保障充分的性能,才能迅速处理海量数据的查询。

2. 数据质量
    在数据管理过程中,让数据一致、完整、零错误非常困难。对于独立的数据集,通过测试可以解决这个问题,但稳定的数据质量仍然难以达到,一般整合了的数据集的质量都比较低。

3. 集成
    提到集成,我们通常都会想到SAP BusinessObjects Data Services或Informatica的ETL工具,工作包括整合孤岛数据源、集成非结构化数据和结构化数据,以及将数据上载到报表系统的基本任务。另外,将数据孤岛中的语义概念进行集成也属于这一范畴。例如,“revenue”(具有税收、收益等多重含义)这个单词对你和在别人看来是同一个意思吗?这就得看它的识别规则了,数据也同理。

4. 数据定义
    为使用系统数据的用户生成数据定义十分重要。没有定义,数据毫无用处。对于数据专家来说,没有注解的数据集就足够了,正如有些人看一眼数据清单就能了解财务状况或者得出逻辑函数一样;但是,大多数业务人员无法做到这一点。定义的生成工作需要对不同的栏目贴上标签、创建可识别的等级、清晰表现数据的时间点视角和进行视觉探究等。

5. 安全
    一般情况下,你不会希望任何信息都是透明的。在面向数据的系统中,不同数据会有不同的权限,这样不同授权的概念往往在分析系统中表现得比交易系统更为明显。

6. 架构和管理
    企业到底需要投入多少精力在管理解决方案上?有秩序的架构管理起来更加容易,这是肯定的,因为解决方案的模型和实施方式都是一样的。另外,在技术改变的同时,架构也需要随之改变。从星型模式到单一柱状表格的转换到底有多困难呢?如果模板一样的话就没那么难。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多