分享

数据聚合

 求是1025 2023-03-31 发布于山东

由于数据是从多种来源收集而来,因此“数据聚合”已经成为数据预处理流程中的一个重要组成部分。数据聚合的核心任务是要将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源。

联邦数据库是早期人们采用的一种模式集成方法。其基本思想是,在构建集成系统时将各数据源的数据视图集成为全局模式,使用户能够按照全局模式透明地访问各数据源的数据。在联邦数据库中,数据源之间共享自己的一部分数据模式,形成一个联邦模式。

中间件集成方法是目前比较流行的数据集成方法,中间件模式通过统一的全局数据模型来访问异构的数据库、遗留系统、Web资源等。中间件位于异构数据源系统(数据层)和应用程序(应用层)之间,向下协调各数据源系统,向上为访问集成数据的应用提供统一数据模式和数据访问的通用接口。各数据源的应用仍然完成其任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务。该方法同样使用全局数据模式,通过在中间层提供一个统一的数据逻辑视图来隐藏底层的数据细节,使得用户可以把集成数据源视为一个统一的整体。这种模型下的关键问题是如何构造这个逻辑视图并使得不同数据源之间能映射到这个中间层。

数据仓库方法是一种典型的数据复制方法。该方法将各个数据源的数据复制到同一处,即数据仓库。用户则像访问普通数据库一样直接访问数据仓库。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多