刘桃数据抽取是指从源数据源系统抽取目的数据源系统需要的数据。数据集成是把不同来源、格式和特点的多个孤立数据源在逻辑上或物理上进行集中和融合,从而解决数据的分布性和异构性的问题,为企业提供全面的数据共享。在企业数据集成领域,通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统。
实际应用中,数据源较多采用的是关系数据库。数据抽取的方式可以分为全量抽取和增量抽取。全量抽取类似于数据迁移或数据复制,它将源数据源中的表或视图中的数据原封不动地从数据库中抽取出来,并转换成目标数据源的格式。增量抽取只抽取自上次抽取以来源数据中新增或修改的数据。增量抽取较全量抽取应用更广。 |
|
来自: 求是1025 > 《162大数据与人工智能》