分享

【转帖】数据迁移之Kettle的使用小结

 集微笔记 2013-09-12
场景


有五个数据库,其中两个SQL Server还有三个是Oracle10G


目标


将两个SQL Server中的业务数据分别依照特定的逻辑迁移到三个Oracle数据库中。


Kettle的使用(基础)


Kettle的安装和配置



  1. 关于Kettle的安装可以直接到官网上去下载。

  2. 对于Kettle的配置需要有一个数据库,Kettle的数据库负责存储Kettle自身需要的元数据描述、任务、转换等,Kettle默认的登陆信息是admin/admin

  3. 创建Oracle数据库连接直接依照提示输入即可,下图例出了SQL Server的连接。


SQL Server的连接注意区分Database NameInstance Name










001




 


Kettle的基础概念



  1. 作业,负责将[转换]组织在一起进而完成某一块工作,通常我们需要把一个大的任务分解成几个逻辑上隔离的作业,当这几个作业都完成了,也就说明这项任务完成了。

  2. 转换,定义对数据操作的容器,数据操作就是数据从输入到输出的一个过程,可以理解为比作业粒度更小一级的容器,我们将任务分解成作业,然后需要将作业分解成一个或多个转换,每个转换只完成一部分工作。


Kettle使用基础示例



  1. Kettle的错误处理,有很多场景需要用到错误日志记录,如迁移过程中提示数据自身的问题、主/外键错误、违反约束等都要将当前场景记录到一个地方供后续特殊处理。


示例


主要流程


0010


错误信息配置


002


 



  1. 数据量很大的情况可以加上过滤参数处理


003


 


004


 


005



  1. 值的映射


 


006


 


007


 



  1. 连接


这块要注意到连接所用到的原始数据一定是排过序的


008


 


009


 


参考资料



  1. baidu文库#BI-Pentaho权威指南

  2. http://www./

  3. http://blog.csdn.net/ybygjy/article/details/7478113

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多