上一节:kettle——(1)介绍和Execl输出举例 最近公司在做数据总线的工作,需要用kettle这个ETL工具,所以花了一些时间来研究研究,喜欢的话点个赞
kettle抽取一个数据库中数据,同步到另一数据库1.新建一个“转换”,新建两个数据库连接如下:目标数据库MySQL 源数据库SQL Server 2.拖入“输入表”和“输出表”输入表:选择相应的数据库,可以直接获取sql语句 输出表:选择相应的数据库,填写目标表(同步数据用的表),可以直接获取sql语句 没有连接导致字段不可读 按住shift之后便可以连线 目标数据库中没有相应的表,需要新建 执行 3.运行转化文件即可以上说的是完全同步一张表的情况,而且前提是——在目标数据库中没有同名的表 如果我只需要这张表中的某些字段应该怎么办 4.根据自己的需要删除或者修改字段,再同步数据源数据表 添加“字段选择” 编辑“字段选择”,获取字段 移除自己不需要的字段:先获取,然后右击——删除 修改字段(这里偷懒没有写,自行脑补哈) “输出表”运行SQL语句,建立新表如下: 最后结果 以上的同步数据是在目标数据库中没有这张表的情况下,如果目标数据库中已经存在这张表了呢? 5.同步目标数据库已存在的表源数据库表数据如下: 目标数据库表数据如下: 修改字段选择,删除字段create_time(同步的数据没有这一列的数据) 修改输出表对应已存在的表 最后结果 下一节:kettle——(3)全量抽取和增量抽取
|