Kettle产品家族介绍
KETTLE是一个ETL工具集,它允许你管理来自不同数据库的数据。Kettle通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。 工作被描述成元数据形式。 在软件设计进化的过程里,存在着4代生成方式。 第一代 — 手工编程: 大量的工作,难以维护,难以发布 第二代: 生成一次, 然后修改来满足需求: 容易生成, 仍然难以维护和发布. 第三代: 从模型生成程序: 易于生成,易于维护,但仍然难以维护. 第四代: 从模型直接执行任务: 易于生成,易于发布,易于维护。 这正是Kettle所使用。
Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
SPOON 允许你通过图形界面来设计ETTL转换过程(Transformation)。例如,从一个SAP系统抽取信息,并把这些信息存储到一个文本文件里的转换任务如下: For more information on Spoon, please check out the Spoon documentation (PDF link).
PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。 想要详细了解 Pan,请查看 Pan documentation (PDF link). CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。(下面是一个Chef的任务图) KITCHEN allows you to run the jobs designed with Chef in batch. (for example using a scheduler)
Job与Transformation的差别是:Transformation专注于数据的ETL,而Job的范围比较广,可以是Transformation,也可以是Mail、SQL、Shell、FTP等等,甚至可以是另外一个Job。
KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。 |
|
来自: liuxingjun > 《我的图书馆》