分享

kettle聚合统计

 大数据与云计算 2014-10-22
业务需求:
 生成 100 个随机数,随机数取值于[0,100)之间,计算小于等于 50 的随机数个数和 大于50 的随机数个数。并把这两个统计数字放在数据库表的一行的两列中,即输出的结果有一行,一行包括两列,每列是一个统计值。

step 1 创建一个转换:文件-新建-转换,保存转换:文件-保存,保存文件名为aggregate_count .ktr
 
 

step 1 生成100个随机数:展开“输入”,选择“生成随机数”,将其拖到面板中,双击“生成随机数”图标进行编辑,
名称:random
类型:随机整数 
 
 
 这样只能生成1个随机数(0~1),右键选择“改变开始选择的数量”,修改值为100
 
 step 2 增加常量:展开“转换”,选择“增加常量”,将其拖到面板上,双击它,添加2个常量值,
c1:50
c2:100
 
 

step 3 增加计算器:用于生成1到100的整数,用c3表示。
 
 step 4 过滤记录:判断条件是c3不大于50,为true则记录数据流入分组1,为false流入分组2.
 
 

step 5 分组统计:展开“统计“,选择”分组“,增加2个分组,分组1和分组2
 
 
 
step 6 记录关联 (笛卡尔输出):
 
 step 7 文本输出:
 
 step8 :运行,查看数据
 
 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多