分享

Hadoop平台架构

 陈永正的图书馆 2017-07-03
  Master: CPU:16CPU*4核 ;内存:128G-512G; HA 需要两台Namenode,配置一致! Slave: CPU:8CPU*4核-16CPU*4核;内存:16G-24G128G-256G;配置最好一致,如果不一致,资源分配需要着重考虑! LinuxOS: redhat 6.3 or CentOS 6.6,NameNode节点存储区做RAID1!Datanode节点磁盘JBOD安装,无RAID。Linux系统盘做RAID1 硬件配置如果存在一定的差异需要考虑资源利用率问题!特别注意有单点的问题的统一放到一台主机! 集中式Master,将SPOF单点集中到一起:Namenode HA,HMaster HA,Spark Master,JobTracker/ResourceManager HA ,Hive Metastore,HiveServer2,Impala StateStore,Catalog Server,impala-LLAMA HA,Oozie,Sentry,Hue Slave,例如:Impalad,TaskTracker/Nodemanager,RegionServer,spark worker 计算资源统一交给yarn分配,所有的作业分组,按部门,不同的作业类型,划分不同 的资源池,每个部门和作业类型分组,放入不同的资源池处理.有关资源分配内容, 请参考《Yarn资源分配性能调优》,Map slot,Reduce slot这些值怎么来的,Yarn的资源池 ,Hadoop-2.6新功能,Hadoop YARN新特性—label based scheduling,基于标签的调度策略! 怎么优化来提升性能,怎么合理利用资源!请参考更多相关文章! 如果你对初建Hadoop集群前期硬件配置,版本选择等还有疑问欢迎讨论!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多