解决方案: 一、简介 CDH是cloudera公司开发的一个快速部署、高效管理Hadoop和其各种组件的一个商业化产品。主要分为两部分,分别为Cloudera Manager和CDH软件包。其中Cloudera Manager负责集群的部署与管理。CDH软件包囊括了hdaoop各类的组件的安装包,例如hive、hdfs、Spark等等。 由于实验室服务器集群实现了硬件虚拟化,要在虚拟资源重新搭建CDH集群。cloudera的搭建官方提供了三种安装方式。分别是在线安装、yum安装和离线安装,我首先是采用离线安装的方式,这种方式也是目前大部分博客教程所采用的方式。但是照着这种方式我每次到最后安装服务的时候总是在部署配置文件的时候出错,提示错误如图所示: ![]() 猜测原因是权限问题,但是在网上寻找办法也一直没有解决。这里吐槽一下cloudera官方社区,没有几个人。因此舍弃到这种安装方式采用在线安装,但是在线安装需要耗费大量时间在软件包的下载上,不过我们可以手动下载安装,这样可以大大提高安装速度。 二、基础环境 软件环境 [Bash shell] 纯文本查看 复制代码
硬件环境 9台虚拟机节点,硬件配置如下: ![]() 三、基础配置 以下所有操作均在root下进行 1.host配置 1)修改主机名 [Bash shell] 纯文本查看 复制代码
2)添加hostname与ip的对应关系如下图所示: ![]() 3)将host从主节点master分发到各个从节点。: 2.关闭防火墙和selinux 1)关闭防火墙(每个节点) 2)关闭selinux(重启生效) ![]() 3.ssh无密码登录 1)各个节点安装ssh 2)将公钥加入到authorized_keys(只需master操作) 3) 修改权限 4)将authorized_keys从master分发到各个slave 4.jdk安装 1)卸载自带java 2)安装jdk(每个节点rpm安装) 3)配置java环境(每个节点配置,当然可以一个节点配置完了使用scp分发) 在/etc/profile中加入: [Bash shell] 纯文本查看 复制代码
4)使配置生效(每个节点) 5.ntp时间同步 1)安装NTP(每个节点) 2)配置NTP master配置:(选用复旦大学ntp服务器) ![]() slave配置:(同步master) ![]() 3)开启NTP服务 4)查看同步效果 命令:ntpstat ![]() 四、Cloudera Manager安装 1.下载rpm安装包 rpm安装包下载地址:其中jdk如果自己安装好了可以不用下载。 http://archive./cm5/redhat/6/x86_64/cm/5.7/RPMS/x86_64/ 包含软件: ![]() 2.master节点安装 将下载好的rpm包放到一个文件夹中,任意命名,进入到这个文件夹手动安装: yum localinstall --nogpgcheck *.rpm 使用yum安装会同时安装相关的依赖,非常方便 如果要卸载使用 yum --setopt=tsflags=noscripts remove xxxx 3.slave节点安装 slave中不需要安装server的包,只需要安装cloudera-manager-agent.rpm和cloudera-manager-daemons.rpm。先将两个rpm包拷贝到slave节点上,剩下安装方法和master一样。 4.安装cloduera manager二进制安装包 [Bash shell] 纯文本查看 复制代码
4)根据安装向导一路next。注意,如果之前master上没有手动安装rpm包此时就会联网下载,下载速度一般都较慢,太费时间。 5)安装结束以后会提示登录7180端口。 五、CDH服务安装 1.制作本地parcel 1)下载CDH软件包,下载地址: http://archive./cdh5/parcels/5.6/ 下载对应版本的CDH:下载图中标红的三个资源(el6代表centos6) ![]() 之前完成CM安装之后master节点会在/opt目录下生成cloudera文件夹,将刚才下载的三个文件移动到parcel-repo文件夹中并将 CDH-5.6.0-1.cdh5.6.0.p0.45-el6.parcel.sha1更名为 CDH-5.6.0-1.cdh5.6.0.p0.45-el6.parcel.sha如不更名会在线重新下载。 2.配置软件 1)登录7180端口:http://master:7180 ![]() 初始用户名与密码均为admin 2)同意协议一路continue ![]() 输入集群中各个主机名或者ip,可以用空格分隔,点击search,然后continue 3)选择parcel版本,由于我们下载的是CDH5.6,所以选择CDH5.6。这里可能没有CDH5.6的选项,这是由于我们是在cloudera-server开启之后才将CDH5.6的三个文件放入parcel-repo文件夹中,重启一下cloudera-scm-server就行了: /etc/init.d/cloudera-scm-server restart 4)安装jdk,我们之前已经在每个节点都安装了jdk,所以这步可以跳过。 5)设置ssh登录,选择全部主机使用统一ssh密码,输入密码点击continue。 6)安装cloudera-manager-agent相关软件。由于我们之前在每个节点手动安装了相应的rpm包,所以这里很快就会完成。如果之前各个节点没有手动安装,这一步会在线下载rpm包,速度非常慢,并且如果错误还会中断。强烈建议不要使用在线下载。 大概十分钟左右安装完成(这里只有7个节点,第一次安装的时候我只安装了7个节点,剩下两个节点是后来添加到集群中的),然后继续Continue。 ![]() 7)主机检测: ![]() 会提示错误,解决办法 [Bash shell] 纯文本查看 复制代码
重启永久生效: 编辑vim /etc/sysctl.conf ![]() 编辑vim /etc/rc.local ![]() 8)安装parcel包 接下来CM安装parcel包,图中提示host is in bad health,这个可以忽略,多等一会就会恢复正常。 ![]() 9)安装服务 如没有特殊需求可以默认 ![]() 10)一路continue完成安装 http://www./forum.PHPmod=viewthread&tid=18107 |
|
来自: 进门交钱 > 《Tensorflow》