配色: 字号:
hadoop伪分布配置自写
2017-03-29 | 阅:  转:  |  分享 
  
Hadoop入门-单机伪分布式配置

为了配置的的方便建议先提升你的登录用户权限,本配置中凡是要在终端中输入的命令都用红色字体,需注意对应的目录用了色字体标出。

启用超级用户sudopasswdroot(然后输入你的超级用户密码)以后在终端中输入su,再输入该密码就可以用超级用户登录了

提升用户权限命令,在终端中输入sudogedit/etc/passwd

在文件末尾找到你的登录用户:我的是szllong:x:1000:1000:szllong,,,:/home/szllong:/bin/bash将其中的两个1000改为0保存并退出,重启电脑输入你的用户名和密码(我的用户名就是szllong,这里可能会习惯性的直接输入密码需注意)。

由于root登录有助多不变,建议配置完成后,再将你的权限改回来。

接下来就可以正式安装了。

1、安装基础工具

ssh

ubuntu默认并没有安装ssh服务,如果通过ssh链接ubuntu,需要自己手动安装ssh-server。判断是否安装ssh服务,可以通过如下命令进行:sshlocalhost

如上没出现ssh:connecttohostlocalhostport22:Connectionrefused,表示没有还没有安装,可以通过apt安装,共三个,命令如下:

apt-getinstallssh

apt-getinstallopenssh-server??

sudoapt-getinstallrsync

很多介绍里会在前面加入sudo,这是为了要获得root权限,这是可能还要输入你的用户密码,下同



2、安装JDK

下载源码包jdk-7u4-linux-i586.tar.gz

(jdk版本可以根据需要自己下载最新版本,但在接下来环境配置时记得要改为相应版本)将之放到目录:/usr/lib/jvm下

(这里位置目录可以自己定义,JDK环境变量需要对应)进入该目录直接解压:tarzxvfjdk-7u4-linux-x64.tar.gz



3、安装hadoop-1.0.3.tar.gz,到hadoop官网下载hadoop-1.0.3.tar.gz

(此时hadoop-1.0.3.tar.gz是最稳定的版本,可以根据情况选择其他版本)

3.1、将下载包解压到usr目录tarzxvfhadoop-1.0.3.tar.gz

3.2、修改hadoop-env.sh配置

这里有两种配置方法一种是直接通过vi配置,这需要对它有一定的了解,由于我是个新手所以就直接找到该文件,然后对之进行修改(这时用具有root权限的用户登录就有优势了,因为这些配置文件的权限属于root,普通用户是不具有该权限的)



先给出通过vi配置的方法,这是我在网上百度的,没有实验过,但这里的目录名需要与你的先前解压目录相对应(即/usr/lib/jvm/jdk1.7.0_04目录)

viconf/hadoop-env.sh

#找到JAVA_HOME设置:exportJAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

#在文件末尾加以下内容,取消环境变量$HADOOP_HOME过时的警告:exportHADOOP_HOME_WARN_SUPPRESS=1

配置环境变量(集群节点都要配置环境变量)

vi/etc/profile

在文件中末尾加入以下内容:

exportJAVA_HOME=/usr/lib/jvm/jdk1.7.0_04exportPATH=$JAVA_HOME/bin:$PATHexportCLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexportHADOOP_HOME=/hadoop-1.0.3exportPATH=$PATH:$HADOOP_HOME/bin

让环境变量生效

source/etc/profile

主要配置三个文件:core-site.xml、hdfs-site.xml、mapred-site.xml使用高版本的hadoop就要修改为下面的配置:

Java代码§

配置

使用如下的conf/core-site.xml:







fs.default.name

hdfs://localhost:9000





Java代码§

配置

使用如下的conf/hdfs-site.xml:







dfs.replication

1





Java代码§

配置

使用如下的conf/mapred-site.xml:







mapred.job.tracker

localhost:9001















接下来给出直接配置方法,直接配置方法就是直接在你的安装目录中修改该文件,

1.在usr/hadoop1.0.3/conf目录下找到hadoop-env.sh文件后打开,注意因为现在是root用户登录,所以可能会出现一个对话框,这里要选显示而不是执行

找到

#exportJAVA_HOME=/usr/lib/j2sdk1.5-sun

(#表示注释,它之后的句子不被执行,仅起提示作用)

再该句话下加入配置环境语句(注意目录的对应)

exportJAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

在文件末尾加

exportHADOOP_HOME_WARN_SUPPRESS=1

取消环境变量$HADOOP_HOME过时的警告:

2.配置环境变量

在etc目录下找到profile文件,在其末尾加入以下内容(这里同样要注意目录的对应)

exportJAVA_HOME=/usr/lib/jvm/jdk1.7.0_04exportPATH=$JAVA_HOME/bin:$PATHexportCLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexportHADOOP_HOME=/hadoop-1.0.3exportPATH=$PATH:$HADOOP_HOME/bin

由于#可以起到注释作用,你可以在这里加上

#Iaddsomethingtomakejava-jdkactivetimes:2012082422:36

唯一标识

让环境变量生效

在终端中source/etc/profile

3.配置三个文件core-site.xml、hdfs-site.xml、mapred-site.xml

在usr/hadoop1.0.3/conf中找到core-site.xml文件







中加入



fs.default.name

hdfs://localhost:9000



找到hdfs-site.xml文件







中加入



dfs.replication

1



找到mapred-site.xml文件







中加入



mapred.job.tracker

localhost:9001





4.在终端中输入sshlocalhost如果需要输入密码则输入密码后运行以下两条命令,

ssh-keygen-tdsa-P''''-f~/.ssh/id_dsa?cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys

这是为了,配置自由登录hadoop的密码,第一句是产生,第二句是分发



5.用cd命令进入usr/hadoop1.0.3中输入bin/hadoopnamenode-format进行格式化

6.?输入bin/start-all.sh启动hadoop

7.在浏览器中输入?http://localhost:50070/,如显示的有磁盘容量表示已经配置成功。

注意因定要进入hadoop安装目录后再运行bin...命令,否则会出现找不到文件或文件夹

献花(0)
+1
(本文系关平个人图...首藏)