ubuntu14.04的hadoop环境搭建（全分布模式） - 臻是二哥 - ITeye博客

`

臻是二哥

浏览: 183431 次
性别:
来自: 杭州

最近访客更多访客>>

youcp999

木心缺页

overloving

longlongkong

博主相关

博客

微博

相册

收藏

留言

关于我

博客专栏

: Java技术分享
浏览量：0

文章分类

社区版块

存档分类

最新评论

masuweng：学习了,学习了
mybatis是如何防止SQL注入的
somefuture：终于知道了#$的区别
mybatis是如何防止SQL注入的
masuweng： ...
tomct处理请求的流程
zhp8341： masuweng 写道寻求cas的更多例子, http://w ...
JUC之CAS
臻是二哥： java.util.concurrent包中到处都使用了CAS ...
JUC之CAS

ubuntu14.04的hadoop环境搭建（全分布模式）

博客分类：

Hadoop

阅读更多

hadoop0.20.2软件下载http://pan.baidu.com/s/1kTurQJH

jdk7u71-linux-i586下载http://pan.baidu.com/s/1pJyT1OZ

在搭建集群之前需要作如下准备工作，（博文使用hadoop0.20.203.0作为例子讲解，推荐使用hadoop0.20.2更加稳定，两者配置过程相同）
1 配置好静态IP,并且在所有的机器上建立相同的用户名和密码，这里我的用户名是xuyizhen

参见我的博客http://2710067471.iteye.com/blog/2118385
2 保证所有的系统都安装了ssh,同时所有的节点之间已经实现了无密码登陆

参见我的博客http://2710067471.iteye.com/blog/2145182
3 保证所有的系统都安装了JDK,应该是1.6以上版本

参见我的博客http://2710067471.iteye.com/blog/2144835

接下来进行hadoop配置：
1 在所有机器上，进入他们的 /etc/hosts 目录，添加所有节点的IP以及名字

我的集群共有三台电脑，因此我的配置如下：

注意，每个电脑的IP和名字占一行
2 在master电脑上，解压位于/home/xuyizhen目录下的hadoop压缩包tar -zxvf hadoop-0.20.203.0.orc1.tar.gz

重命名为hadoop

进入到/home/xuyizhen/hadoop/conf文件夹下：

修改Hadoop核心配置文件core-site.xml，这里配置的是HDFS的地址和端口号。

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/xuyizhen/hadoop/tmp</value>

（备注：请先在 /home/xuyizhen/hadoop目录下建立 tmp 文件夹）

</property>

<property>

<name>fs.default.name</name>

<value>hdfs://192.168.0.21:9000</value>

</property>

</configuration>

　　备注：如没有配置hadoop.tmp.dir参数，此时系统默认的临时目录为：/tmp/hadoo-hadoop。而这个目录在每次重启后都会被干掉，必须重新执行format才行，否则会出错。

配置hdfs-site.xml文件 ,修改Hadoop中HDFS的配置，配置的备份方式默认为3。

<configuration>

<property>

<name>dfs.replication</name>

<value>2</value>

(备注：replication 是数据副本数量，默认为3，salve少于3台就会报错)

</property>

</configuration>

配置mapred-site.xml文件 ,修改Hadoop中MapReduce的配置文件，配置的是JobTracker的地址和端口。

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>http://192.168.0.21:9001</value>

</property>

</configuration>

上面的三个文件修改完毕后保存退出。

接着修改/home/xuyizhen/hadoop/conf/masters文件

添加内容

master(每个名字占一行)

接着修改/home/xuyizhen/hadoop/conf/slaves文件

添加内容

slave1

slave2
保存后退出。(每个名字占一行)

4将/home/xuyizhen/hadoop文件夹复制到其他机器的/home/xuyizhen文件夹下

scp -r /home/xuyizhen/hadoop 192.168.0.22:/home/xuyizhen

scp -r /home/xuyizhen/hadoop 192.168.0.23:/home/xuyizhen

5最后，打开每个机器的/home/xuyizhen/hadoop/conf/hadoop-env.sh文件

在末尾添加当前机器的JAVA_HOME
export JAVA_HOME=/usr/java/jdk1.7.0_71

6 打开xuyizhen用户的.bashrc文件，添加hadoop的环境变量

6至此，Hadoop已经部署完毕,重启所有机器

如果要添加或则删除节点，仅仅需要修改NameNode的Masters和Slaves即可。
7现在，在namenode节点上执行命令：
hadoop namenode -format
start-all.sh

8好了，hadoop已经跑起来了。
在所有机器节点上执行jps命令
master节点显示：（进程号允许不同）

Slave1节点应该显示：

Slave2节点显示：

如上结果，hadoop已经成功安装。

下面进行测试：

在/home/xuyizhen目录下建立文件夹input

mkdir input

进入该文件夹

cd /home/xuyizhen/input

并写入两个文件

echo “hello world” >> 1.txt

echo “hello count” >> 2.txt

将input文件夹导入dfs中

hadoop dfs -put input in

运行wordcount程序

hadoop jar hadoop-examples-0.20.203.0.jar wordcount in out

查看统计结果

Hadoop dfs -cat out/*

注意：可能出现 INFO ipc.Client: Retrying connect to server: /192.168.0.21:9000. Already tried 4 times错误

这是由于/etc/hosts中的内容有误

将其中第二行的master删除后重新运行（注意每个节点都有/etc/hosts）

查看图片附件

2
顶

0
踩

分享到：

Win7上的Eclipse3.3远程连接ubuntu14.04中 ... | ubuntu实现无密码登陆

2014-10-20 10:53
浏览 1575
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Ubuntu 14.04 交叉编译环境的搭建: Ubuntu 14.04 交叉编译环境的搭建，嵌入式开发环境的搭建。

Ubuntu14.04 Hadoop完全分布式安装手册: Hadoop安装

基于Ubuntu14.04嵌入式开发环境搭建: 基于Ubuntu14.04嵌入式开发环境搭建，描述非常详细，值得参考

Ubuntu 14.04 QT开发环境搭建: Ubuntu 14.04 QT开发环境搭建 (一)

Ubuntu14.04开发环境搭建文档.pdf: 虚拟机安装Ubuntu14.04教程,

ubuntu 14.04 搭建利用虚拟机搭建测试环境教程: ubuntu 14.04 搭建利用虚拟机搭建测试环境教程

基于Ubuntu的Hadoop简易集群安装与配置: 基于Ubuntu的Hadoop简易集群安装与配置，三台运行于Vmware中的ubuntu14.04系统搭建成简易Hadoop分布式集群，用于之后的大数据学习

mysql-ubuntu14.04系统版: mysql-ubuntu14.04系统版

ubuntu14.04-百度网盘分享下载: 复制文件内百度网盘分享地址ubuntu-14.04-desktop-amd64.iso

Ubuntu14.04升级GCC4.9.3: Ubuntu14.04升级GCC4.9.3步骤，基于Linuxmint17、Ubuntu14.04亲测。

vscode_for_ubuntu14.04.zip: Ubuntu 14.04系统下能用的vscode客户端（新版本在启动时无响应，且无法打开终端），版本号：code_1.42.1-1581432938_amd64.deb 使用方法：解压后执行sudo dpkg -i code*

ubuntu14.04 source.list: ubuntu14.04 source.list

ubuntu14.04 默认root登陆: 安装了ubuntu14.04，必须使用root,所以使用了root登陆

Ubuntu14.04离线安装ssh所需安装包deb: sudo dpkg -i openssh-client_6.6p1-2ubuntu1_amd64.deb sudo dpkg -i openssh-sftp-server_6.6p1-2ubuntu1_amd64.deb sudo dpkg -i libck-connector0_0.4.5-3.1ubuntu2_amd64.deb sudo dpkg -i openssh-server_6.6...

ubuntu 14.04 配置常用服务器环境: 文档是在 Ubuntu 14.04.2 LTS 上，配置运行以下四个常用软件 jdk-8u5-linux-x64.tar.gz apache-tomcat-7.0.54.tar.gz mysql-5.6.10-linux-glibc2.5-x86_64.tar.gz jboss-4.2.3.GAcha 也配置了软件随系统开启自动...

ubuntu14.04安装gitlab.pdf: ubuntu14.04安装gitlab.pdf

ubuntu14.04 Docker离线安装包: ubuntu14.04 Docker离线安装包

Ubuntu14.04离线安装NFS方法和安装包: Ubuntu14.04离线安装NFS方法,这里面是需要的安装包，还有安装的手册，注意这个是Ubuntu14.04的安装包。

Ubuntu 14.04和Qt Creator5.7开发环境搭建: Ubuntu 14.04和Qt Creator5.7开发环境搭建

ubuntu14.04 caffe环境的配置: 本人学习深度学习所配置的环境，包括英伟达驱动的安装，如果安装之后进不了桌面，处于循环登录状态，请按照里面文档说明操作。还有cuda的配置，caffe的配置。因为文件大小限制，英伟达与cuda8.0请自行下载。

Global site tag (gtag.js) - Google Analytics