在centos6.3 安装hadoop hbase zookeeper -

无尘道长

浏览: 157871 次
性别:
来自: 北京

最近访客更多访客>>

starriver

ssydxa219

malinfei

zjxlt

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

在centos6.3 安装hadoop hbase zookeeper

博客分类：

hadoop

hadoop hbase zk 大数据

一、环境准备
1、安装centos系统时为hadoop指定专用用户：hadoop
2、如果sudo命令有问题则可以先配置sudo，以便后续安装运维方便，如下步骤修改：
    1)、切换到root权限：su root（如果已经是则不用切换）
    2)、修改sudoers文件，添加hadoop用户的权限：vi /etc/sudoers，在“root ALL=(ALL) ALL”这一行后面添加一行：“hadoop ALL=(ALL) ALL”。
3、修改hosts：vi /etc/hosts，配置master和slave的ip与域名，例如：
192.168.22.129 master
192.168.22.130 slave1
192.168.22.131 slave2
4、修改系统的域名：vi /etc/sysconfig/network，把HOSTNAME修改为新的主机名称(主机为master，从机为slave(1..n))，修改完后重新启动服务器，启动后重新连接linux远程终端，重新进入则可在执行命令处看到变化：[root@localhost]# 变为：[root@master]#

二、安装jdk
1、下载jdk的rpm安装包，执行如下命令：
rpm –ivh jdk---.rpm
安装完成后，执行java –version，查看是否安装成功。
2、配置环境变量：vi /etc/profile，添加如下内容：
export JAVA_HOME=/usr/java/jdk1.7.0_25
export PATH=$PATH:$JAVA_HOME/bin
添加完成后，执行source /etc/profile
注：环境变量可以在hadoop、hbase、zookeeper均安装完成后，再统一设置，如此可简化工作

三、配置ssh
需配置ssh实现master、slave机之间的相互免密码登录。
1、如果不是hadoop用户，需要切换到hadoop用户；
2、如果centos没有安装ssh，则需先安装
3、在所有的服务器执行如下命令，生成密钥对
ssh-keygen -q -t rsa -N ""
4、复制所有的slave服务器的公钥到master的.ssh目录下
[hadoop@slave1 ~]$ scp ~/.ssh/id_rsa.pub hadoop@master:~/.ssh/slave1.pub
[hadoop@slave2 ~]$ scp ~/.ssh/id_rsa.pub hadoop@master:~/.ssh/slave2.pub
5、在master服务器把所有服务器的公钥加入到用于认证的公钥文件：
[hadoop@master ~]$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[hadoop@master ~]cat ~/.ssh/slave1.pub >> ~/.ssh/authorized_keys
[hadoop@master ~]cat ~/.ssh/slave2.pub >> ~/.ssh/authorized_keys
6、对authorized_keys 进行授权：
[hadoop@master ~]chmod 600 ~/.ssh/authorized_keys
7、复制master的authorized_keys到所有的slave服务器:
[hadoop@master ~]scp ~/.ssh/authorized_keys hadoop@slave1:~/.ssh/authorized_keys
[hadoop@master ~]scp ~/.ssh/authorized_keys hadoop@slave2:~/.ssh/authorized_keys
注：.ssh文件是隐藏文件，在~/下看不见，但是可以通过cd进入
至此免密码登录本机的配置已经配置好
8、验证ssh是否安装成功：
在master、slave之间以及slave之间进行相互的ssh登录，如果不需要输入密码则成功：
例如：[hadoop@master ~]ssh slave1，执行后不需要密码及可以登录slave1

四、安装hadoop
解压hadoop压缩包：sudo tar xzf hadoop-x.y.z.tar.gz
更改用户和用户组：sudo chown -R hadoop:hadoop hadoop-x.y.z
配置hadoop：
1. 修改$HADOOP_HOME/conf/hadoop-evn.sh，取消JAVA_HOME的注释并配置正确的信息，如：
export JAVA_HOME=/usr/java/jdk1.7.0_25
2. 配置$HADOOP_HOME/conf/core-site.xml添加如下内容：
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/data</value>
</property>
3. 配置$HADOOP_HOME/conf/hdfs-site.xml添加如下内容：
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
4. 配置$HADOOP_HOME/conf/mapred-site.xml添加如下内容：
<property>
<name>mapred.job.tracker</name>
<value>master:9001</value>
</property>
5. 配置$HADOOP_HOME/conf/masters添加如下内容：
master
6. 配置$HADOOP_HOME/conf/slaves添加如下内容：
slave1
slave2
7. 通过scp命令把在master服务器上配置好的hadoop目录copy到所有的slave服务器上，保持目录相同
如果slave的jdk安装目录有不同的，需要单独修改$HADOOP_HOME/conf/hadoop-evn.sh配置文件
8. 配置master和所有的slave服务器的环境变量：sudo vi /etc/profile在profile中加入：
export HADOOP_HOME=/home/hadoop/software/hadoop-1.2.1
export PATH=$PATH:$HADOOP_HOME/bin
添加完成后，执行source /etc/profile命令
注：环境变量可以在hadoop、hbase、zookeeper均安装完成后，再统一设置，如此可简化工作
9. 格式化namenode
hadoop namenode –format
10. 关闭所有服务器的防火墙（否则可能因为端口不可访问而导致启动失败）
重启后永久性生效：chkconfig iptables off
即时生效，重启后失效：service iptables stop
11. 安装成功，通过命令start-all.sh启动hadoop集群

五、安装hbase
安装前提：
 Java已经安装；
 Hadoop已经正确安装，并可以启动hdfs；
 必须安装ssh，并且已经实现服务器建的免密码登陆；
 集群的时钟基本一致，如果时间相差比较大，则会导致安装失败；
解压hbase-0.94.12.tar.gz并且配置hbase
1. 配置hbase-env.sh：
export JAVA_HOME=/usr/java/jdk1.7.0_25
export HBASE_MANAGES_ZK=false：false，使用独立的zookeeper
2. 配置hbase-site.xml:
<configuration>
        <property>
                <name>hbase.master</name>
                <value>hdfs://master:60000</value>
        </property>
        <property>
                <name>hbase.rootdir</name>
                <value>hdfs://master:9000/hbase</value>
        </property>
        <property>
                <name>hbase.cluster.distributed</name>
                <value>true</value>
        </property>
        <property>
<name>hbase.zookeeper.quorum</name>                <value>master,slave1,slave2</value>
        </property>
</configuration>
3. 配置regionservers，添加hbase的region服务器域名：
slave1
slave2
4. 通过scp命令copy hbase的目录到其他服务器
5. 配置所有服务器的环境变量：vi /etc/profile，添加如下内容：
export HBASE_HOME=/home/hadoop/software/hbase-0.94.12
export PATH=$PATH:$HBASE_HOME/bin
执行source /etc/profile命令，使修改生效。
注：环境变量可以在hadoop、hbase、zookeeper均安装完成后，再统一设置，如此可简化工作

六、安装zookeeper
1. 解压zookeeper-3.4.5.tar.gz并且配置：
2. 进入conf目录，把zoo_sample.cfg更名为zoo.cfg
3. 配置zoo.cfg，在文件中添加如下信息：
server.1=master:2888:3888
server.2=slave1:2888:3888
server.3=slave2:2888:3888
4. 通过scp命令把zookeepere的目录copy到其它几台服务器
5. 执行vi /tmp/zookeeper/myid命令在文件myid中保存服务器对应的id，与zoo.cfg中的数字对应，本文的master服务器为1，slave1:2，slave2:3
6. 修改各服务器的环境变量：vi /etc/profile:
export ZOOKEEPER_HOME=/home/hadoop/software/zookeeper-3.4.5
export PATH=$PATH:$ZOOKEEPER_HOME/bin
执行命令source /etc/profile
注：环境变量可以在hadoop、hbase、zookeeper均安装完成后，再统一设置，如此可简化工作

七、启动hadoop、zookeeper、hbase
启动顺序先hadoop，再zookepper，最后hbase，分别的执行命令如下：
start-all.sh
zkServer.sh start
start-hbase.sh
其中zookeeper的启动需要在每台服务器执行，hadoop和hbase只需在master服务器启动，slave集群会自动启动。
停止的顺序与启动向反。
启动完后，在master服务器通过jps命令可以看到如下的进程：
[hadoop@master zookeeper]$ jps
3779 QuorumPeerMain
2917 SecondaryNameNode
2767 NameNode
4053 HMaster
2999 JobTracker
在slave服务器可以看到如下的进程：
[hadoop@slave1 zookeeper-3.4.5]$ jps
3526 HRegionServer
2602 DataNode
2669 TaskTracker
3393 QuorumPeerMain

在master服务器执行hbase shell命令，进入hbase命令模式，执行create 'f1', 'f2'命令创建表f1，再执行list命令查看是否有表f1，如果均符合预期则说明hbase可用：
hbase(main):001:0> list
TABLE
0 row(s) in 4.7660 seconds

hbase(main):002:0> create 'f1', 'f2'
0 row(s) in 1.8420 seconds

hbase(main):003:0> list
TABLE
f1
1 row(s) in 0.1310 seconds
至此完全安装完成。

八、安装及使用等问题解决方案
1. master与slave机无法通信问题
通常是因为防火墙导致的问题，可以关闭防火墙试试。
2. 使用非hadoop用户启动hadoop时导致再用hadoop用户启动失败的问题
例如：如果hadoop集群的用户是非root用户，但是通过root用户启动后，再用hadoop启动，会失败，此时通过如下步骤解决；
 在root用户下执行stop-all.sh命令
 ps -aux|grep java查找是否有hadoop的进程，有则kill
 切换到hadoop用户
 通过chown -R 把$hadoop.tmp.dir指定的data目录的所有文件的拥有者设置为hadoop用户，
因为hdfs在启动时会生成新的fsimage和edits文件，通过root用户启动过后，这两个文件的拥有者变为root用户，再用hadoop用户启动时会没有写权限导致失败
 重启成功
3. 启动hbase后立马停止hbase可能导致无法停止hbase的问题
通过master的日志：Master has completed initialization，当出现了这句话后才可以停止hbase，否则就算通过jps可以看到hbase的进程，但是并不是真正的启动完成，这时停止hbase会导致无法停止，这时可以强制kill hbase的进程，需要注意的是，强制kill后，需要重新启动zookeepper，否则再启动hbase时，master启动不了，因为在zookeeper里还有master的信息，但是实际master已经被kill了。
4. hbase的regionserver依赖hdfs的datanode，因此在配置hbase的regionservers配置文件时，需配置有datanode的服务器，否则会导致hbase经常失败，或者经常无法停止的问题。

分享到：

看懂-ROOT-表和.META.表

2013-10-22 12:17
浏览 3619
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

在centos6.3 安装hadoop hbase zookeeper

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

在centos6.3 安装hadoop hbase zookeeper

评论

发表评论

相关推荐

迁移namenode

hdfs之checkpoint

impala条件查询问题

最近访客更多访客>>