单节点伪分布式hadoop的安装与配置
安装需要两个先决条件,java版本1.6以上和ssh登录本机不需要输入密码,不同版本的hadoop安装方法不同,注意要通过apache网站的匹配安装说明进行安装
1,安装java
Install java
rpm -ivh jdk-7u7-linux-x64.rpm
[root@linux2 ~]# rm /usr/bin/java
rm: remove symbolic link `/usr/bin/java'? y
[root@linux2 ~]# ln -s /usr/java/jdk1.7.0_07/bin/java /usr/bin/java
[root@linux2 ~]# java -version
java version "1.7.0_07"
Java(TM) SE Runtime Environment (build 1.7.0_07-b10)
Java HotSpot(TM) 64-Bit Server VM (build 23.3-b01, mixed mode)
2,配置ssh互通
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
如果不是root用户,以上方法可能无法成功,需要修改.ssh目录的权限
首先是给.ssh目录赋一个权限
1 chmod 700 /home/hadoop/.ssh
2 chmod 600 authorized_keys
3 chmod 600 id_rsa
具体权限应该如下
-rw------- 1 hadoop hadoop 396 05-16 05:10 authorized_keys
-rw------- 1 hadoop hadoop 1675 05-16 05:10 id_rsa
-rwxrwxrwx 1 hadoop hadoop 396 05-16 05:10 id_rsa.pub
-rwxrwxrwx 1 hadoop hadoop 402 05-16 05:10 known_hosts
.ssh目录权限:
drwx------ 2 hadoop hadoop 4096 05-16 05:10 .ssh
3,安装standlone hadoop,即只有一个进程的模式
网上下载hadoop版本,解压
tar -zxvf hadoop-1.0.4.tar.gz
设置JAVA_HOME
vi conf/hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_07
测试安装是否成功
./bin/hadoop jar hadoop-examples-1.0.4.jar grep input output '[a-z.]+'
cat output/*
./bin/hadoop jar hadoop-examples-1.0.4.jar wordcount input output
4,安装伪分布式架构hadoop
1) 解压缩文件,同上,配置ssh无密码登录
2)修改配置文件
vi conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
vi conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
vi conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
3) 格式化分布式文件系统
bin/hadoop namenode -format
4)启动haddop
bin/start-all.sh
备注:主要启动后要确保如下两个网页正常浏览,且active node为1(如果多次安装注意清理tmp目录下的相关文件)
也可使用浏览器浏览下列网址进行验证
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/
5)生成目录
hadoop fs -mkdir test
hadoop fs -ls test
hadoop fs -put conf test
6)执行
hadoop jar hadoop-examples-1.0.4.jar grep test/conf output 'dfs[a-z.]+'
hadoop fs -ls output
[hadoop@linux1 hadoop-1.0.4]$ hadoop fs -cat /user/hadoop/output/part-00000 | head -13
1 dfs.replication
1 dfs.server.namenode.
1 dfsadmin
实现完成后后者实验不成功,可以删除test
# hadoop fs -rmr test
Deleted hdfs://localhost/user/root/test
参考资料
http://hadoop.apache.org/docs/r1.0.4/single_node_setup.html
http://abloz.com/2012/05/22/10-minutes-from-scratch-to-build-hadoop-environment-and-test-mapreduce.html
http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/
分享到:
相关推荐
Hadoop单节点伪分布式搭建中文版 个人翻译的Hadoop搭建文档,这里只是翻译了伪分布式搭建。 如果是测试、学习hadoop,伪分布式足够了。
Linux Hadoop 伪分布式配置 一个节点,线程模仿分布式
Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop Hadoop 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是在单机上拟 伪分布式模是...
Hadoop的安装分为单机方式、伪分布式方式和完全分布式方式。 a. 单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件...
史上最全 多节点 hadoop 开发环境搭建详解
主要介绍了Hadoop在windows上伪分布式的安装过程、在Linux单节点伪分布式的安装过程、Eclipse开发环境介绍
资源名称:CentOS 6.5 x64下安装19实体节点Hadoop 2.2.0集群配置指南内容简介: CentOS 6.5 x64下安装19实体节点Hadoop 2.2.0集群配置指南主要讲述的是CentOS 6.5 x64下安装19实体节点Hadoop 2.2.0集群配置指南;...
Hadoop分布式集群搭建过程中IP配置,包括单机伪分布式和多台机器集群搭建。同时包括VBox linux虚拟机网卡配置
Hadoop平台搭建(单节点,伪分布,分布式文件系统及其上MapReduce程序测试) 原创,保证质量,辛苦了很多天,故3分!
本文档为初次学习大数据的学生提供单节点配置的简单教程,同时简单介绍了Hadoop的分布式文件系统HDFS的一些简单命令。
在VMware虚拟机上,安装hadoop集群,采用的是伪分布式搭建,从安装jdk到hadoop的环境配置,全套都有,依据这个文档可以在个人Vmware上搭建自己的hadoop集群,这个集群有一个主节点,两个从节点。按照这个文档搭建后...
2.搭建完全分布式模式Hadoop 1.克隆出三台虚拟机 2.分别映射好三台虚拟机的IP与主机名 3.设置三台机器时钟同步 4.设置三台机器两两之间SSH密码登录 5.修改主节点配置文件并远程拷贝到从节点 (2)....
手把手教你搭建 5 节点 Hadoop 分布式集群(HA).pdf
多节点下Hadoop集群安装 参照上一篇:单节点下安装hadoop伪分布式集群 安装完后,讲解安装hadoop集群
Hadoop是一个由Apache基金会所开发的分布式系统基础架构,主要用于解决海量数据的存储和海量数据的分析计算问题。其核心组件包括HDFS(Hadoop分布式文件系统,用于存储)、MapReduce(分布式离线计算框架)和YARN...
Hadoop集群分布式:本教程的操作环境是centos,使用两个节点作为集群环境: 一个作为 Master 主节点,另一个作为 Slave1 从节点;对Hadoop的完全分布式安装配置进行了详细的操作流程,以及相关注意事项。
hadoop分布式环境搭建的完整详细的实验报告,基于Hadoop的伪分布式安装,3个节点的分布式集群的安装和配置说明。很详细,值得借鉴
手把手教你搭建分布式Hadoop家族集群视频教程(视频+讲义+笔记+配置),内容包括 Hadoop,SQOOP,Hive,Hbase的安装配置及集群搭建。内容包括但不限于: 01_回顾集群架构及配置集群时间同步 02_配置主节点与从节点...
高清版,在 win7 系统上,利用虚拟工具 VMware 建立若干个 Linux 系统,每个系统为一个节点, 构建 Hadoop 集群。
hadoop 2.4.1完全分布式安装,主要建立5个节点的hadoop集群安装,采用apache原生态的hadoop