Hadoop安装部署

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 1657 次

锁定老帖子主题：Hadoop安装部署精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
私塾ok 等级: 初级会员文章: 3 积分: 50	发表时间：2014-01-10 相关推荐: Hadoop安装部署及教学 Hadoop 安装部署 Linux学习笔记——Hadoop安装部署 hadoop安装部署 Hadoop安装部署实验材料更多相关推荐本节课程概览 Hadoop 在windows 上伪分布式的安装过程 Hadoop 在linux 上单节点伪分布式的安装过程集成Eclipse 开发环境 Hadoop UI 介绍运行WordCounter 事例第一部分：Hadoop 在windows 上伪分布式的安装过程安装JDK 1.下载JDK http://www.oracle.com/technetwork/java/javaee/downloads/java-ee-sdk-6u3-jdk-6u29-downloads-523388.html 2.解压或者直接运行.exe安装后面根据项目的实际需要来进行调整。安装 Cygwin 1.下载Cygwin 网址： http://www.cygwin.com/setup.exe 2.安装Cygwin 1. Net Category 下的OpenSSL 2. Base Category 下的sed 3.Editors Category 下的vim 4.Devel Category 下subversion 后面根据项目的实际需要来进行调整。配置环境变量 1.配置JAVA 环境变量 PATH 和JAVA_HOME： JAVA_HOME 指向JDK安装目录； PATH 指向JDK的bin 启动 SSHD 服务 1.安装SSHD ssh-host-config 2. 启动SSHD net start sshd ssh 的安装和配置实现ssh无密码登陆 $ssh-keygen -t rsa 直接回车，完成后会在~/.ssh/生成两个文件：id_dsa 和id_dsa.pub。这两个是成对出现，类似钥匙和锁。再把id_dsa.pub 追加到授权key 里面(当前并没有authorized_keys $cat~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys完成后可以实现无密码登录本机安装 Hadoop 1.下载Hadoop http://labs.mop.com/apache-mirror/hadoop/common/hadoop-1.0.0/ 2.解压Hadoop tar xzvf hadoop-0.21.0.tar.gz 配置 Hadoop 1. 配置hadoop-env.sh 2 .配置conf/core-site.xml、conf/hdfs-site.xml、conf/mapred-site.xml文件概念 HDFS: NameNode ：管理节点 DataNode ：数据节点 SecondaryNamenode : 数据源信息备份整理节点 MapReduce JobTracker ：任务管理节点 Tasktracker ：任务运行节点配置文件 core-site.xml common属性配置 hdfs-site.xml HDFS属性配置 mapred-site.xml MapReduce属性配置 hadoop-env.sh hadooop 环境变量配置修改 hadoop-env.sh 配置JDK即可 export JAVA_HOME=/cygdrive/d/java/jdk1.6.0_25 core-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>fs.default.name</name> 4. <value>hdfs://localhost:9000</value> 5. </property> 6. <property> 7. <name>hadoop.tmp.dir</name> 8. <value>/hadoop</value> 9. </property> 10. </configuration> hdfs-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>dfs.replication</name> 4. <value>1</value> 5. </property> 6. </configuration> mapred-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>mapred.job.tracker</name> 4. <value>localhost:9001</value> 5. </property> 6. </configuration> 启动 Hadoop 1.格式化文件系统 hadoop namenode –format 2. 启动hadoop 启动所有任务start-all.sh/stop-all.sh 启动关闭HDFS: start-dfs.sh/stop-dfs.sh 启动关闭MapReduce: start-mapred.sh/stop-mapred.sh 3. 用jps命令查看进程,确保有 namenode,dataNode,JobTracker,TaskTracker 第二部分：Hadoop 在linux 上单节点伪分布式的安装过程安装 JDK $chmod +x jdk-6u27-linux-i586.bin $./jdk-6u27-linux-i586.bin 安装完后设置java 环境变量如下命令：/home路径下 $vi .bashrc 然后添加如下语句 export JAVA_HOME=/home/test/ jdk1.6.0_27 export PATH =/bin:$JAVA_HOME/bin:/usr/bin:$PATH:. 然后. .bashrc使其生效 ssh 的安装和配置 $实现ssh无密码登陆 $sudo apt-get install ssh $ssh-keygen 直接回车，完成后会在~/.ssh/生成两个文件：id_dsa 和id_dsa.pub。这两个是成对出现，类似钥匙和锁。再把id_dsa.pub 追加到授权key 里面(当前并没有authorized_keys $cat~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys完成后可以实现无密码登录本机 Hadoop 安装 1.下载Hadoop http://labs.mop.com/apache-mirror/hadoop/common/hadoop-1.0.0/ 2.解压Hadoop tar xzvf hadoop-0.21.0.tar.gz 3. 添加Hadoop Bin到环境变量中修改 hadoop-env.sh 配置JDK即可 export JAVA_HOME=/cygdrive/d/java/jdk1.6.0_25 conf/core-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>fs.default.name</name> 4. <value>hdfs://localhost:9000</value> 5. </property> 6. <property> 7. <name>hadoop.tmp.dir</name> 8. <value>/hadoop</value> 9. </property> 10. </configuration> conf/hdfs-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>dfs.replication</name> 4. <value>1</value> 5. </property> 6. </configuration> conf/mapred-site.xml java代码：查看复制到剪贴板打印 1. <configuration> 2. <property> 3. <name>mapred.job.tracker</name> 4. <value>localhost:9001</value> 5. </property> 6. </configuration> 启动 Hadoop 1.格式化文件系统 hadoop namenode –format 2. 启动hadoop 启动关闭所有服务 start-all.sh/stop-all.sh 启动关闭HDFS: start-dfs.sh/stop-dfs.sh 启动关闭MapReduce: start-mapred.sh/stop-mapred.sh 3. 用jps命令查看进程,确保有 namenode,dataNode,JobTracker,TaskTracker 第三部分：Hadoop UI 介绍 Hadoop 重要的端口 1.Job Tracker 管理界面：50030 2.HDFS 管理界面：50070 3.HDFS通信端口：9000 4.MapReduce通信端口：9001 常用访问页面 1. HDFS 界面 http://hostname:50070 2. MapReduce 管理界面 http://hostname:50030 第四部分：运行Word Count 示例相关步骤及命令 1.先在本地磁盘上建立两个文件file1和file2 $ echo ”Hello world Bye world" > >~/input/file1 $ echo ”hello hadoop bye hadoop” > >~/input/file2 2.在HDFS上建立一个input目录 $ hadoop fs -mkdir /tmp/input 3.将file1和file2拷贝到hdfs的input目录下 $ hadoop fs -put input/* /tmp/input 4.检查hdfs上有没有file1,file2 $ hadoop fs -ls /tmp/input 5.执行wordcount hadoop jar hadoop-examples-1.0.0.jar wordcount /tmp/input /tmp/output 6.运行完成，查看结果 hadoop fs -cat /output/part-r-00000 第五部分：集成 Eclipse 开发环境通过 Eclipse 编写 Hadoop 程序 1.导入hadoop-core.jar及hadoop/lib下所有Jar包 2.加入Hadoop配置文件，包括conf/core-site.xml、conf/hdfs-site.xml、conf/mapred-site.xml,并修改相应参数。本节课程小结掌握了在Windows ,Linux(ubuntu)上安装Hadoop 单节点伪分布式安装初次体验了Hadoop运行的WordCounter程序了解了Hadoop UI 掌握了Hadoop 集成到 Eclipse的情况私塾在线原创声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

工作在无锡等级: 初级会员性别: 文章: 89 积分: 50 来自: 无锡	发表时间：2014-01-16 单节点都这样去写的，钥匙有截图就更好了，不过写的还是蛮清晰的。目前我也在研究，不过，我安装好了之后，lib下面只有一个native目录,里面也是不是jar阿。只能自己去下所有的 hadoop jar包了
返回顶楼	回帖地址 0 0 请登录后投票

工作在无锡等级: 初级会员性别: 文章: 89 积分: 50 来自: 无锡	发表时间：2014-01-16 对了，楼主，工作几年了，hadoop 是刚开始研究吗？我们可以一起研究阿，我今年是第6年，可以一起研究，我QQ 309912052
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 综合技术版

跳转论坛: