Hadoop 本地集成环境搭建 -

风过无声

浏览: 89034 次
性别:
来自: 深圳

最近访客更多访客>>

tian_yu_bing

五音谷

lyh061619

zhongqiangzhou

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop 本地集成环境搭建

博客分类：

Hadoop

1. 相关软件

VMwave6，RedHat5 32bit，JDK6，Hadoop1.2

2. 集成环境搭建步骤

2.1 安装虚拟机

安装过程出现错误：

setup has detected vmware software running on this machine

解决方式：

打开TASK管理器，终止进程里VM相关的进程

出处：

http://zhidao.baidu.com/question/206989601.html?fr=qrl&cid=89&index=1

虚拟机配置：

网络：NAT

硬盘：30G

内存：512M

2.2 安装RedHat系统

关闭防火墙，创建用户hadoop，配置固定IP 192.168.153.128，在/etc/hosts中加入下列内容

192.168.153.1 host
192.168.153.128 master
192.168.153.129 node0
192.168.153.130 node1

2.3 安装JDK6和Hadoop1.2到/usr/local目录下

配置环境变量，在/etc/profile中加入下列内容，执行source profile

#set JDK evn
JAVA_HOME=/usr/local/jdk1.6.0_25
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOME PATH CLASSPATH

#set Hadoop evn
HADOOP_HOME=/usr/local/hadoop-1.2.1
PATH=$PATH:$HADOOP_HOME/bin

export PATH

2.4 配置Hadoop（$Hadoop/conf/）

hadoop-env.sh

export JAVA_HOME=/usr/local/jdk1.6.0_25

masters

node0

slaves

node0
node1

core-site.xml

<configuration>
	<property>
	  <name>fs.default.name</name>
	  <value>hdfs://master:8280</value>
	  <final>true</final>
	</property>
</configuration>

hdfs-site.xml

<configuration>
	<property>
	  <name>dfs.name.dir</name>
	  <value>/home/hadoop/hdfs/name</value>
	  <final>true</final>
	</property>
	<property>
	  <name>dfs.data.dir</name>
	  <value>/home/hadoop/hdfs/data</value>
	  <final>true</final>
	</property>
	<property>
	  <name>dfs.checkpoint.dir</name>
	  <value>/home/hadoop/hdfs/checkpoint</value>
	  <final>true</final>
	</property>
	<property>
	  <name>dfs.permissions</name>
	  <value>false</value>
  </property>
  <property>
	  <name>dfs.replication</name>
	  <value>2</value>
  </property>
  <property>
  	  <name>dfs.http.address</name>
  	  <value>master:50070</value>
  </property>
  <property>
	  <name>dfs.secondary.http.address</name>
	  <value>node0:50090</value>
  </property>
</configuration>

mapred-site.xml

<configuration>
	<property>
	  <name>mapred.job.tracker</name>
	  <value>master:8021</value>
	</property>
	
	<property>
	  <name>mapred.local.dir</name>
	  <value>/home/hadoop/mapred/local</value>
	</property>
  	
	<property>
	  <name>mapred.system.dir</name>
	  <value>/home/hadoop/mapred/system</value>
	</property>
	
	<property>
		<name>mapred.child.java.opts</name>
	  <value>-Xmx200m</value>
	</property>
	
	<property>
	  <name>mapred.tasktracker.map.tasks.maximum</name>
	  <value>2</value>
	</property>
  
  <property>
	  <name>mapred.tasktracker.reduce.tasks.maximum</name>
	  <value>2</value>
	</property>

</configuration>

2.4 克隆两份虚拟机node0，node1，更改网络配置

Linux关机命令

shutdown -h now

2.5 配置SSH免登录

-- 登录master，构建.ssh目录

mkdir .ssh
cd .ssh

-- 构建SSH公匙/私匙对，不输入密码直接按回车

ssh-keygen -t rsa

-- 复制一份公匙

cat id_rsa.pub >> authorized_keys

-- 将公匙传送到slaves中

scp ~/.ssh/authorized_keys hadoop@node0:/home/hadoop/
scp ~/.ssh/authorized_keys hadoop@node1:/home/hadoop/

-- 将slave中的公匙复制到指定位置

mkdir .ssh
cat ~/authorized_keys >> ~/.ssh/authorized_keys
rm authorized_keys

-- 权限设置

chmod 755 ~
chmod 755 ~/.ssh
chmod 644 ~/.ssh/authorized_keys
chmod 644 ~/.ssh/id_rsa.pub
chmod 600 ~/.ssh/id_rsa

-- 测试

ssh node0
ssh node1

2.6 HDFS初始化

hadoop namenode -format

2.7 启动Hadoop

start-all.sh

-- 验证

jps

-- 验证结果

master

3439 NameNode
3679 Jps
3591 JobTracker

node0

3475 TaskTracker
3391 SecondaryNameNode
3322 DataNode
3530 Jps

node1

3422 Jps
3369 TaskTracker
3293 DataNode

2.8 运行基准测试

-- 使用TestNFSIO来测试HDFS

hadoop jar $HADOOP_HOME/hadoop-test-*.jar TestDFSIO -write -nrFiles 2  -fileSize 10
hadoop jar $HADOOP_HOME/hadoop-test-*.jar TestDFSIO -read -nrFiles 2  -fileSize 10
hadoop jar $HADOOP_HOME/hadoop-test-*.jar TestDFSIO -clean

-- 使用Sort程序测试MapReduce

hadoop jar $HADOOP_HOME/hadoop-examples-*.jar randomwriter -Dtest.randomwriter.maps_per_host=1 -Dtest.randomwrite.bytes_per_map=1048576 random-data
hadoop jar $HADOOP_HOME/hadoop-examples-*.jar sort random-data sorted-data
hadoop jar $HADOOP_HOME/hadoop-test-*.jar testmapredsort -sortInput random-data -sortOutput sorted-data

3. 使用HTTP访问Hadoop

Map/Reduce http://master:50030/

HDFS http://master:50070/

4. eclipse插件安装

-- 下载eclipse hadoop plugin 1.2.1 (版本一定要匹配)

-- 安装插件

-- 配置

-- 查看HDFS

查看图片附件

分享到：

Hadoop 第一个Hadoop程序 | MongoDB 查询

2014-03-01 12:32
浏览 725
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

ssm框架设备故障报修管理系统微信小程序源码+项目说明（高分毕设）: 毕业设计ssm框架设备故障报修管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。毕业设计ssm框架设备故障报修管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。毕业设计ssm框架设备故障报修管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。项目主要功能：该项目是基于微信的设备故障报修管理系统，旨在改善传统管理方式的不足。系统涉及管理员、用户和维修员三个角色，管理员可进行用户、维修员、实验室等多方面管理，而用户和维修员可通过微信小程序注册登录，分别进行报修、查看维修状态和交流经验。系统采用Java的SSM框架开发后端，

开车不犯困100首MP3，之41-50，DJ.rar: 开车不犯困100首MP3，之41-50，DJ.rar

ssm框架外籍人员管理系统微信小程序源码+项目说明（高分毕设）: 毕业设计ssm框架外籍人员管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。毕业设计ssm框架外籍人员管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。毕业设计ssm框架外籍人员管理系统微信小程序源码+项目说明（高分毕设）.zip 个人经导师指导并认可通过的高分设计项目，评审分98分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。项目主要功能：该项目是一个基于微信小程序的外来人员管理系统，旨在方便用户管理和查看个人中心、外籍人员信息及派出所信息。系统设计注重功能与界面的融合，支持派出所在线审核外籍人员信息。开发采用成熟技术，如微信开发者工具和JAVA SSM框架，结合源代码进行功能调整，以满足实际管理需求。该系统对外来

光大证券-20180309-放量恰是入市时：成交量择时初探-技术择时系列报告之三: 光大证券-20180309-放量恰是入市时：成交量择时初探——技术择时系列报告之三深度学习多因子模型 quant 股市股票量化交易量化策略

六个盒子及其应用.pptx: 六个盒子及其应用.pptx

yolov10改进.docx: YOLOv10是由清华大学的研究人员基于Ultralytics Python包开发的实时端到端目标检测模型。它引入了一种新的无NMS（非极大值抑制）训练方法，通过一致的双重任务分配来提高推理效率，并在保持竞争性能的同时减少延迟。 YOLOv10的主要改进包括：无NMS训练：通过一致的双重任务分配，YOLOv10在训练过程中避免了NMS的使用，这有助于提高模型的推理速度。效率-精度驱动模型设计：YOLOv10采用了一种新的模型设计策略，从效率和精度两个角度对YOLO组件进行优化，减少了计算开销并提高了性能。轻量级分类头和空间-通道分离下采样：YOLOv10通过简化架构和减少计算成本来提高效率。部分自注意力（PSA）模块：YOLOv10引入了PSA模块来增强模型的全局表示学习能力，同时控制计算复杂度。实验结果：YOLOv10在不同模型尺寸上实现了最先进的性能和端到端延迟，例如YOLOv10-S在COCO数据集上与RT-DETR-R18相比，在相似的平均精度下速度快1.8倍，同时参数和浮点运算次数更少。 YOLOv10的这些创新使其在实时目标检测领域具有显著的优势，特别是在需要

项目机械化工程公司龙门吊大修环境因素及其控制措施一览表.docx: 项目机械化工程公司龙门吊大修环境因素及其控制措施一览表.docx

京东大学的互联网思维.pptx: 京东大学的互联网思维.pptx

【课件】《华为灰度管理法》.docx: 【课件】《华为灰度管理法》.docx

【mysql开发】教程&案例&相关项目资源.docx: 当涉及学习MySQL开发时，有许多优质的教程、案例和相关项目资源可供您使用。以下是一些您可能会发现有用的资源： 1. MySQL开发教程： MySQL官方文档：MySQL官方网站提供了全面的MySQL参考手册和开发指南，包括安装、配置、SQL语法、存储引擎等方面的详细信息。 W3Schools MySQL教程：W3Schools提供了简洁清晰的MySQL教程，适合初学者快速入门。 Coursera《数据管理和分析》：由Duke大学开设的课程，涵盖了数据库管理和数据分析的基本原理，其中也包含MySQL的相关内容。 2. MySQL开发案例和示例： GitHub：在GitHub上搜索MySQL相关的示例项目，如基于MySQL的Web应用程序、数据分析项目等，可以从中学习实际的应用案例。 MySQL官方示例数据库：MySQL官方提供了一些示例数据库，如经典的employees和world数据库，可以用来进行实际的查询和练习。 3. 相关项目资源： MySQL官方网站：提供了MySQL数据库服务器、客户端工具和连接器的下载，以及最新的更新和公告。 Stack Overflow：一个问题与回答

基于Springboot+Vue的校园二手图书交易平台的设计与实现源码+数据库（高分毕设）: 基于Springboot+Vue的校园二手图书交易平台的设计与实现源码+数据库（高分毕设）含有代码注释、使用文档说明，新手也可看懂，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值，项目都经过严格调试，确保可以运行！基于Springboot+Vue的校园二手图书交易平台的设计与实现源码+数据库（高分毕设）含有代码注释、使用文档说明，新手也可看懂，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值，项目都经过严格调试，确保可以运行！基于Springboot+Vue的校园二手图书交易平台的设计与实现源码+数据库（高分毕设）含有代码注释、使用文档说明，新手也可看懂，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单。

在线考试系统设计与实现程序+数据库: 在线考试系统设计与实现程序+数据库

基于java+html实现的虚拟宠物医院学习系统（包含角色扮演，学习，答题等）+源码+用户手册+项目解析PPT+界面展示: 基于java+html实现的虚拟宠物医院学习系统（包含角色扮演，学习，答题等）+源码+用户手册+项目解析PPT+界面展示，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用~ 项目简介：虚拟宠物医院学习系统含医院2D/3D导览、点击具体的科室，右侧展示该科室的具体信息界面右侧展示该科室中的设备信息和药品信息 3D导览具体的一个科室，右侧为该科室的简单文字介绍总共有12个科室可以进行3D浏览医院角色扮演: 可以选择医助、前台、医生三个角色中的任意一个角色进行角色扮演进入具体一个角色的角色扮演界面，左侧是该角色的多个操作流程，每个操作流程下有多个具体的操作步骤病例学习: 进入病例学习模块，选择特定病例种类，查看该疾病种类下的病例信息点击具体的病例查看按钮进入病例详情页。该界面包括左侧的4个步骤（接诊、病例检查、诊断结果、治疗方案），每个步骤中包括文字简介、视频信息、图片信息等测试答题: 选择题目类别和考题数量进行考题的获取获取到考题答题完成，获得答题分数查看个人答题记录

ASP具有动态口令认证机制的网上投票系统的设计(源代码+论文)【ASP】.zip: ASP具有动态口令认证机制的网上投票系统的设计(源代码+论文)【ASP】

4月全新热文高科技，套用模板一键生成热文，没脑子拷贝，第二天出盈利，….txt: 4月全新热文高科技，套用模板一键生成热文，没脑子拷贝，第二天出盈利，…

Java 培训和安置管理系统项目源码（可做毕设参考）: Java 培训和安置管理系统项目是一个基于 Java 编程语言开发的桌面应用程序，旨在为学生提供实习和就业机会。该系统通过提供结构和工具集，使公司能够有效地管理培训和安置过程。系统特点课程入学：学生可以注册培训课程。企业入驻：企业可以注册并提供实习和就业机会。学生管理：包括个人资料输入、培训记录和安置记录。报告生成：生成学生培训和安置的报告。用户管理：支持新用户注册和更改密码功能。模块介绍课程入学模块：学生可以查看并注册可用的培训课程。企业入驻模块：企业可以注册并发布实习和就业机会。学生管理模块：学生可以输入和更新个人资料，查看培训和安置记录。报告生成模块：管理员可以生成和查看学生的培训和安置报告。用户管理模块：支持新用户注册、登录和更改密码功能。 Java 培训和安置管理系统完全使用 Java 和 MySQL 构建，并具有功能齐全的图形用户界面 (GUI)。该系统展示了如何使用 Java 开发一个完整的桌面应用程序，并通过实践提高我们的编程技能和逻辑思维能力。可以作为毕业设计项目参考

ASP NET 图书馆管理系统源代码（毕设参考）: ASP.NET中的在线图书馆管理系统项目是一个Web应用程序，使用C#和ASP.NET开发，后端依托于SQL Server数据库。这个系统旨在帮助图书馆自动化常规操作，例如管理图书库存、处理图书发行和归还、追踪学生信息以及管理逾期还书的罚款。项目概览项目名称：ASP.NET 图书馆管理系统项目开发环境：使用C#语言的ASP.NET Visual Studio 2022 数据库：SQL Server 2021 项目类型：网站应用程序该项目特别适合工程、计算机科学、信息技术以及计算机应用专业的高年级学生。主要功能和模块图书管理员功能：添加出版物和书库信息管理图书分枝添加学生记录发行和归还图书实施逾期罚款学生功能：查看借阅记录检查罚款状况管理个人账户整个系统的实施有助于提高管理效率，确保图书馆资源的有效利用，并使图书馆的日常工作流程自动化，在提高工作效率的同时也提升了服务质量。在安装和运行这个图书馆管理系统之前，请确保你的计算机上已安装Microsoft Visual Studio和SQL Server。

基于Springboot+Vue的图书馆管理系统源码+数据库（高分毕设）: 基于Springboot+Vue的图书馆管理系统源码+数据库（高分毕设）含有代码注释，新手也可看懂，98分毕业设计项目，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用，该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值，项目都经过严格调试，确保可以运行！基于Springboot+Vue的图书馆管理系统源码+数据库（高分毕设）含有代码注释，新手也可看懂，98分毕业设计项目，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用，该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值，项目都经过严格调试，确保可以运行！基于Springboot+Vue的图书馆管理系统源码+数据库（高分毕设）含有代码注释，新手也可看懂，98分毕业设计项目，毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用，该项目可以作为毕设、期末大作业使用，该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用

设计模式基础培训材料-面向对象设计原则与模式: 面向对象设计原则与模式

前端开发基础入门教程 JavaScript语言编程基础教程第5章 JS实战共16页.pptx: 【学习目标】：图片幻灯复杂的表单验证瀑布流

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop 本地集成环境搭建

评论

发表评论

相关推荐

Hadoop 管理

Hadoop MapReduce的特性

Hadoop MapReduce的类型和格式

Hadoop MapReduce工作机制

Hadoop MapReduce应用开发

Hadoop IO

Hadoop HDFS

Hadoop 第一个Hadoop程序

Hadoop 新 MapReduce 框架 Yarn 详解 （转载）

最近访客更多访客>>

Hadoop 新 MapReduce 框架 Yarn 详解（转载）