`
backsnow
  • 浏览: 133762 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

hadoop单机版搭建图文详解

 
阅读更多

前置条件:

1、ubuntu10.10安装成功(个人认为不必要花太多时间在系统安装上, 我们不是为了装机而装机的)

2、jdk安装成功(jdk1.6.0_23for linux版本,图解安装过程http://freewxy.iteye.com/blog/882784  )

3、下载 hhadoop0.21.0.tar.gz(http://apache.etoak.com//hadoop/core/hadoop-0.21.0/ )

 

 

安装hadoop

1、首先将hadoop0.21.0.tar.gz复制到usr下的local 文件夹内,(sudo cp hadoop路径 /usr/local)如图1


2、进入到local目录下,解压hadoop0.21.0.tar.gz,如 图2


3、为方便管理和hadoop版本升级,将解压后的文件夹改名为hadoop, 如图3



 

方便起见,新增hadoop的组和其同名用户:

1、创建一个名字为hadoop的用户组,如图4


2、创建一个用户名为hadoop的用户,归到hadoop组下,如图5(一些 信息可以不填写,直接按enter键即可)如图5


3、(1)添加用户权限:打开etc下的sudoers文件,添加如下(2)命 令,如图6



 --------------------------------------------------------------------------------------------------------------------------------

  (另一种方法是先切换到root用户下,然后修改sudoers的权限,但 这样操作一定要小心谨慎,修改权限后要将文件改回只读,否则悲剧啦啦啦,我们一票人死在这点上好多次)

   (2)在root ALL =(ALL) ALL 下面添加如下文字:

            hadoop ALL = (ALL) ALL

  如图7

-----------------------------------------------------------------------------

 ----------------------------------------------------------------------------------------------

   (/etc/sudoers文件是用于sudo命令执行时审核执行权限用的)

执行命令:$:sudo chown hadoop /usr/local/hadoop(将hadoop文件夹的权限赋给hadoop用户)


安装ssh (需联网):(了解ssh:http://freewxy.iteye.com/blog/910820)

1、安装openssh_server:如图8


2、创建ssh-key,为rsa,如图9


   填写key的保存路径,如图10填写


3、添加ssh-key到受信列表,并启用此ssh-key,如图11


 

4、验证ssh的配置,如图12


 


配置hadoop

0、浏览hadoop文件下都有些什么东西,如图13


 

1、打开conf/hadoop-env.sh,如图14


 

   配置conf/hadoop-env.sh(找到#export JAVA_HOME=...,去掉#,然后加上本机jdk的路径,可以从/etc/profile中找到,本机的为/usr/lib/jvm/java-6-sun),如图15

---------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------- 

2、打开conf/core-site.xml

   配置,如下内容:

Java 代码  收藏代码
  1. <configuration>  
  2.  <property>  
  3.   <name>fs.default .name</name>  
  4.   <value>hdfs://localhost:9000</value>    
  5.  </property>  
  6.  <property>  
  7.   <name>dfs.replication</name>   
  8.   <value>1 </value>   
  9.  </property>  
  10.  <property>  
  11.   <name>hadoop.tmp.dir</name>  
  12.   <value>/home/hadoop/tmp</value>   
  13.  </property>  
  14. </configuration>   
<configuration>
 <property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:9000</value> 
 </property>
 <property>
  <name>dfs.replication</name> 
  <value>1</value> 
 </property>
 <property>
  <name>hadoop.tmp.dir</name>
  <value>/home/hadoop/tmp</value> 
 </property>
</configuration> 

 

 

 

 

3、打开conf目录下的mapred-site.xml

  配置如下内容:

Java 代码  收藏代码
  1. <configuration>  
  2.  <property>   
  3.   <name>mapred.job.tracker</name>  
  4.   <value>localhost:9001 </value>   
  5.  </property>  
  6. </configuration>  
<configuration>
 <property> 
  <name>mapred.job.tracker</name>
  <value>localhost:9001</value> 
 </property>
</configuration>

 

 

 

 

 

运行测试

1、改变用户,格式化namenode,如图18


 

  可能遇到如下错误(倒腾这个过程次数多了),如图19


 

执行如图20,再次执行如图18


 

2、启动hadoop,如图21


 

3、验证hadoop是否成功启动,如图22


 


运行自带wordcount例 子(jidong啊)

1、准备需要进行wordcount的文件,如图23(在test.txt中随 便输入字符串,保存并退出)



-------------------------------------------------------------------------------------------

2、将上一步中的测试文件上传到dfs文件系统中的firstTest目录下, 如图24(如果dfs下不包含firstTest目录的话自动创建一个同名目录,使用命令:bin/hadoop dfs -ls查看dfs文件系统中已有的目录)


 

3、执行wordcount,如图25(对firstest下的所有文件执行 wordcount,将统计结果输出到result文件夹中,若result文件夹不存在则自动创建)


4、查看结果,如图26


 

关闭服务:
bin/stop-all.sh

 

单机版搞定~~

分享到:
评论

相关推荐

    大数据云计算技术系列 hadoop单机版搭建图文详解(共14页).pdf

    【大数据云计算技术系列 hadoop单机版搭建图文详解】 在当今的数据时代,大数据处理和分析已经成为企业及研究机构的核心需求之一。Apache Hadoop 是一种开源的分布式计算框架,它允许在大规模集群上处理和存储海量...

    大数据云计算技术系列 hadoop单机版搭建图文详解(共14页).rar

    **Hadoop单机版搭建步骤** 1. **环境准备**: 首先,确保你的计算机系统满足最低配置需求,包括Java运行环境(JRE)和Java开发工具集(JDK)。安装Java并设置好环境变量,可以通过`java -version`命令检查版本是否...

    log4j-slf4j-impl-2.12.0.jar中文-英文对照文档.zip

    # 压缩文件中包含: 中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    spring-data-jpa-2.0.9.RELEASE.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    snappy-java-1.1.7.1.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    基于RS2指令的通讯例程:3u平台实现远程控制与多设备互联互通

    内容概要:本文档详细介绍了如何利用3u平台通过RS2指令与打印机及其他多种外界元件(如触摸屏、RFID读写器、扫码枪、电磁流量计等)进行通讯。它不仅涵盖了与打印机通讯的具体例程,还提供了丰富的应用场景和技术细节。文档强调了RS2指令作为一种常见串行通信协议的重要性和应用范围,展示了如何通过编写带有详细注释的代码实现远程控制和数据交互。此外,文档还提到了这些技术在工业自动化、智能家居、物流仓储等领域的广泛应用。 适合人群:从事嵌入式系统开发、工业自动化、物联网等相关领域的工程师和技术人员。 使用场景及目标:① 学习如何通过RS2指令实现与打印机和其他设备的通讯;② 掌握远程控制和数据读写的编程技巧;③ 提升在工业自动化、智能家居等领域的项目开发能力。 其他说明:文档提供了详尽的代码注释和注解,便于读者理解和实践。对于有兴趣深入了解RS2指令及其应用的读者,文档还提供了进一步的学习资源和联系方式。

    jackson-jaxrs-base-2.7.8.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    swagger-models-1.5.3.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    【车辆控制】基于matlab LQR自动驾驶车辆控制【含Matlab源码 13280期】.zip

    Matlab领域上传的视频是由对应的完整代码运行得来的,完整代码皆可运行,亲测可用,适合小白; 1、从视频里可见完整代码的内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

    Simpack轨道客车模型中非线性临界速度300的应用与分析

    内容概要:本文详细介绍了Simpack模拟软件在轨道客车模型中的应用,重点讨论了非线性临界速度300公里/小时的问题。文章首先概述了Simpack的功能及其在轨道交通领域的广泛应用,接着从多个角度分析了非线性临界速度的影响因素,包括列车动力学特性、轨道线路条件和信号控制系统。通过对这些因素的综合分析,揭示了轨道客车在不同条件下的运行特性和潜在挑战。最后得出结论,指出非线性临界速度问题是复杂但可以通过深入研究来解决的技术难题。 适合人群:从事轨道交通研究的专业人士和技术爱好者。 使用场景及目标:适用于希望深入了解Simpack软件在轨道客车建模中的应用,特别是关注非线性临界速度问题的研究人员和技术人员。目标是帮助他们更好地理解轨道客车的运行机制,提高模型的准确性和可靠性。 其他说明:随着技术的进步,更多先进的技术和方法将会被引入到轨道交通领域,进一步提升列车的安全性和效率。

    bugreport-2025-05-11-204343.zip

    bugreport-2025-05-11-204343.zip

    多类别水果目标检测与实例分割数据集.zip

    数据集介绍:多类别水果目标检测与实例分割数据集 一、基础信息 数据集名称:多类别水果目标检测与实例分割数据集 图片数量: - 训练集:11,110张图片 - 验证集:635张图片 - 测试集:316张图片 - 总计:12,061张农业场景图片 分类类别: 苹果、香蕉、哈密瓜、无花果、葡萄、葡萄柚、柠檬、芒果、橙子、桃子、梨、菠萝、石榴、草莓、西瓜 标注格式: - YOLO格式,包含边界框及多边形坐标标注,兼容目标检测与实例分割任务 - 数据格式:农业场景实拍图片,覆盖不同光照条件、果实成熟度及遮挡场景 二、适用场景 农业自动化分拣系统: 支持构建水果识别与定位模型,用于智能分拣设备视觉模块开发,提升水果分类效率。 农业机器人视觉模块: 适用于果园巡检机器人,实现多类别水果实时检测与空间定位。 水果产量预估系统: 通过实例分割标注可精确计算果实分布密度,为产量预测提供数据支持。 农产品质量检测: 支持检测果实表面缺陷、形态异常等特征,适用于自动化质量分级系统。 计算机视觉算法研究: 为多目标检测、小样本实例分割等前沿算法提供高质量农业领域验证数据。 教育实训案例: 可作为农业AI应用开发课程的实践数据集,覆盖数据标注、模型训练全流程。 三、数据集优势 多任务适配性: 同时包含目标检测(边界框)与实例分割(多边形)标注,支持两种计算机视觉任务联合训练。 高类别完备性: 覆盖15种全球主要经济水果,包含常见热带水果(如芒果、菠萝)与温带水果(如苹果、梨)。 真实场景多样性: 数据采集涵盖果园、仓储、运输等多场景,包含果实重叠、枝叶遮挡、不同成熟度等实际工况。 标注专业性强: 所有标注经过农业专家校验,确保果实边界的精确标注,特别针对易混淆品种(如柑橘类)提供区分标注。 算法兼容度高: YOLO格式可直接应用于主流深度学习框架(YOLOv5/v7/v8、MMDetection等),

    HikariCP-java7-2.4.12.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    jetty-http-9.4.11.v20180605.jar中文文档.zip

    # 压缩文件中包含: 中文文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    基于ICA曲线峰值与高斯过程回归的电池SOH估算方法及其应用

    内容概要:本文详细介绍了基于ICA曲线峰值和高斯过程回归的电池SOH(State of Health)估算方法。首先,通过绘制电池容量增量曲线并进行卡尔曼滤波,提取出ICA曲线的峰值作为健康特征。接着,使用高斯过程回归建立电池状态估计模型,以ICA曲线峰值为输入,SOH为输出进行训练。该方法结合了电池充放电行为特征和先进机器学习技术,适用于电动汽车和移动设备的电池性能评估。文中还提供了具体的代码实现指导,包括数据预处理、IC曲线绘制、卡尔曼滤波和高斯过程回归模型的构建。 适合人群:从事电池管理系统研究的技术人员、电动汽车和移动设备制造商的研发人员、对电池健康管理感兴趣的科研工作者。 使用场景及目标:① 提供一种有效的电池SOH估算方法,提高电池性能评估的准确性;② 探索ICA曲线峰值与高斯过程回归在电池健康管理中的应用潜力;③ 为相关领域的研究人员提供实践案例和技术支持。 其他说明:该方法不仅有助于电池性能和寿命的评估与优化,也为未来的电池管理技术发展提供了新的思路。

    基于西门子PLC与组态王的八层电梯控制系统设计及动画实现

    内容概要:本文详细介绍了基于西门子S7-1200 PLC和组态王软件平台的八层电梯控制系统的设计与实现。主要内容涵盖电梯控制逻辑、硬件选型(如SM1223 IO模块)、关键控制算法(如格雷码处理、位置判断梯形图)以及组态王中的动画效果实现方法。文中还讨论了门机控制的安全互锁机制,并分享了一些实用技巧,如通过VBS脚本实现电梯轿厢平滑移动、利用按钮颜色动态变化来减少IO点占用等。 适合人群:从事工业自动化领域的工程师和技术人员,特别是对PLC编程和SCADA系统有一定了解的人群。 使用场景及目标:适用于需要理解和掌握现代电梯控制系统设计原理及其具体实施细节的专业人士。目标是帮助读者深入了解从硬件选型到软件编程的完整流程,提高实际项目开发能力。 阅读建议:建议读者结合实际工程案例进行学习,在理解理论的同时注重实践操作,尤其是对于梯形图编程、VBS脚本编写及组态王配置部分应多加练习。

    风光柴储混合微电网储能电池系统互补能量管理Simulink模型分析

    内容概要:本文详细探讨了风光柴储混合微电网中储能电池系统的互补能量管理Simulink模型。首先介绍了风光柴储混合微电网的概念及其组成部分,强调了储能电池系统在平衡供需和平滑输出方面的重要作用。接着阐述了如何使用Simulink构建包含风力、太阳能、柴油发电和储能电池等模块的仿真模型,涉及数据采集与处理、先进控制算法的设计以及仿真实验的验证。最后指出,该模型有助于提高微电网的供电可靠性、经济性,并促进可再生能源的发展。 适合人群:从事微电网研究、可再生能源开发及相关领域的科研人员和技术工程师。 使用场景及目标:适用于希望深入了解风光柴储混合微电网储能电池系统互补能量管理机制的研究者,旨在帮助他们掌握Simulink建模方法,提升微电网的性能。 其他说明:文中提到的Simulink模型不依赖任何特定版本的Matlab,但需要注意的是,该模型并不兼容所有版本的Matlab。

    基于Matlab的并网逆变器VSG预同步控制仿真模型:结合三相准PR控制、PWM与锁相环技术

    内容概要:本文详细介绍了基于Matlab的并网逆变器VSG预同步控制仿真模型的设计与实现。主要内容涵盖VSG核心算法、预同步控制模块、电流双环控制以及锁相环和三相准PR控制的应用。文中提供了具体的MATLAB/Simulink代码片段,如VSG转动方程、预同步控制中的相位差补偿、准PR控制器的离散化实现等。此外,还提到了一些仿真过程中需要注意的问题,如PWM载波频率限制、初始相位差设置和并网瞬间电流冲击等问题。附有相关参考文献,帮助读者深入理解VSG预同步控制的技术背景。 适合人群:电力电子领域的初学者和技术爱好者,尤其是对并网逆变器和VSG控制感兴趣的读者。 使用场景及目标:适用于希望深入了解并网逆变器VSG预同步控制机制的研究人员和工程师。通过本模型可以掌握VSG控制的基本原理及其在实际应用中的实现方法,解决并网仿真的同步难题。 其他说明:文中提供的仿真模型可以在GitHub上获取,方便读者进行实验和验证。后续计划探讨VSG的黑启动技术,进一步扩展研究范围。

    commons-collections-2.1.jar中文-英文对照文档.zip

    # 压缩文件中包含: 中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖 源代码下载地址 # 本文件关键字: jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法: 解压最外层zip,再解压其中的zip包,双击 【index.html】 文件,即可用浏览器打开、进行查看。 # 特殊说明: ·本文档为人性化翻译,精心制作,请放心使用。 ·只翻译了该翻译的内容,如:注释、说明、描述、用法讲解 等; ·不该翻译的内容保持原样,如:类名、方法名、包名、类型、关键字、代码 等。 # 温馨提示: (1)为了防止解压后路径太长导致浏览器无法打开,推荐在解压时选择“解压到当前文件夹”(放心,自带文件夹,文件不会散落一地); (2)有时,一套Java组件会有多个jar,所以在下载前,请仔细阅读本篇描述,以确保这就是你需要的文件;

    25kHz二阶低通滤波器仿真

    25kHz二阶低通滤波器仿真

Global site tag (gtag.js) - Google Analytics