Hadoop0.20.203初试手记 - ·残垣· - ITeye博客

`

Joson_Coney

浏览: 54866 次
性别:
来自: 广州

最近访客更多访客>>

ping7603

zishan

流水光阴

slee4444

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Joson_Coney： 11. while( (*strDest++ = *strSr ...
c++笔试题汇总
Joson_Coney： ③ 1. int func(x) { int countx = ...
c++笔试题汇总
Joson_Coney：链表反向1： #include <cstdlib&g ...
c++笔试题汇总

Hadoop0.20.203初试手记

博客分类：

数据存储

阅读更多

OS: Debian 6.03

Hadoop: 0.20.203

一，安装Hadoop

启动运行Hadoop时不能用root。用其它用户账号运行时，需要对hadoop文件夹下有rwx权限。

所以建议：安装Hadoop时，最好用当前用户安装，而不用root。

1. 解压好hadoop，放入/usr/local/下，即/usr/local/hadoop-0.20。

2. 设置环境变量：

1）vi /etc/profile：加入

export HADOOP_HOME=/usr/local/hadoop-0.20

不知道这个环境变量是否必要，参考了别人的文章，先设置。

2）vi /usr/local/hadoop-0.20/conf/hadoop-env.sh:设置JAVA_HOME变量。

export JAVA_HOME=/usr/local/jdk1.6.0_30

注意这个变量需要在hadoop中另外设置。而/etc/profile下的JAVA_HOME，hadoop是不认的。

二，运行测试：

1. Standalong:

参考：http://hadoop.apache.org/common/docs/r0.20.203.0/single_node_setup.html#Local

2. Pseudo-Distribute:

参考：http://hadoop.apache.org/common/docs/r0.20.203.0/single_node_setup.html#PseudoDistributed

如果用非root用户启动，并且对/usr/local/hadoop-0.20下有读写和执行权限，在我这环境下是没有问题的。

用浏览器访问

分享到：

【转】DNS协议及应用 | DNS 伺服器

2012-01-26 08:01
浏览 765
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Windows平台上安装Hadoop-0.20.203.0版本方法: Windows平台上安装Hadoop-0.20.203.0版本方法

hadoop-0.20.205.0和hbase-0.90.5，集群和单机安装配置: hadoop-0.20.205.0和hbase-0.90.5，集群和单机安装配置

hadoop-eclipse-plugin-0.20.203.jar: hadoop-0.20.203.0的eclipse插件： hadoop-eclipse-plugin-0.20.203.jar

hadoop 0.20.203.0 api.chm: hadoop 0.20.203.0 api.chm ，自己手工制作的文档

hadoop-core-0.20.203.0.jar: hadoop-core-0.20.203.0.jar

Hadoop 0.20.205.0 API 官方CHM版: Hadoop 0.20.205.0 API 官方CHM版,根据Apache官方文档生成的chm版的文档，绝对原汁原味!

hadoop-eclipse-plugin-0.20.203.0.jar: hadoop-eclipse-plugin-0.20.203.0.jar hadoop集成eclipse插件

修改后的hadoop-eclipse-plugin-0.20.203.0: hadoop-eclipse-plugin-0.20.203.0 插件无法连接问题，重新布到eclipse/plugin后启动eclipse需要 -clean一下

hadoop 0.20.203.0 eclipse插件修改过的: 加入依赖的 class文件的hadoop eclipse插件，不会再出现异常，大家也可以DIY，网上有简单的教程，只收一个劳务分吧

hadoop2.X新特性介绍: hadoop2.X新特性介绍

spark-2.3.4-bin-hadoop2.7.tgz: pyspark本地的环境配置包，spark-2.3.4-bin-hadoop2.7.tgz：spark-2.3.4-bin-hadoop2.7.tgz

spark-3.1.3-bin-hadoop3.2.tgz: Apache Spark版本3.1.3。Linux安装包。spark-3.1.3-bin-hadoop3.2.tgz

hodoop0.20.203: 即使不会分布式的东东，但是我们也可以用hadoop来分析数据，当然我们只是用于大量日志的分析

spark-3.2.0-bin-hadoop3.2.tgz: spark-3.2.0-bin-hadoop3.2.tgz

spark-3.1.2-bin-hadoop3.2.tgz: spark3.1.2适用于scala2.12+hadoop3.x

spark-3.0.0-bin-hadoop2.7.tgz: spark-3.0.0-bin-hadoop2.7.tgz 官网下载不了的，需要资源的，可以到这里下载哦

spark-2.4.5-bin-hadoop2.7.tar.gz: spark-2.4.5-bin-hadoop2.7.tgz的安装包,适用ubuntu，Redhat等linux系统，解压即可安装，解压命令：tar -zxvf spark-2.4.5-bin-hadoop2.7.tar.gz -C dst（解压后存放路径）

spark-2.0.0-bin-hadoop2.6.tgz: 本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载,本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载

Global site tag (gtag.js) - Google Analytics