`

hadoop eclipse plugin 之二

阅读更多

前面已经有一篇记述了hadoop-plugin for eclipse的安装,但是仍受限于run on hadoop不能工作,而且是在虚拟机内部,没有试过在虚拟机外用eclipse连接虚拟机内部的hdfs

为解决以上两问题,总结这两天的工作情况

一、结合网上的说法,plugin是用eclipse europa开发的,可以和这个版本良好结合,试过,确实可以使用run on hadoop了。

二、远程访问hadoop

参考这篇文章

要注意的地方有以下几个

1.首先查看虚拟机IP(即hadoop安装启动的机器),并保证ssh ${ip}无须登录

2.在客户机(我的例子是虚拟机外部的windows本机)的hosts里加上虚拟机的ip与机器名的映射,重启生效

3.hadoop的所有配置文件中用域名的地方改为ip,主要是core-site.xml、mapred-site.xml、master、slave;

4.eclipse中配置hadoop时,advance parameter中hadoop.tmp.dir必须与core-site.xml中配置的一样,还有hadoop.job.ugi这一项,第一次可能不会出现(linux里的eclipse一直不出现),重启或重连接后会出现,这一项必须配置成 (登录用户名),(登录用户组)的形式

5.虚拟机里的hosts文件必须改,必须将127.0.0.1的项目都去掉或者注解掉(就是没有去掉这个导致浪费了一下午加一晚上),必须加上ip对应虚拟机机器名的项

 

 

感受:hadoop相关工具的版本问题很头疼,hadoop本身一直在向前开发,但是各相关工具没有跟上,目前看来,如果不想用cloudera的版本而用原生的话,最好用hadoop-0.20.2版,eclipse用europa版,加上0.20.2的插件,就可以进行相应的开发了

 

 

 

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics