远程提交Map/Reduce任务 - 走自己的路。www.ximalaya.com - ITeye博客

`

ldd600

浏览: 101690 次
性别:
来自: 上海

最近访客更多访客>>

zfsn2222

yominhi

白芝麻黑芝麻

greatchenxu666

博主相关

博客

微博

相册

收藏

留言

关于我

博客专栏

: Hyperic插件开发不完...
浏览量：11072

文章分类

社区版块

存档分类

最新评论

u011506498：楼主，能否求源码，924393541@qq.com，多谢！
Java爬虫框架（三）--模块设计之二
yutiannanjingjiangsu： leftpop的返回值问题，在jedis2.6中似乎已解决（l ...
Spring-data-redis使用心得
xpf123fly：楼主，能否求源码，593829792@qq.com，多谢！
Java爬虫框架（三）--模块设计之二
wenlinguo：写得不是很好理解
Hyperic插件开发不完全指南（二）--插件进阶
406657836： java 在server模式下对while进行了优化。把判断提 ...
Java进程CPU100%的问题

远程提交Map/Reduce任务

博客分类：

Hadoop/HBase/Hive/MR

阅读更多

1. 将开发好MR代码打包成jar。添加到distributed cache中。

bin/hadoop fs -copyFromLocal /root/stat-analysis-mapred-1.0-SNAPSHOT.jar /user/root/lib

2. 在服务器端创建和你客户端一模一样的用户。创建目录 /tmp/hadoop-root/stagging/用户

3. 客户端提交job的代码

	Configuration conf = HBaseConfiguration.create();
	        conf.set("hbase.zookeeper.quorum", "node.tracker1");
	        conf.set("fs.default.name", "hdfs://node.tracker1:9000/hbase");
	        conf.set("mapred.job.tracker", "node.tracker1:9001");
	       
	        Job job = new Job(conf, "Hbase_FreqCounter1");
	      
	        job.setJarByClass(FreqCounter1.class);
	        Scan scan = new Scan();
	        String columns = "details"; // comma seperated
	        scan.addFamily(Bytes.toBytes(columns));
	        scan.setFilter(new FirstKeyOnlyFilter());
	        TableMapReduceUtil.initTableMapperJob("access_logs", scan, Mapper1.class, ImmutableBytesWritable.class,
	                IntWritable.class, job);
	        TableMapReduceUtil.initTableReducerJob("summary_user", Reducer1.class, job);
//	        TableMapReduceUtil.addDependencyJars(job);
	        
	        DistributedCache.addFileToClassPath(new Path("hdfs://node.tracker1:9000/user/root/lib/stat-analysis-mapred-1.0-SNAPSHOT.jar"),job.getConfiguration());
	        job.submit();

4.运行java application，登陆node的MR管理页面，可以看到

查看图片附件

分享到：

多客户端同时登录向下查看更多翻页 | Lucene sort

2012-08-28 21:20
浏览 1751
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Map/Reduce: Map/Reduce介绍。一些基本基础介绍。

Map/Reduce：大规模集群上的简化数据处理: Map/Reduce：大规模集群上的简化数据处理中文翻译，但也有一些语句翻译不到位，请谅解。希望能够对大家有帮助。

Windows平台下Hadoop的Map/Reduce开发: 讲述了Windows平台的Hadoop安装... 最后，以最简单的求和为例，剖析Hadoop的Map/Reduce工作机制，对于初学Hadoop及Map/Reduce的读者有很大的帮助。相信通过最简单的求和为例，读者可步入Hadoop的Map/Reduce开发者行列。

hadoop中map/reduce: hadoop中map/reduce自学资料合集

在solr文献检索中用map/reduce: 在solr文献检索中用map/reduce

基于Map/Reduce的分布式搜索引擎研究: 【摘要】在对Map／Reduce算法进行分析的基础上，利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎，以面对搜索引擎对海量数据的处理和存储问题。

win7_64eclispe插件: win7_64eclispe插件解决An internal error occurred during: "Map/Reduce location status updater". org/codehaus/jackson/map/JsonMappingException 重新编译包

远程调用执行Hadoop Map/Reduce: NULL 博文链接：https://sgq0085.iteye.com/blog/1879442

对云计算中几种基础设施（Dynamo,Bigtable,Map/Reduce等）的朴素看法: 云计算的三大技术——Bigtable,Map/Reduce等的研究文章。。。。。。。。。

基于Map／Reduce的改进选择算法在云计算的Web数据挖掘中的研究.pdf: 基于Map／Reduce的改进选择算法在云计算的Web数据挖掘中的研究.pdf

现有student.txt和student-score.txt 将两个文件上传到hdfs上使用Map/Reduce框架完成下面: 现有student.txt和student_score.txt。将两个文件上传到hdfs上。使用Map/Reduce框架完成下面

基于Map_Reduce的分布式搜索引擎研究: 在对Map/Reduce算法进行分析的基础上,利用开源Hadoop软件设计出高容错高性能的分布式搜索引擎,以面对搜索引擎对海量数据的处理和存储问题

hadoop之map/reduce: hadoop开发文档

动态在线Map/Reduce流数据处理模型及作业拓扑管理协议: 针对海量流数据的在线处理需求,提出一种不同于传统Map/Reduce流数据处理的系统模型Flexible workflow.该模型对workflow处理单元进行在线Map/Reduce并行化,实现了SPATE系统;同时为该系统定义一组关于作业的建立、管理...

map/reduce template: NULL 博文链接：https://roserouge.iteye.com/blog/733149

Ruby中的类Google Map/Reduce框架Skynet介绍: Google的Map/Reduce框架实在太有名气了，他可以把一个任务切分为很多份，交给n台计算机并行执行，返回的结果再并行的归并，最后得到运算的结果。据说Google一个搜索结果会Map到7000台服务器并行执行，这么多么可怕的...

基于Map_Reduce的并行关联分析方法: 本文在研究BIRCH算法、规则关联算法、Hadoop的map／reduce机制的基础上，提出了一种基于map／reduce的应用于网络安全事件分析的并行关联方法。一方面，通过对BIRCH 算法的改进，在BIRCH的分层次思想中引入预定义的...

基于Java和mapreduce实现的贝叶斯文本分类器设计.zip: 本项目为一个Hadoop课程设计，使用Java语言和map/reduce实现贝叶斯文本分类器。项目的具体内容如下：1：用MapReduce算法实现贝叶斯分类器的训练过程，并输出训练模型； 2：用输出的模型对测试集文档进行分类测试。...

Python中的高级函数map/reduce使用实例: 如果你读过Google的那篇大名鼎鼎的论文“MapReduce: Simplified Data Processing on Large Clusters”，你就能大概明白map/reduce的概念。我们先看map。map()函数接收两个参数，一个是函数，一个是序列，map将传入...

Global site tag (gtag.js) - Google Analytics