最新文章列表

Java程序中不通过hadoop jar的方式访问hdfs

    一般情况下,我们使用Java访问hadoop distributed file system(hdfs)使用hadoop的相应api,添加以下的pom.xml依赖(这里以hadoop2.2.0版本为例):   <dependency> <groupId>org.apache.hadoop</groupId> <arti ...
brandNewUser 评论(0) 有4508人浏览 2015-05-05 21:32

hdfs追加文件

hdfs追加文件测试代表如下: Configuration conf=new Configuration(); conf.setBoolean("dfs.support.append", true); conf.set("dfs.client.block.write.replace-datanode-on-failure.policy","NEV ...
qun715715 评论(0) 有715人浏览 2015-04-30 08:36

hadoop2.6.0版本搭建伪分布式环境

由于个人需要在自己的笔记本上搭建hadoop伪分布环境,为了方便自己使用,如想看机器也看之前的一篇博客:hadoop2.6.0版本集群环境搭建 一台虚拟机,配置信息如下: 内存:1G,cpu:一个core,硬盘:15G 1、修改下主机名为master sudo vi /etc/sysconfig/network 修改结果后: 重启电脑后再查看结果:
Stark_Summer 评论(0) 有6907人浏览 2015-02-06 15:58

hdfs over ftp 安装部署

hdfs-over-ftp是一个开源,简单易用的实现了对HDFS系统的下载和上传功能的小工具。可以作为管理工具来使用,快捷方便。 1.安装jdk(1.6以上版本)并配置环境变量 分别执行java –version和javac –version,若显示版本真确,则说明安装和配置成功。 2.安装hadoop,并将服务启动并配置环境变量。   执行hadoop version,若显正确版本号 ...
小破丿孩儿 评论(0) 有3084人浏览 2015-02-06 10:37

Spark API编程动手实战-06-对搜狗日志文件深入实战操作

本节中所用到的内容是来自搜狗实验室,网址为:http://www.sogou.com/labs/dl/q.html 我们使用的是迷你版本的tar.gz格式的文件,其大小为87K,下载后如下所示: 上传到服务器后,解压并查看:     查看Sogou文件内容: 该文件的格式如下所示:访问时间 \t 用户ID \t 查询词 \t 该URL在返回结果中的
Stark_Summer 评论(1) 有2412人浏览 2015-02-04 11:05

如何远程读取CDH的hadoop上的HDFS数据?

以前,散仙曾写过一篇如何在win上使用eclipse远程读取HDFS上的数据,不过当时使用的hadoop是1.2版本的,而且还是apache的,今天hadoop的最新版本已经到hadoop2.6了,而我们服务器上的hadoop是CHD5.3的版本,使用的hadoop是hadoop2.5.0版本的。 今天,散仙就以hadoop2.x的版本记录下,如何在eclipse中远程连接并读取数据,在网上搜的代 ...
qindongliang1922 评论(0) 有6820人浏览 2015-01-26 21:37

请小心Hadoop2.5.0和Java Web项目集成bug

今天,散仙在Myeclipse构建的Java的Web项目里使用hadoop2.5的jar包,去连接Linux系统上的HDFS,做一个数据展示的工程,发生了一个莫名其妙的异常,信息如下: Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.collect.MapMaker.keyEqui ...
qindongliang1922 评论(0) 有4237人浏览 2015-01-26 19:43

hadoop学习--HDFS

hadoop fs -ls / hdfs dfs -ls / #操作命令 1、架构 下图表示/test/a.log这个文件保存3个副本,该文件有blk_1,blk_2两个块, 第一个块保存在h0,h1,h3这3个服务器中, 第二个块保存在h0,h2,h4这3个服务器中。。 2、HDFS基础数据 NameNode是整个文件系统的管理节点;它维护着整个文件系统的文件目录树,文件/目录的 ...
jinjzk 评论(0) 有513人浏览 2015-01-12 20:37

本地开发spark代码上传spark集群服务并运行(基于spark官网文档)

打开IDEA 在src下的main下的scala下右击创建一个scala类 名字为SimpleApp ,内容如下   import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ import org.apache.spark.SparkConf object SimpleApp { def ...
Stark_Summer 评论(0) 有5605人浏览 2015-01-08 18:50

hadoop中hdfs读取文件的原理剖析

上一篇文章中简单介绍了一下hadoop文件存储的一些逻辑与简单原理,既然后写入,那肯定要读取分析数据咯,下面我在白话一下hdfs中文件读取的逻辑与 ...
snwz 评论(0) 有782人浏览 2015-01-08 11:45

安装好hadoop集群后上传文件出错

错误日志如下: Java HotSpot(TM) Client VM warning: You have loaded library /root/devtools/hadoop-2.5.2/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack g ...
qihuiyong6 评论(0) 有1826人浏览 2014-12-04 13:04

Python进行简单的MapReduce(1)

所有操作,假定hadoop集群已经正常部署。 Python源码 mapper.py #!/usr/bin python import sys # input comes from STDIN (standard input) for line in sys.stdin: line = line.st ...
lesorb 评论(0) 有1463人浏览 2014-11-27 13:01

hadoop hdfs 添加数据目录出错

由于原来配置的hadoop data目录快要用满了,故准备修改配置文件增加数据目录,以便扩容,但由于疏忽,把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录,但未创建实际目录,重启datanode服务时,报如下错误: 2014-11-18 08:51:39,128 WARN org.apache.hadoop.hdfs ...
daizj 评论(0) 有19118人浏览 2014-11-18 09:39

hadoop hdfs常用命令

hdfs常用命令 -help [cmd] //显示命令的帮助信息 -ls(r) <path> //显示当前目录下所有文件 -du(s) <path> //显示目录中所有文件大小 -count[-q] <path> //显示目录中文件数量 -mv <src> <dst> //移动多个文件到目标目录 -cp <src> <ds ...
shibin_1109 评论(0) 有661人浏览 2014-09-11 23:33

HDFS 常用命令集合

选项名称      使用格式      含义-ls      -ls <路径>      查看指定路径的当前目录结构-lsr      -lsr <路径>      递归查看指定路径的目录结构-du      -du <路径>      统计目录下个文件大小-dus      -dus <路径>      汇总统计目录下文件(夹)大小-count   ...
michael_roshen 评论(0) 有19600人浏览 2014-08-12 17:36

HDFS文件系统操作文件或文件夹

package com.my.hdfs; import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io. ...
my0113 评论(0) 有622人浏览 2014-08-06 14:44

Hadoop1.0-HDFS介绍

       Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。        HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型 ...
szjian 评论(0) 有1722人浏览 2014-08-06 10:03

HDFS常用命令

               HDFS 常用的文件操作命令 1.-cat 使用方法:hadoop fs -cat URI 说明:将路径指定的文件输出到屏幕 示例: hadoop fs -cat hdfs://host1:port1/file hadoop fs -cat file:///file3 2.-copyFromLocal 使用方法:hadoop fs -copyFromLocal & ...
qindongliang1922 评论(0) 有958人浏览 2014-07-27 20:01

HDFS 常用的文件操作命令

                HDFS 常用的文件操作命令 1.-cat 使用方法:hadoop fs -cat URI 说明:将路径指定的文件输出到屏幕 示例: hadoop fs -cat hdfs://host1:port1/file hadoop fs -cat file:///file3   2.-copyFromLocal 使用方法:hadoop fs -copyFr ...
MNTMs 评论(0) 有3580人浏览 2014-07-27 12:16

最近博客热门TAG

Java(141745) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54919) .net(54785) Web(54514) 工作(54118) Linux(50905) Oracle(49875) 应用服务器(43289) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37267) 数据结构(36424)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics