HDFS中DataNode获取数据函数 - 流云 - ITeye博客

`

cloudeagle

浏览: 106353 次
性别:
来自: 合肥

最近访客更多访客>>

happy2012

qq623830938

JMS_Exception

pjntt

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

HDFS中DataNode获取数据函数

阅读更多

BlockReceiver 函数， receivePacket（）函数

最终获取的数据包写入磁盘

try {
if (!finalized) {
//finally write to the disk :
out.write(pktBuf, dataOff, len);

// If this is a partial chunk, then verify that this is the only
// chunk in the packet. Calculate new crc for this chunk.
if (partialCrc != null) {
if (len > bytesPerChecksum) {
throw new IOException("Got wrong length during writeBlock(" +
block + ") from " + inAddr + " " +
"A packet can have only one partial chunk."+
" len = " + len +
" bytesPerChecksum " + bytesPerChecksum);
}
partialCrc.update(pktBuf, dataOff, len);
byte[] buf = FSOutputSummer.convertToByteStream(partialCrc, checksumSize);
checksumOut.write(buf);
LOG.debug("Writing out partial crc for data len " + len);
partialCrc = null;
} else {
checksumOut.write(pktBuf, checksumOff, checksumLen);
}
datanode.myMetrics.incrBytesWritten(len);

/// flush entire packet before sending ack
flush();

// update length only after flush to disk
datanode.data.setVisibleLength(block, offsetInBlock);
}
} catch (IOException iex) {
datanode.checkDiskError(iex);
throw iex;
}

分享到：

有限状态机（FSM）的分类 | hadoop 中FIFO任务分配流程简化描述

2014-02-25 16:07
浏览 440
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop学习总结之一：HDFS简介: HDFS（Hadoop Distributed File System）是 Hadoop 生态系统中的一个核心组件，负责存储和管理大规模数据。下面是 HDFS 的基本概念和架构：数据块（Block） HDFS 中的基本存储单位是 64M 的数据块。与普通文件系统...

大数据开发笔试.docx: reduce端可能从n多map的结果中获取数据，而这些map的执行速度不尽相同，当其中一个map运行结束时，reduce就会从jobtractor中获取该信息。map运行结束后tasktractor会得到消息，进而将消息汇报给jobtractor，reduce...

Hadoop权威指南（中文版）2015上传.rar: 从Hadoop URL中读取数据通过FileSystem API读取数据写入数据目录查询文件系统删除数据数据流文件读取剖析文件写入剖析一致模型通过 distcp并行拷贝保持 HDFS 集群的均衡 Hadoop的归档文件使用Hadoop归档...

Hadoop权威指南第二版(中文版): 　从Hadoop URL中读取数据　通过FileSystem API读取数据　写入数据　目录　查询文件系统　删除数据　数据流　文件读取剖析　文件写入剖析　一致模型　通过 distcp并行拷贝　保持 HDFS 集群的均衡　...

基于Hadoop的大数据处理系统.pdf: 这是函数式编程（Functional Programming）中的两个核⼼概念。 MapReduce是⼀种简化的分布式编程模式，让程序⾃动分布到⼀个由普通机器组成的超⼤集群上并发执⾏。如同Java程序员可以不考虑内存泄露⼀样，...

Apress - Pro Hadoop: 针对HDFS的业务则为数据流的读写，NameNode/DataNode的通信等。　MapReduce主要在org.apache.hadoop.mapred，实现提供的接口类，并完成节点通信（可以不是hadoop通信接口），就能进行MapReduce运算。　目前这个...

Hadoop实战中文版: 《Hadoop实战》作为云计算所青睐的分布式架构，Hadoop是一个用Java语言实现的软件框架，在由大量计算机组成的集群中运行海量数据的分布式计算，是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分，深入浅出地...

Hadoop实战（陆嘉恒）译: 用Pig编程10.1 像Pig 一样思考10.1.1 数据流语言10.1.2 数据类型10.1.3 用户定义函数10.2 安装Pig10.3 运行Pig10.4 通过Grunt 学习Pig Latin10.5 谈谈Pig Latin10.5.1 数据类型和schema10.5.2 表达式和函数10.5.3 ...

Hadoop实战中文版.PDF: 2011年10月版次：1.1开本：16开装帧：平装字数：417千字页数：253页内容简介编辑作为云计算所青睐的分布式架构，Hadoop是一个用Java语言实现的软件框架，在由大量计算机组成的集群中运行海量数据的分布式计算，是...

Hadoop实战: 71.5.2 相同程序在MapReduce中的扩展 91.6 用Hadoop统计单词——运行第一个程序 111.7 Hadoop历史 151.8 小结 161.9 资源 16第2章初识Hadoop 172.1 Hadoop的构造模块 172.1.1 NameNode 172.1.2 DataNode 182.1.3 ...

Impala与Hive的比较: 而是通过使用与商用并行关系数据库中类似的分布式查询引擎（由QueryPlanner、QueryCoordinator和QueryExecEngine三部分组成），可以直接从HDFS或HBase中用SELECT、JOIN和统计函数查询数据，从而大大降低了延迟。...

Global site tag (gtag.js) - Google Analytics