Datanode block
corrupt流程说明
1、 Datanode上有一个线程DataBlockScanner对Datanode上面的block进行数据校验,其中该类中最重要的方法是verifyBlock(Block block),在verifyBlock(Block
block)方法中利用了BlockSender,其方法是将block读入到一个空设备(IOUtils.NullOutputStream())中,通过读写进行检验。
2、 如果检验失败后handleScanFailure(Block
block),通过RPC直接向Namenode汇报存在坏块,即调用Namenode的reportBadBlocks(blocks)方法
3、Namenode向FSNamesystem转发调用markBlockAsCorrupt(Block blk,DatanodeInfo dn),经过校验后将该block放置入neededReplications结构中,至此Datanode向Namenode汇报结束
4、 Namenode通过ReplicationMonitor线程,对block出现的问题(excess,neededreplica…)进行处理。该线程调用computeDatanodeWork()方法,该方法首先调用computeReplicationWork()方法。
5、 在computeReplicationWork()方法中,从neededReplicaions结构中按照优先级构建出需要复制的block—blocksToReplicate,对每个block调用computeReplicationWorkForBlock()方法
6、 随后调用ReplicationTargetChooser类的chooseTarget去获取目的主机,用于放置block
7、 随后更改6中获得的DatanodeDescriptor的状态,将该block放置入需要replicate的队列中,同时pendingReplications加入该block准备复制
8、 最后修改corrupt的block对应的DatanodeDescriptor状态,将该block置入invalidate队列中
9、 再下一次心跳汇报时,会将对应的block已DatanodeCommand的形式,发送给datanode进行处理
注:集群中主机数需要大于相应副本数才会进行复制,对corrupt进行处理,否则第6步找不出目的主机
分享到:
相关推荐
第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件系统.pdf第四章(Hadoop大数据处理实战)Hadoop分布式文件...
第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式集群.pdf第二章(Hadoop大数据处理实战)搭建Hadoop分布式...
Hadoop海量文本处理2
《Hadoop大数据处理》共10章涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与...
利用hadoop集群处理分析日志文件
Hadoop海量文本处理1
本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。
Hadoop大数据处理实战
第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大数据处理实战)Hadoop的IO操作.pdf第五章(Hadoop大...
hadoop
在VMWare中安装好Linux操作系统,并自动配置好VMWare tools后。 需要设置共享文件夹以便与windows系统互相传输文件,Hadoop安装配置流程图解
Hadoop海量数据处理 Hadoop海量数据处理 Hadoop海量数据处理
基于物联网服务平台的海量传感信息Hadoop处理方法和系统设计
hadoop完整安装流程,附有所有图片,适合新手,一看就会。
hadoop海量数据处理技术详解,包括hdfs、MapReduce、hive、sqoop等相关技术和伪代码,代码是使用python语言写的。
hadoop海量数据处理.pdfhadoop海量数据处理.pdfhadoop海量数据处理.pdfhadoop海量数据处理.pdfhadoop海量数据处理.pdfhadoop海量数据处理.pdf
Hadoop的小图片处理技术及其在人脸特征提取上的应用
Hadoop大数据处理技术基础与实践(第2版)(微课版)PPT-课件.rar
1. 本书以大数据处理系统的三大关键要素---“存储”、“计算”、“容错”为起点,深入浅出的介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务 2. 本书不仅包含了使用Hadoop进行大数据处理的实践性知识和...
Hadoop大数据处理讲义-C1.海量数据处理概论