`
woodding2008
  • 浏览: 285834 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

硬件故障导致Hbase RegionServer CPU飚高

 
阅读更多

 

场景介绍       

      国庆期间Hbase集群有一台RegionServer a02机器的内存故障原因导致下线,集群在少一台的情况下运行正常,节后a02机器内存故障修复后重新加入集群提供服务,几乎同时发现集群另外一台a04的CPU使用率高居不下, 按照常理分析集群恢复至最初状态,应该会运行良好,实际上却是a04的CPU使用率一路飚高。

 

问题初步排查

  • Region数据排查,集群Region数量均衡,并无发现异常
  • GC日志分析,发现Parnew频率有增加,1天20-30次,与其他机器比偏高
  • RegionServer日志排查,也没有发现异常输出
  • 配合网卡、磁盘IO等也没有发现什么端倪,RPC处理队列变大

 

调整思路

   软件没问题,是不是硬件有问题,同一批机器硬件型号一致,极有可能内存或其他硬件也有问题。经过运维同学排查,这台机器的内存的确有问题,更换内存后CPU使用率一泻千里,与其他机器CPU使用率持平,最终确认为硬件故障。

 

 

 

分析GC的收获

通过几个月的GC日志分析,发现8月初GC频率一下子密集起来,与其他RegionServer的Gc情况对比,发现症状时间点相同,下一步需要验证这个点发生了什么重大事件。通常的处理方案有两种调优GC以及扩容集群分摊压力。

 

GC调优方案

1、JVM参数调优

2、启用MemStoreChunkPool达到优化GC目的

官网介绍:https://issues.apache.org/jira/browse/HBASE-8163

MSLAB提升HBASE GC性能:http://blog.csdn.net/map_lixiupeng/article/details/40914567

 

 

 

 

 

  • 大小: 244.7 KB
  • 大小: 23.5 KB
分享到:
评论

相关推荐

    HBase配置

    HBase配置

    hbase性能调优

    hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB,比如大的put、使用缓存的scans)的时候,如果该值设置过大则会占用过多的内存,...

    hbase 启动regionserver日志报错: Wrong FS: hdfs:// .regioninfo, expected: file:///

    NULL 博文链接:https://bnmnba.iteye.com/blog/2322332

    HBase集群中RegionServer崩溃后的快速恢复措施探索

    主要介绍了HBase RegionServer与Zookeeper间的交互过程,阐述RegionServer崩溃后的恢复机制,并...优化后的恢复措施大大缩短了RegionServer崩溃后的故障恢复时间和业务中断时间,从而提高了HBase集群的稳定性和可靠性。

    HbaseTemplate 操作hbase

    java 利用 sping-data-hadoop HbaseTemplate 操作hbase find get execute 等方法 可以直接运行

    Hbase中文文档

    12. 故障排除和调试 HBase 12.1. 通用指引 12.2. Logs 12.3. 资源 12.4. 工具 12.5. 客户端 12.6. MapReduce 12.7. NameNode 12.8. 网络 12.9. RegionServer 12.10. Master 12.11. ZooKeeper 12.12. Amazon EC2 ...

    Hbase入门教程-高级查询_02

    本文接着上期介绍的”简单了解Hbase及快速入手之入门教程_01“,着重介绍了hbase的伪分布式部署以及hbase的过滤器。适合刚入门或者刚接触的小伙伴参考。

    Hbase源码笔记资料.zip

    hive编译,jars,HBaseScanner构建.pptx,HBase之RegionServer命令启动流程.pptx,扩展.docx,尚硅谷大数据技术之HBase.xmind,尚硅谷大数据技术之HBase.pdf等等 很全。

    pinpoint的hbase初始化脚本hbase-create.hbase

    搭建pinpoint需要的hbase初始化脚本hbase-create.hbase

    HBase分布式架构处理大数据量(高并发和实时处理)

    本文来自于csdn,介绍了Hadoop的原理,HBase的特点,HBase 的高并发和实时处理数据,数据模型...它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Lar

    HBase数据库设计.doc

    1. HBase有哪些基本的特征? 1 HBase特征: 1 2. HBase相对于关系数据库能解决的问题是什么? 2 HBase与关系数据的区别? 2 HBase与RDBMS的区别? 2 3. HBase的数据模式是怎么样的?即有哪些元素?如何存储?等 3 1...

    高可用HBase的技术实践

    阿里巴巴高级技术专家讲述高可用HBase的技术实践的案例

    HBase(hbase-2.4.9-bin.tar.gz)

    HBase(hbase-2.4.9-bin.tar.gz)是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System...

    Hbase 高可用分布式搭建

    Hbase 高可用分布式搭建,详细版

    java大数据作业_3HBase

    2. 请简述HBase中数据写入最后导致Region分裂的全过程 3. 如果设计一个笔记的表,表中要求有笔记的属性和笔记的内容,怎么做 4. HBase部署时如何指定多个zookeeper 5. HBase shell是基于哪种JVM运行的语言实现的 6. ...

    HBase高可用HA.pdf

    HBase 高可用HA

    HBase学习利器:HBase实战

    HBase开发实战,HBase学习利器:HBase实战

Global site tag (gtag.js) - Google Analytics