标准做法一:OOM触发HeadpDump
目的:
OOM发生时,输出堆栈快照文件,供研发人员分析。
在JVM中,如果98%的时间是用于 GC 且可用的 Heap size 不足2%的时候,将抛出 OOM 异常。
配置操作:
Resin/Tomcat 配置文件里追加 -XX:+HeapDumpOnOutOfMemoryError ,当 OutOfMemoryException 错误发生时,会自动生成 Heap Dump 文件。
同时配置 -XX:HeapDumpPath 指定快照文件的实际路径。
日志分析:
Heap Dump文件的分析,可以使用 Eclipse Memory Analyzer tool(MAT) 分析。
标准做法二:系统负载高触发ThreadDump
目的:
系统负载大于10时,调用 jstack 命令,输出 resin 线程快照,供研发人员分析。
配置操作:
一分钟扫描一次。如果系统的一分钟负载值(load1)大于10,或者80端口的连接数大于80时,进行打印。
日志分析:
Thread Dump文件的分析,可以使用 Thread Dump Analyzer(TDA)分析。
可选做法三:年老代使用率高触发HeapDump
目的:
Java工程的 OU/OC 到报警阈值时,调用 jmap 命令,输出堆栈快照,供研发人员分析。
OC 当前年老代空间容量。Current old space capacity (KB).
OU 年老代利用情况。Old space utilization (KB).
配置操作:
Nagios 监控到特定工程的 OU/OC 大于80%时,自动执行命令:jmap –dump:file={filename},format=b pid
日志分析:
多个Heap Dump文件的对照,使用 VisualVM 的比较内存快照功能。
标准做法四:默认开启GC打印
目的:
打印 GC 详细信息,供研发人员分析。
-XX:+PrintGC:输出形式:[GC 118250K->113543K(130112K), 0.0094143 secs] [Full GC 121376K->10414K(130112K), 0.0650971 secs]
-XX:+PrintGCDetails: 输出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] [GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]
-XX:+PrintGCTimeStamps:输出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]
-Xloggc:filename:输出GC信息到日志文件。
配置操作:
Resin/Tomcat 配置文件里,增加如下参数:
<jvm-arg>-XX:+PrintGCTimeStamps</jvm-arg>
<jvm-arg>-XX:+PrintGCDetails</jvm-arg>
<jvm-arg>-Xloggc:/data/application/%ProjectName%/logs/gc.log</jvm-arg>
郑昀 2013
-over-
赠图一枚:
转自:http://zhengyun-ustc.iteye.com/blog/1947649
相关推荐
JAVA线上问题排查和工具 内容详细 结合实际工作 贴合实际
Java线上故障排查方案(2).pdf
线上故障排查方法记录
Java线上故障排查方案 结合实战,超详细Java线上故障排查方案总结,值得收藏
主要介绍了JAVA线上常见问题排查手段(小结),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
大厂高手骆俊武出品的《漫谈线上问题排查》电子书
线上问题的排查方法及工具手段,对开发或者运维排查线上问题有很大帮助及使用排查问题使用的工具介绍
线上问题排查常用命令,包含linux命令,jstat,jinfo,jps等命令
NULL 博文链接:https://ainn2006.iteye.com/blog/1549724
主要介绍了JAVA线上常见问题排查手段汇总,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
Java诊断利器Arthas排查问题实践.pptx
通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率
JAVA 线上故障排查完整套路,从 CPU、磁盘、内存、网络、GC 一条龙!.docx
线上问题排查思路
将计算机体系结构、操作系统、性能调优、TCP/IP协议栈等核心知识浓缩为180页PPT。架构师看家功底、面试加分项
1. 查一下 xx.xx.16.28 的内存使用情况 2. 排查最近是否有新上线服务,导致内存紧张 3. 排查是否有 Java 服务在持续 FGC 1. 以为
线上故障排查全套路,总有一款适合你线上故障排查全套路,总有一款适合你来自:fredal的博客链接:https://fredal.xin/java-error-c
Java常见问题排查
线上排查思路,一些关于服务器排查的命令与案例