JVM常见问题排查方案

Posted by KANG's BLOG on Tuesday, August 16, 2022

一、主动分析

1. 分析CPU占用高的情况

  1. 查看CPU占用情况

    top

  2. 查看具体占用CPU的线程

    top -H -p <pid>

  3. 查询线程运行快照

    jstack <pid>

在该快照中可以搜索16进制的线程号,来查看运行代码位置

2. 查询内存占用情况

查询jvm中对象数量和大小

jmap -histo:live <pid>

image-20220718112205114

PS: 该命令会触发GC

3. 查看GC情况

通过jstat查看GC情况

jstat -gcutil <pid>

image-20220718112556207

通过jmap查看jvm中堆内存占用详情

jmap -heap <pid>

jhsdb jmap --pid <pid> --heap(JDK9以上)

image-20220718112535689

二、错误日志分析

1. dump日志

如果打印dump日志方法

  • 在jvm启动的参数中,新增 jvm参数-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/logs/java.hprof。这样在发生jvm 内存溢出时,就会直接dump出java.hprof 文件了

  • 使用jmap导出jvm内存信息

    jmap -dump:format=b,file=/home/admin/logs/heap.hprof  javapid
    
  • jstack可以查看当前java进程的dump信息

    jstack <pid>
    

dump日志分析

  • “http-nio-8081-exec-10” 线程名称
  • #25 线程编号
  • daemon 线程的类型
  • prio=5 线程的优先级别
  • os_prio=0 系统级别的线程优先级
  • tid=0x00007f87e028c000 线程ID
  • nid=0x6724 native线程的id
  • waiting on condition [0x00007f87b97d2000] 线程当前的状态

线程状态

状态 说明
NEW 未启动的。不会出现在Dump中。
RUNNABLE 在虚拟机内执行的。运行中状态,可能里面还能看到locked字样,表明它获得了某把锁
BLOCKED 受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了
WATING 无限期等待另一个线程执行特定操作。等待某个condition或monitor发生,一般停留在park(), wait(), sleep(),join() 等语句里
TIME_WATING 有时限的等待另一个线程的特定操作。和WAITING的区别是wait() 等语句加上了时间限制 wait(timeout)
TERMINATED 已退出的

方法调用修饰

  • locked: 成功获取锁
  • waiting to lock:还未获取到锁,在进入去等待;
  • waiting on:获取到锁之后,又释放锁,在等待区等待;
  • parking to wait for:等待许可证; (参考LockSupport.park和unpark操作)

2. core文件

当linux中进程崩溃时,linux会将程序当时的内存快照记录下来,保存到一个文件中,这个文件就是core文件。除了内存信息,还会记录寄存器信息(包括程序指针、栈指针等)、内存管理信息、其他处理器和操作系统状态和信息。

core文件存储位置

通过cat /proc/sys/kernel/core_pattern命令可以查看core文件保存的位置和文件名格式

image-20220718105035321