JVM实战系列之CPU100%和内存100%排查
1. 基础概念
- 内存溢出(Memory Overflow)指的是程序在申请内存时,向操作系统申请了一块内存空间,但由于某种原因(如程序错误、缺乏足够的内存等),导致程序使用的内存超过了申请到的内存大小。这会导致程序崩溃或者出现未定义的行为。
- 内存泄漏(Memory Leak)指的是程序在动态分配内存后,没有及时释放已经不需要的内存空间,导致系统中存在大量无用的内存占用,最终可能会导致系统的性能下降或者耗尽可用内存资源。
可以这样理解:内存溢出是指程序需要的内存超过了可用内存;而内存泄漏则是指程序本身的内存管理不当,使用了系统提供的内存却没有及时释放。
2. 内存100%案例
堆内存溢出代码示例:
private static List<byte[]> CACHE = new ArrayList<>(1000);
@GetMapping("/tuningTest")
public String tuningTest(){
for (int loopTimes = 1; loopTimes < 20; loopTimes++) {
long cacheSize = ObjectSizeCalculator.getObjectSize(CACHE);
LOGGER.info("第 {} 次循环前, 对象已占用 {} M 内存", loopTimes, cacheSize / 1024 / 1024);
// 每次占用5M内存
CACHE.add(new byte[5 * 1024 * 1024]);
}
return "OK";
}
启动参数:java -jar -Xms32m -Xmx64m -XX:PermSize=15M -XX:MaxPermSize=30M jvmtest-0.0.1-SNAPSHOT.jar
测试时为了效果明显可以用压测工具,并发数20,轮次1000。更有助于分析问题
2.1 top 命令查看cpu和内存情况
2.2 jmap -heap PID查看jvm内存使用情况
从图中可以看出老年区的内存使用率已经达到了96%
2.3 jstat -gc PID 查看GC的情况
- YGC : YG GC的次数
- YGCT:YG GC的平均时间
- FGC: FULL GC的次数
- FGCT:FULL GC的平均时间
这里可以连续看几次就会发现FULL GC的次数在疯狂增长,而且FULL GC的平均时间也会增长,这就是CPU100%的原因,因为CPU一直在尝试垃圾回收
2.4 jmap -dump:format=b,file=./jmap_dump.hprof PID 使用jmap命令生成分析所需要用的dump文件。
使用Jprofiler打开(为什么不用mat,因为我没安装上,不知道为啥)
如上图已经定位出来了问题,这个工具还是很好用的,有兴趣的大佬们可以研究研究
3. CPU100%案例
代码示例
/**
* 死循环
*
* @return
*/
@RequestMapping("/deadCycle")
public String deadCycle() {
for (int i = 1; i > 0; i++) {
System.out.println(i);
}
return "Success";
}
/**
* 死锁
*
* @return
*/
@RequestMapping("/deadLock")
public String deadLock() {
Lock lock1 = new ReentrantLock();
//线程t1中
new Thread(() -> {
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
while (!lock1.tryLock()) {
System.out.println("线程1 一直自旋获取锁");
}
System.out.println("线程1 获取到锁 do something");
}).start();
// 线程2
new Thread(() -> {
lock1.lock(); //此时线程2 获取到锁 但是一直阻塞 导致锁无法释放
while (true) {
}
}).start();
return "Success";
}
这里就整一个最简单里例子,目的就是为了让CPU一直在运算。
3.1 top 命令查看CPU占用100%的进程号
3.2 top -H -n 1 -p PID 然后通过命令查找对应进程下线程的状态
3.3 然后通过 jstack -l PID > ./jstack.log 命令输出进程的线程文件
jstack.log的文件PID是十六机制,从3.2步骤中我们可以看出PID为25778的线程CPU特别高,25778二机制为0x64b2。拿到16进制去文件里搜索能够很明确看出哪里出现了问题
JVM实战系列之CPU100%和内存100%排查
转载自:https://juejin.cn/post/7240065163485855805