背景 TLDR;
垃圾回收器的暂停问题对实时响应要求较高的服务来说,一直是个痛点, CMS和G1等主流垃圾回收器的数十毫秒乃至上百毫秒的暂停时间相当致命。 此外,调优门槛也相对较高,需要对垃圾回收器的内部机制有一定的了解,才能够进行有效的调优。 随着ZGC的出现, 使得这一痛点彻底解决, ZGC 最初在 JDK 11 中作为实验性功能引入,并在 JDK 15 中宣布为生产就绪, 由于JDK17才是比较正式提供给大众实用的LTS支持版本,而且一部分公司已经在使用,所以本文力推JDK17。
ZGC 作为一款低延迟垃圾收集器,旨在满足以下目标:
- 8MB到16TB的堆大小支持
- 10ms最大GC暂时
- 最糟糕的情况下吞吐量会降低15%(实测,如果参数配置的问题可能更糟, 官方这个稍微吹牛了点, 说实话就是用CPU换GC时间,也没有那么高大上)
升级JDK17的不可拒绝的理由
低延迟的业务需求,毫秒级耗时的GC
据美团的开发说:
在Zeus服务不同集群中,ZGC在低延迟(TP999 < 200ms)场景中收益较大:
- TP999:下降12~142ms,下降幅度18%~74%。
- TP99:下降5~28ms,下降幅度10%~47%。
可以忽略的升级JDK17的理由
- 新版的SpringBoot 官方最低支持 JDK17,想使用新Spring版本,就得升级
- JIT 编译器的增强
- JDK 17 中的新功能,例如 Sealed 类、Pattern Matching、Records 等
- 升级到 JDK 17 可以获得更好的安全性,包括修复的漏洞和强化的安全机制
适用场景
- 网关服务
- Web API
暂不推荐场景: 定时任务、批量任务、高CPU密集型应用
升级前后对比
话不多说,先看效果
环境:
CPU: 4c
Mem: 6GB
G1参数:
-Xmx3500m -Xms3500m -XX:+UseG1GC -XX:MaxGCPauseMillis=100
-XX:G1ReservePercent=10 -XX:ConcGCThreads=2 -XX:ParallelGCThreads=5
-XX:G1HeapRegionSize=16m -XX:MaxTenuringThreshold=14
-XX:SurvivorRatio=8
ZGC参数:
--add-opens=java.base/java.lang=ALL-UNNAMED -Xms3500m -Xmx3500m -XX:ReservedCodeCacheSize=256m -XX:InitialCodeCacheSize=256m -XX:+UnlockExperimentalVMOptions -XX:+UseZGC -XX:ConcGCThreads=1 -XX:ParallelGCThreads=3 -XX:ZCollectionInterval=60 -XX:ZAllocationSpikeTolerance=4 -XX:+UnlockDiagnosticVMOptions -XX:-ZProactive -Xlog:safepoint,classhisto*=trace,age*,gc*=info:file=/opt/gc-%t.log:time,tid,tags:filecount=5,filesize=50m
上述两个参数,均已经在生产环境实验过, 生产环境的机器是单机拥有1500业务tps的机器
GC耗时对比
从上图可见, GC耗时是有着质的区别的,这个区别是你用CMS、Parallel GC、 G1 等呕心沥血也调校不出来的
这么短的GC, 可以保证,应用因为JVM层面的卡顿都保持在1ms 以内, 这也是为啥说这点才是不能拒绝的理由
CPU使用对比
从CPU使用上看, JDK17 相同的代码, 比JDK8要高出10 ~ 20%
升级方法
1. JDK选择或安装
使用JDK17前必须要安装JDK17, 对于不同的Linux发行版或者操作系统安装方法各不相同, 下面给出了一些样例, 仅供参考。
# ubuntu 安装jdk17
sudo apt install openjdk-17-jdk
# docker 基础镜像
docker pull openjdk:17-slim
docker pull openjdk:17-jdk-oraclelinux7
FROM openjdk:17-slim
2. JVM 参数调整
有了JDK17后,你已经具备了让你的Java程序运行在JDK17上的基本条件了,下一步便是配置Jvm 参数如下(有需要的话,可以自行把换行整理下):
--add-opens=java.base/java.lang=ALL-UNNAMED \
-Xms1500m -Xmx1500m \
-XX:ReservedCodeCacheSize=256m \
-XX:InitialCodeCacheSize=256m \
-XX:+UnlockExperimentalVMOptions \
-XX:+UseZGC \
-XX:ConcGCThreads=1 -XX:ParallelGCThreads=2 \
-XX:ZCollectionInterval=30 -XX:ZAllocationSpikeTolerance=5 \
-XX:+UnlockDiagnosticVMOptions -XX:-ZProactive \
-Xlog:safepoint,classhisto*=trace,age*,gc*=info:file=/opt/gc-%t.log:time,tid,tags:filecount=5,filesize=50m \
-XX:+HeapDumpOnOutOfMemoryError \
-XX:HeapDumpPath=/opt/errorDump.hprof
参数释义
参数释义
| 参数名 | 参数含义 |
|---|---|
--add-opens |
JDK9模块化后,导致javabase下面的一些基础包访问权限受阻, 需要开放访问, 默认 设置java.base/java.lang=ALL-UNNAMED 即可 |
-Xms1500m -Xmx1500m |
堆内存设置,非常常见,不解释 |
-XX:ReservedCodeCacheSize=256m |
JIT编译的代码都放在CodeCache中,一般服务64m或128m就已经足够 |
-XX:InitialCodeCacheSize=256m |
初始code cache大小 |
-XX:+UnlockExperimentalVMOptions |
开启实验性质的JVM选项,打开可以解锁更多的JVM设置的能力 |
-XX:+UseZGC |
使用ZGC |
-XX:ConcGCThreads=1 |
并发回收垃圾的线程。默认是总核数的12.5%,8核CPU默认是1。调大后GC变快,但会多占用程序运行时的CPU资源 |
-XX:ParallelGCThreads=2 |
STW阶段使用线程数,默认是总核数的60% |
-XX:ZCollectionInterval=30 |
GC周期之间的最大间隔(单位秒) |
-XX:ZAllocationSpikeTolerance=5 |
增大修正系数-XX:ZAllocationSpikeTolerance,更早触发GC。ZGC采用正态分布模型预测内存分配速率,模型修正系数ZAllocationSpikeTolerance默认值为2 |
-XX:+UnlockDiagnosticVMOptions -XX:-ZProactive |
是否启用主动回收,默认开启,这里的配置表示关闭 |
-Xlog:safepoint,classhisto*=trace,age*,gc*=info:file=/opt/gc-%t.log:time,tid,tags:filecount=5,filesize=50m |
GC日志设置 |
-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/opt/errorDump.hprof |
当发生OOM的时候HEAP DUMP 及其配置 |
注意:本文归作者所有,未经作者允许,不得转载
