阿里妹导读
本文记录一次glibc导致的堆外内存泄露的排查过程。
问题现象
团队核心应用每次发布完之后,内存会逐步占用,不重启或者重新部署就会导致整体内存占用率超过90%。
发布2天后的内存占用趋势
探索原因一
堆内找到原因
出现这种问题,第一想到的就是集群中随意找一台机器,信手dump一下内存,看看是否有堆内存使用率过高的情况。
内存泄露
泄露对象占比
发现 占比18.8%
问题解决
是common-division这个包引入的
暂时性修复方案