有一个历史遗留系统A,因为一些业务原因,申请了很大的redis内存。从40G一路加到了80G。但是仍然经常告警,达到了max_memory。
联系系统用户,删除了大量数据。查看内存,仍然处于紧张状态。
查了一些资料。
我们查询redis的内存使用:
info memory
used_memory Redis:分配器分配的内存量,也就是实际存储数据的内存总量
used_memory_human:以可读格式返回 Redis 使用的内存总量
used_memory_rss:从操作系统的角度,Redis进程占用的总物理内存
used_memory_peak:内存分配器分配的最大内存,代表used_memory的历史峰值
used_memory_peak_human: 以可读的格式显示内存消耗峰值
used_memory_lua:Lua引擎所消耗的内存
mem_fragmentation_ratio:used_memory_rss /used_memory比值,表示内存碎片率
mem_allocator:Redis 所使用的内存分配器。默认: jemalloc
计算公式如下:
used_memory = 自身内存+对象内存+缓冲内存+lua内存
used_rss = used_memory + 内存碎片
如下图所示:
3.1.2 内存分析
可能出现的问题排查
redis --bigkeys:可以对redis整个 keyspace 进行统计(数据量大时采样,调用 scan 命令),寻找每种数据类型较大的 keys,给出数据统计 redis-cli --bigkeys -i 0.1 -h 127.0.0.1
如果是因为缓冲区问题,会从info clients找到明显问题。重点观察是否明显的omem大于0的情况。
本次遇到的问题是客户端缓冲区问题,使用如下命令
redis-cli -c -h x.x.x.x -p 6398 -a xxxx client list | grep -v 'omem=0'
查询缓冲器非0的客户端
发现有一个客户端持有了大量内存缓冲。将对应的应用重启后。内存使用量一下子降下来了。