curl -O https://arthas.aliyun.com/arthas-boot.jar
JAVA -jar arthas-boot.jar
启动Arthas
Dashboar图
Thread 命令图
4 问题排查
项目正常发布,在测试环境启动正常,在测试环境机房发布启动正常,但是到了预发环境机房启动发现是启动到一半卡住,现象如下:
服务启动到一般卡住
第一反应是预发环境的内存不够导致无法启动(当时服务器上只剩不到700M内存,去其他机器看该服务正常需要1个G内存),日志输出卡住,于是调整内存进行发布,结果调整到了1.2g多还是不行. 于是转换思路,开始排查gconfig和nacos这些在线程状态中是timewating的状态.
使用Arthas命令查看thread现场状态
经过排查这些都是属于非主线程阻塞.
开始另外换思路, 开始排查主线程中的在运行堆栈信息,由于main线程的id是1, 使用arthas中的 thread 1 命令
至此找到问题点,主线程一直在创建webservice连接卡住,没有执行其他的任务
解决办法是进行注释掉,后重新发布正常。
总结,