alibaba / nacos

an easy-to-use dynamic service discovery, configuration and service management platform for building cloud native applications.
https://nacos.io
Apache License 2.0
30.04k stars 12.8k forks source link

nacos容器部署进程回收不掉 #11462

Closed yanshicheng closed 9 months ago

yanshicheng commented 9 months ago

在k8s集群跑的 nacos-server:v2.2.3 运行一段时间查询进程 168 Ssl 112****5 JRaft-Rpc-Closu 这个睡眠进程有上百,请问这个是 bug吗,导致服务负载飙升。 34 Ssl 116212 JRaft-RPC-Proce 这个进程也有几十个

KomachiSion commented 9 months ago

是线程还是进程, 如果是进程的话,我没有见过这个进程,不知道其他人是否有见过。

但是看你描述,如果线程/进程是睡眠的状态,应该不会影响负载。

yanshicheng commented 9 months ago

root 116212 116189 3 Dec01 ? 02:17:22 /usr/lib/jvm/java-1.8.0-openjdk/bin/java -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:CMSInitiatingOccupancyFraction=70 -XX:+CMSParallelRemarkEnabled -XX:SoftRefLRUPolicyMSPerMB=0 -XX:+CMSClassUnloadingEnabled -XX:SurvivorRatio=8 -XX:-UseParNewGC -server -Xms1g -Xmx1g -Xmn512m -XX:MetaspaceSize=128m -XX:MaxMetaspaceSize=320m -XX:-OmitStackTraceInFastThrow -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/nacos/logs/java_heapdump.hprof -XX:-UseLargePages -Dnacos.core.auth.enabled=true -Dnacos.preferHostnameOverIp=true -Dnacos.member.list= -Xloggc:/home/nacos/logs/nacos_gc.log -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=10 -XX:GCLogFileSize=100M -Dloader.path=/home/nacos/plugins,/home/nacos/plugins/health,/home/nacos/plugins/cmdb,/home/nacos/plugins/selector -Dnacos.home=/home/nacos -jar /home/nacos/target/nacos-server.jar --spring.config.additional-location=file:/home/nacos/conf/ --spring.config.name=application --logging.config=/home/nacos/conf/nacos-logback.xml --server.max-http-header-size=524288 这是 JRaft-RPC-Proce 的进程信息

yanshicheng commented 9 months ago

上周重建的目前很正常,当时的系统负载有八九十,重建了 nacos pod 就好了。请问进程线程有没有控制参数,如何追踪下问题

yanshicheng commented 9 months ago
image

线程 200多正常吗

KomachiSion commented 9 months ago

一般线程数都是按照CPU核数*一个倍数来制定的, 看线程名称应该是Jraft使用的线程。应该用的是sofa-jraft的默认值。

200多个线程时整个进程200吗? 如果整个进程200个线程时正常的。

KomachiSion commented 9 months ago

No more response from author, and current information is not enough to find problem.