Closed yongxingMa closed 5 months ago
问题已解决在这里记录一下吧 通过docker stats命令查看,PID进程一直在900多,不超过1000,而正常运行的容器都是1200多。 查看配置文件,原因是被K8S的kubelet 配置限制了,podPidsLimit: 设置了1000. 修改podPidsLimit: 10000后正常运行了。参考下面的配置文件 vi /etc/kubernetes/kubeadm-config.yaml
kind: KubeletConfiguration
cgroupDriver: systemd
clusterDNS:
- 169.254.25.10
clusterDomain: cluster.local
evictionHard:
memory.available: 5%
pid.available: 10%
evictionMaxPodGracePeriod: 120
evictionPressureTransitionPeriod: 30s
evictionSoft:
memory.available: 10%
evictionSoftGracePeriod:
memory.available: 2m
featureGates:
CSIStorageCapacity: true
ExpandCSIVolumes: true
RotateKubeletServerCertificate: true
TTLAfterFinished: true
kubeReserved:
cpu: 200m
memory: 250Mi
maxPods: 110
podPidsLimit: 10000
rotateCertificates: true
systemReserved:
cpu: 200m
memory: 250Mi
使用kubeadm init phase kubelet-start 重启
问题描述 / Problem Description 根据Dockerfile构建的镜像以后,使用docker命令启动成功,访问正常。 docker执行命令如下:
docker run -d --gpus all -v /home/chatglm3-6b:/Langchain-Chatchat/chatglm3-6b -p 8501:8501 registry.cn-hangzhou.aliyuncs.com/smart33690/chat-chatglm36b:0.6
使用k8s部署如下:
部署启动后报错信息如下:
大家是否有类似场景,或解决过类似问题吗?欢迎一起交流讨论。