Ljohn001 / blogs

Github Pages: https://www.ljohn.cn/
0 stars 0 forks source link

容器宿主机故障检测及节点自愈 | Ljohn's Blog #21

Open Ljohn001 opened 1 year ago

Ljohn001 commented 1 year ago

https://www.ljohn.cn/2023/04/23/rong-qi-su-zhu-ji-gu-zhang-jian-ce-ji-jie-dian-zi-yu/

背景在 Kubernetes 集群运行时,节点有时会因为组件问题、内核死锁、资源不足等原因不可用。Kubelet 默认对节点的 PIDPressure、MemoryPressure、DiskPressure 等资源状态进行监控,但是存在当 Kubelet 上报状态时节点已处于不可用状态的情况,甚至 Kubelet 可能已开始驱逐 Pod。在此类场景下,原生 Kubernetes 对节点健康的检测机