SocialGouv / support

Support de l'activité des startups SocialGouv
http://socialgouv.github.io/support
7 stars 5 forks source link

OVH-DEV requests/limits à corriger/améliorer #532

Open achauve opened 8 months ago

achauve commented 8 months ago

Contexte

Les serveurs qui composent le cluster de DEV sur OVH tombent souvent.

l'hypothèse probable sur la cause est lié à la charge des noeuds :

De faibles requests sur kubernetes lui donnent la possibilité de positionner plus de ressources que ce que le noeud et capable de supporter lorsque les PODs sont en fonctionnement nominal.

Pour préserver les noeuds nous devons limiter la sur allocation de ressources. Cela peut se faire via la mise en place de requests et limits pour informer kubenetes de la charge à prévisible sur le noeud

La mise en place de priorityClass est une seconde étape qui permettra de prioriser un déploiement par rapport à la kubelet et définir l'ordre de priorité de survis d'un POD sur kurbenetes.

Démarche de résolution

Valider l'hypothése :

Aller plus loin :

taille des noeuds actuelle : 8cpu et 30Go

gary-van-woerkens commented 8 months ago