Open igorrenquin opened 1 year ago
@revolunet est-il possible de recetter le ticket et le fermer merci
des alertes sont effectifs sur le canal mattermost un test sur la suppression d'un replica doit être fait
maybe related : https://github.com/cloudnative-pg/cloudnative-pg/issues/1814
yes je suis tombé dessus en cherchant aussi, mais pas de solution claire ? effectivement passer la métrique sur le primary alors qu'on regarde le lag sur les replica ça paraît louche ?
Session de pair afin de parametrer le monitoring cnpg (délai entre le réplica et le primaire) dans la chart helm de l'operateur
TO DO :
SRE
OPS
Comportement normal sur les alertes vérifiées : les données sont MAJ toutes les heures seulement sur ces DBs
https://gitlab.fabrique.social.gouv.fr/infra/apps-infra/-/merge_requests/644/diffs
Ajout d'un filtre sur la PR de julien. Cause de l'erreur : la requête de la métrique s'applique sur tous le cluster CNPG plutôt que sur le noeud master. En attente d'une PR du côté CNPG (nouvelle realease)
Se renseigner pour voir comment être alerté en cas de perte de replicas