osm-fr / infrastructure

Handle tickets against osm-fr infrastructure
MIT License
21 stars 4 forks source link

alarme lorsque munin n'arrive pas à joindre une destination #441

Open Marc-marc-marc opened 1 year ago

Marc-marc-marc commented 1 year ago

Les graphes munin ne se mettaient plus à jour, donc pas de rouge dans le tableau d'alarme. C'est l'IPv6 qui ne routait plus. Y aurait-il un moyen pour détecter les host/vm injoignables par munin et les remonter d'une façon ou d'une autre en alarme ?

Originally posted by @cquest in https://github.com/osm-fr/infrastructure/issues/438#issuecomment-1518686823

Marc-marc-marc commented 1 year ago

techniquement oui mais je doute de la pertinance vu la 100aine d'alerte pas jour, volume ingérable. mais j'en fais un ticket si quelqu'un ssouhaite coder l'alarme vu que cela te semble utile

cquest commented 1 year ago

Je verrai bien tout en rouge sur les hosts/VM injoignables sur le dashboard principal, car oui, les alertes par mail c'est ingérable vue leur granularité.

Si le mail d'alerte sortait au bout de N erreurs, ça serait plus gérable.

Marc-marc-marc commented 1 year ago

Je verrai bien tout en rouge sur les hosts/VM injoignables sur le dashboard principal, car oui, les alertes par mail c'est ingérable vue leur granularité.

je ne connais aucune option de ce genre dans munin, cela nécessiterait d'écrire plus de code qu'une simple alerte

Si le mail d'alerte sortait au bout de N erreurs, ça serait plus gérable.

c'est une possibilité en effet