osm-fr / infrastructure

Handle tickets against osm-fr infrastructure
MIT License
21 stars 4 forks source link

liste des modifs munin #30

Open Marc-marc-marc opened 6 years ago

Marc-marc-marc commented 6 years ago

liste des modifs faites ou à faire dont certaines sont à transformer en ansible :)

Stats avant modif : munin-update 240sec + munin-limits 2sec + munin-graph 80sec + munin-html 60sec = 382sec toutes les 300sec :( Stats après modif : munin-update 150sec + munin-limits 2sec + munin-graph 0sec + munin-html 57sec = 209sec toutes les 300sec

jocelynj commented 6 years ago

J'ai enlevé osm5 et osm6 de la liste, vu que ces machines n'existent plus.

J'ai monté la ram pour osm127 de 1Go à 2Go.

Marc-marc-marc commented 6 years ago

outre la correction de petites anomalies, en gain de perf, on a https://munin.openstreetmap.fr/osm26.openstreetmap.fr/osm127.openstreetmap.fr/munin_stats.html

j'ai mis à jour ci-dessus la liste encore partielle des anomalies rencontrées

jocelynj commented 6 years ago

passer en mode RRDCached et/ou commit=300 sur la partition <-- c'est quoi cette option ?

Marc-marc-marc commented 6 years ago

RRDCached est un daemon qui s'intercale entre munin et les fichiers rrd. http://guide.munin-monitoring.org/en/latest/master/rrdcached.html il apporte un gain a 2 niveaux :

commit=300 est un paramètre possible sur les partitions ext3&4 il spécifie le temps maxi que l'os est autorisée à reporter les écritures vers le disque (5 sec en valeur par défaut)

Marc-marc-marc commented 6 years ago

l’extrême lenteur dans la récupération des infos de osm27&osm138 est du au fait que la résolution dns fournit l'ipv6 en premier qui échoue en timeout ~2min puis test en ipv4 qui réussit. en voulant ajouter l'ipv4 dans /etc/hosts sur osm127 j'ai constaté que plusieurs serveurs avait l'ip privée renseignée. j'ai fait de même pour osm138 sur osm127, test ok pour osm27 l'ip privée ne répond pas, j'ai ajouté l'ipv4, test ok une autre solution est évidement de modifier les fw pour autoriser les 2 depuis les ip d'osm127 la différence https://munin.openstreetmap.fr/munin-cgi/munin-cgi-graph/osm26.openstreetmap.fr/osm127.openstreetmap.fr/munin_update-day.png

Marc-marc-marc commented 6 years ago

après discussion avec @jocelynj maj de la vm de debian 8.10 en 9.4 seul le paquet atop pose problème, je l'ai temporairement supprimé.

jocelynj commented 6 years ago

J'ai cette modif dans ansible pour atop et debian 9.4: https://github.com/osm-fr/ansible-scripts/blob/master/roles/common/tasks/main.yml#L43

Marc-marc-marc commented 6 years ago

le lien existait sur osm127 mais l'installation échoue quand même : lrwxrwxrwx 1 root root 9 Apr 23 23:48 /etc/systemd/system/atopacct.service -> /dev/null

la cause est que le patch est fait pour systemd alors que osm127 est toujours en init J'ai fais un update-rc.d atopacct disablece qui a résolu le problème pour atop

reste à comprendre pq osm127 démare en init au lieu de systemd

Marc-marc-marc commented 6 years ago

~10% de gain de temps d'exécution après l'upgrade mais la vm ne voulait pas redémarer, init restait bloqué en init 6 un arrêt des services à la main puis /sbin/reboot -d -f a fait l'affaire

je bascule en mode html_strategy cgi

Marc-marc-marc commented 6 years ago

rajout de qlq entrées dans /etc/hosts suppression osm119 (vm sur osm11 selon fichier ansible mais inaccessible + absente du wiki) suppression osm129 (vm sur osm28 selon fichier ansible mais inaccessible + absente du wiki + inexistante sur osm26/27/28) osm111 osm131 ne répondent pas (problème fw ou munin-node absent, mon accès ne fonctionne pas) désactivation temporaire osm200/201/202/205/206/207 (backend osmose) : absent du dns + ip privée non accessible

Marc-marc-marc commented 6 years ago

osm200/osm201/osm202 : utilisation ssh + ProxyJump + Hostname pour résoudre à la fois l'incessibilité directe et l'absence de l'entrée dans le dns Utilise pour le moment mon compte sur ces 3 vm vu le manque de droit pour ajouter la clef ssh au compte munin. A faire :

Marc-marc-marc commented 1 year ago