Open Marc-marc-marc opened 6 years ago
J'ai enlevé osm5 et osm6 de la liste, vu que ces machines n'existent plus.
J'ai monté la ram pour osm127 de 1Go à 2Go.
outre la correction de petites anomalies, en gain de perf, on a https://munin.openstreetmap.fr/osm26.openstreetmap.fr/osm127.openstreetmap.fr/munin_stats.html
j'ai mis à jour ci-dessus la liste encore partielle des anomalies rencontrées
passer en mode RRDCached et/ou commit=300 sur la partition
<-- c'est quoi cette option ?
RRDCached est un daemon qui s'intercale entre munin et les fichiers rrd. http://guide.munin-monitoring.org/en/latest/master/rrdcached.html il apporte un gain a 2 niveaux :
commit=300 est un paramètre possible sur les partitions ext3&4 il spécifie le temps maxi que l'os est autorisée à reporter les écritures vers le disque (5 sec en valeur par défaut)
l’extrême lenteur dans la récupération des infos de osm27&osm138 est du au fait que la résolution dns fournit l'ipv6 en premier qui échoue en timeout ~2min puis test en ipv4 qui réussit. en voulant ajouter l'ipv4 dans /etc/hosts sur osm127 j'ai constaté que plusieurs serveurs avait l'ip privée renseignée. j'ai fait de même pour osm138 sur osm127, test ok pour osm27 l'ip privée ne répond pas, j'ai ajouté l'ipv4, test ok une autre solution est évidement de modifier les fw pour autoriser les 2 depuis les ip d'osm127 la différence https://munin.openstreetmap.fr/munin-cgi/munin-cgi-graph/osm26.openstreetmap.fr/osm127.openstreetmap.fr/munin_update-day.png
après discussion avec @jocelynj maj de la vm de debian 8.10 en 9.4 seul le paquet atop pose problème, je l'ai temporairement supprimé.
J'ai cette modif dans ansible pour atop et debian 9.4: https://github.com/osm-fr/ansible-scripts/blob/master/roles/common/tasks/main.yml#L43
le lien existait sur osm127 mais l'installation échoue quand même : lrwxrwxrwx 1 root root 9 Apr 23 23:48 /etc/systemd/system/atopacct.service -> /dev/null
la cause est que le patch est fait pour systemd alors que osm127 est toujours en init
J'ai fais un update-rc.d atopacct disable
ce qui a résolu le problème pour atop
reste à comprendre pq osm127 démare en init au lieu de systemd
~10% de gain de temps d'exécution après l'upgrade
mais la vm ne voulait pas redémarer, init restait bloqué en init 6
un arrêt des services à la main puis /sbin/reboot -d -f
a fait l'affaire
je bascule en mode html_strategy cgi
rajout de qlq entrées dans /etc/hosts suppression osm119 (vm sur osm11 selon fichier ansible mais inaccessible + absente du wiki) suppression osm129 (vm sur osm28 selon fichier ansible mais inaccessible + absente du wiki + inexistante sur osm26/27/28) osm111 osm131 ne répondent pas (problème fw ou munin-node absent, mon accès ne fonctionne pas) désactivation temporaire osm200/201/202/205/206/207 (backend osmose) : absent du dns + ip privée non accessible
osm200/osm201/osm202 : utilisation ssh + ProxyJump + Hostname pour résoudre à la fois l'incessibilité directe et l'absence de l'entrée dans le dns Utilise pour le moment mon compte sur ces 3 vm vu le manque de droit pour ajouter la clef ssh au compte munin. A faire :
liste des modifs faites ou à faire dont certaines sont à transformer en ansible :)
Stats avant modif : munin-update 240sec + munin-limits 2sec + munin-graph 80sec + munin-html 60sec = 382sec toutes les 300sec :( Stats après modif : munin-update 150sec + munin-limits 2sec + munin-graph 0sec + munin-html 57sec = 209sec toutes les 300sec