osm-fr / infrastructure

Handle tickets against osm-fr infrastructure
MIT License
22 stars 4 forks source link

wms.openstreetmap.fr erreur 502 #535

Closed flacombe closed 7 months ago

flacombe commented 7 months ago

Bonsoir

Les couches services par https://wms.openstreetmap.fr, dont les vues Enedis sont inaccessibles. Le serveur renvoi une erreur 502.

Est-ce déjà tracé dans une autre issue ?

jocelynj commented 7 months ago

Le containeur a été tué par proxmox à ce qu'on dirait:

command 'lxc-stop -n 107 --kill' failed: received interrupt

TASK ERROR: received interrupt

Et le démarrage foire - je creuse.

jocelynj commented 7 months ago

Après investigation, le CT a crashé brutalement le 5 février, et a laissé un process zombie:

www-data  800607  0.6  0.0      0     0 ?        Zl   Feb05  28:36 [apache2] <defunct>

Ce process bloque le cgroup /sys/fs/cgroup/lxc/107/ns/system.slice/apache2.service, ce qui empêche lxc de démarrer ce CT 107.

Je ne vois pas d'autre solution que de redémarrer, ce que @cquest prévoit de faire sous peu.

flacombe commented 7 months ago

Merci @jocelynj d'avoir regardé, bonne soirée !

XandrexOSM commented 7 months ago

Le serveur a été redémarré, c'est OK je vois les tuiles dans JOSM. Merci @cquest !

XandrexOSM commented 7 months ago

j'ai à nouveau des erreurs HTTP 502.

XandrexOSM commented 7 months ago

les erreurs HTTP 502 sont encore présentes aujourd'hui. Y a-t-il une date approx de remise en service, s'il vous plaît ?

jocelynj commented 7 months ago

La VM a planté a nouveau dans la semaine, et ne peut pas être redémarrée, suite à erreur côté lxc (la même que la dernière fois). Pas vraiment de solution à proposer, parce que rebooter le serveur à chaque fois n’est pas envisageable.

@cquest : faudrait-il réinstaller la VM ailleurs ?

XandrexOSM commented 7 months ago

possible de programmer la VM pour qu'elle se redémarre périodiquement de façon pré-emptive ? Genre quotidiennement ?

cquest commented 7 months ago

Je mettrai bien wms.openstreetmap.fr sur un serveur Moji, sur lequel on pourra avoir des disques de stockage adaptés pour la volumétrie des orthos.

Actuellement à TH3 on a des machines assez puissantes pour servir les flux WMS, mais qui n'ont pas assez de stockage, celui-ci étant fait sur osm32 qui est un serveur de stockage mais avec peu de ressources CPU et accédé par NFS... qui n'est peut être pas sans rapport avec nos plantages.

Les T630 de Moji, permettent d'avoir la capacité de stockage et le CPU sur la même machine.

cquest commented 7 months ago

wms.openstreetmap.fr temporairement relancé depuis ma cave...

cquest commented 7 months ago

Suite... https://github.com/osm-fr/infrastructure/issues/543