etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
198 stars 30 forks source link

Suivi du swap sur le worker #3750

Closed thbar closed 8 months ago

thbar commented 10 months ago

La présence d'une mémoire swap est importante sur prod-worker car sans ça, certains jobs vont crasher au niveau mémoire.

La mise en place est une manipulation manuelle via CleverCloud.

J'ai vu lors d'un resize (#3738) du container prod-worker que ça semblait sauter au passage.

Aujourd'hui on a quelque chose pour le suivi en théorie, mais je ne suis pas sûr à la date d'aujourd'hui de la fiabilité du chiffre affiché:

https://workers.transport.data.gouv.fr/health-check/metrics

available_memory: 7229607936 (6.73 GB)
buffered_memory: 144879616 (138.17 MB)
cached_memory: 1467219968 (1.37 GB)
free_memory: 5835395072 (5.43 GB)
free_swap: 0 (0 B)
system_total_memory: 8325320704 (7.75 GB)
total_memory: 8325320704 (7.75 GB)
total_swap: 0 (0 B)

Il serait probablement souhaitable d'avoir un test ops qui vérifie ce point, une fois que le capteur sera vérifié.

Je crois que le swap a re-sauté d'ailleurs, il faudra que je recontacte le support et qu'on verrouille ça mieux pour ne pas perdre autant de temps en allers-retours.

thbar commented 8 months ago

Il n'y a pas de swap conservé après un reboot... Donc voilà.