Liber-UFPE / upptime

Status page para as aplicações do Laboratório Liber
MIT License
0 stars 0 forks source link

🛑 Liber / Memorial Joaquim Caetano is down #160

Closed marcospereira closed 9 months ago

marcospereira commented 9 months ago

In 8f2fbb2, Liber / Memorial Joaquim Caetano (http://www.liber.ufpe.br/jcaetano/modules/busca/listar_projeto.php?cod=2) was down:

marcospereira commented 9 months ago

Resolved: Liber / Memorial Joaquim Caetano is back up in b5295d7 after 15 minutes.

marcospereira commented 9 months ago

@davidcarlospc, esse repositório tem uma Github Action que executa a cada 5 minutos e verifica esses sites do Liber:

https://github.com/Liber-UFPE/upptime/blob/ec21463727372896dc3081607fdb56156bd17d92/.upptimerc.yml#L4-L26

E tem uma visualização do status aqui: https://liber-ufpe.github.io/upptime/.

Basicamente, checa se as URLs configuradas estão retornando algum erro. Se alguma delas falhar, uma issue é criada, e depois fechada caso o site volte a responder em uma execução seguinte. Imagino que vocês usem algo semelhante, mas criei esse para me dar alguma visibilidade.

Faz sentido para você? Quem olharia os sites para ver se está tudo bem?

davidcarlospc commented 7 months ago

Marcos, desculpa o delay, eu esqueci de te responder logo, depois teve a correria de final de ano recesso, férias rsrs voltei essa semana e achei a mensagem aqui no github. Acho muito bom o git actions, você monitora esses sites do liber?

Como essa máquina do Liber fica num esquema de colocation aqui na UFPE, o pessoal daqui só monitora a VM mesmo. Eu estou começando a dar apoio nos projetos do liber, mas normalmente atuo mais especificamente em alguns projetos, mas acho interessante a ideia, sem dúvida. Se você não monitora, posso criar algo semelhante e deixar tbm com o pessoal lá do Liber olhando.

Aqui na UFPE, em geral, depende, normalmente o pessoal utiliza a Grafana + Zabbix, ou a stack ELK.

marcospereira commented 7 months ago

Oi @davidcarlospc, feliz ano novo!

Marcos, desculpa o delay, eu esqueci de te responder logo, depois teve a correria de final de ano recesso, férias rsrs voltei essa semana e achei a mensagem aqui no github. Acho muito bom o git actions, você monitora esses sites do liber?

Zero bronca! Você jamais me verá reclamar de alguém aproveitando as férias. :-)

Eu não monitor além de ver as issues aqui no Github, porque não tem como eu atuar para resolver os problemas. Criei esse repositório porque acho que o @souzaevrs me falou que não havia uma monitoração mais ativa dos projetos (em termos de dar alguma sinalização que algo está down).

Como essa máquina do Liber fica num esquema de colocation aqui na UFPE, o pessoal daqui só monitora a VM mesmo.

Faz sentido porque é isso que eles fornecem. Mas se houver algum serviço interno aí que faça o que esse repositório faz (checar se uma URL está respondendo de acordo, com 200, etc), até acho melhor arquivar esse repositório, e configurar tal serviço. Para as novas versões que eu fiz, criei um endpoint de /health que retorna 200 se tudo estiver okay (acesso ao banco, accesso aos arquivos que precisa, etc). Por exemplo:

https://visaoholandesa.up.railway.app/health

Retorna:

{
    "status": "UP"
}

Se estiver tudo okay.

Se você não monitora, posso criar algo semelhante e deixar tbm com o pessoal lá do Liber olhando.

Boa! Acho que idealmente, quem pode resolver os problemas deveria ser a pessoa notificada. Se o @souzaevrs ou outra pessoa do Liber tiver os acessos/conhecimento/etc para resolver os problemas, ótimo.

Aqui na UFPE, em geral, depende, normalmente o pessoal utiliza a Grafana + Zabbix, ou a stack ELK.

Desses só não lembro mais como usa o Zabbix, mas deve ter uma maneira de checar uma URL.