openTdataCH / ojp-sdk

Meta OJP SDK repo
MIT License
4 stars 0 forks source link

Monitoring #77

Open Flurin-BLS opened 3 months ago

Flurin-BLS commented 3 months ago

Das heutige Monitoring ist für die Messung vom SLA als auch für uns zur Qualitätssicherung unzureichend.

Damit wir BLS Mobil mit OJP 2.0 mit gutem gewissen Produktiv schlaten können. Müssen die SLA's messbar sein.

Zur Zeit ist es nicht möglich die Ausfälle oder die Up-Time über einen gewünschten Zeitraum pro API zu visualisieren.

Flurin-BLS commented 3 months ago

Erwartungen BLS: - Mehr Zugriff/Berechtigung auf Statuscake mit mehr Details?

Flurin-BLS commented 3 months ago

Tobi braucht noch einen GitHub User --> sobald dem BLS-Team zugeordnet kann dieses Ticket auch ihm assigned werden

Flurin-BLS commented 3 months ago

Open points:

TO-mdv commented 2 months ago

Dashboard: https://uptime.statuscake.com/?TestID=nPKk9Dbgid https://app.statuscake.com/Bigscreen/display.php?id=4e982c1f-2f37-4aa6-8035-88a09ac631a8

Flurin-BLS commented 1 month ago

Hey @tobiaszurbriggen - konntet ihr dem DryRun schon aufgleisen? Und wie ich gehört habe, bist du ja mit Zabbix dran, oder? Gerne kurzes Update hier im Ticket. Merci

tobiaszurbriggen commented 1 month ago

Hey @Flurin-BLS - Betreffend DryRun: noch nicht, aber ich habe gerade mit Marco darüber gesprochen, dass wir nun unbedingt einen Termin aufsetzen müssen. Und zum Thema Monitoring: Richtig, ich bin aktuell dran ein Monitoring auf unserer Seite mit Hilfe von Zabbix aufzugleisen. Wie wie Abfragen ist noch nicht ganz klar, es kann über den API GW oder direkt die OJP API sein.

Sobald ich mehr Infos habe, kann ich euch gerne Informieren.

Flurin-BLS commented 1 month ago

The Monitor shows 12 days "UP-time" - but the service was down... usualy the "down-time" during the night is shown with a peak, but there is no peak during the last 12 days... Seems a bit tricky to read this monitor.. we need further explenation. TEST-TR - no picks Image

INT-TR - a peak every night when the system is not available Image

Flurin-BLS commented 1 month ago

I've assigned @AndreasAtSBB to the ticket, please clarify the monitoring "rules" - thanks