Open Flurin-BLS opened 3 months ago
Erwartungen BLS: - Mehr Zugriff/Berechtigung auf Statuscake mit mehr Details?
Tobi braucht noch einen GitHub User --> sobald dem BLS-Team zugeordnet kann dieses Ticket auch ihm assigned werden
Open points:
Monitoring wird intern aufgebaut mittels Zabbix > @tobiaszurbriggen -- Bei Störung wird Sikado – Alarm ausgelöst (SMS, Telefon, E-Mail)
Externes Monitoring wird noch angepasst -- Zugriffe auf Statuscake wird geprüft seitens SKI+ > @AndreasAtSBB
SLA: Monatliches Reporting analog BAV wird auch an BLS geliefert > @u233336
DryRun für ein Incident durchführen > @tobiaszurbriggen
Hey @tobiaszurbriggen - konntet ihr dem DryRun schon aufgleisen? Und wie ich gehört habe, bist du ja mit Zabbix dran, oder? Gerne kurzes Update hier im Ticket. Merci
Hey @Flurin-BLS - Betreffend DryRun: noch nicht, aber ich habe gerade mit Marco darüber gesprochen, dass wir nun unbedingt einen Termin aufsetzen müssen. Und zum Thema Monitoring: Richtig, ich bin aktuell dran ein Monitoring auf unserer Seite mit Hilfe von Zabbix aufzugleisen. Wie wie Abfragen ist noch nicht ganz klar, es kann über den API GW oder direkt die OJP API sein.
Sobald ich mehr Infos habe, kann ich euch gerne Informieren.
The Monitor shows 12 days "UP-time" - but the service was down... usualy the "down-time" during the night is shown with a peak, but there is no peak during the last 12 days... Seems a bit tricky to read this monitor.. we need further explenation. TEST-TR - no picks
INT-TR - a peak every night when the system is not available
I've assigned @AndreasAtSBB to the ticket, please clarify the monitoring "rules" - thanks
Das heutige Monitoring ist für die Messung vom SLA als auch für uns zur Qualitätssicherung unzureichend.
Damit wir BLS Mobil mit OJP 2.0 mit gutem gewissen Produktiv schlaten können. Müssen die SLA's messbar sein.
Zur Zeit ist es nicht möglich die Ausfälle oder die Up-Time über einen gewünschten Zeitraum pro API zu visualisieren.