Geonovum / PDOK-NGR-issues

An issue tracker for the Dutch national geoportal.
1 stars 2 forks source link

Status pagina PDOK/NGR #19

Open ndkv opened 9 years ago

ndkv commented 9 years ago

Naar aanleiding van de recente (on)aangekondigde downtime van NGR/PDOK (services) heeft @emacgillavry een spec opgesteld voor een status pagina.

Doel: informatie verschaffen over de status van PDOK/NGR infrastructuur op een eenvoudige en makkelijk te bereiken manier zodat gebruikers in een oogopslag kunnen constateren dat "het niet aan mij ligt, want PDOK meldt zelf dat ze onbereikbaar is."

Voorbeelden

Requirements Communicatie

techniek

optioneel

Resultaat De eindgebruikers hebben het gevoel, dat PDOK "in control" van de situatie is. De ervaring van de eindgebruikers is bevestigd en zij voelen zich op deze manier serieus genomen.

mprins commented 9 years ago

Voor de bulk van de datasets geldt het inspire regime; die services doen het dus altijd, zo is de specificatie opgesteld. Tijd steken in een systeem dat eigenlijk niets te melden zou moeten hebben lijkt mij zonde van het geld...

pvgenuchten commented 9 years ago

Het Inspire regime is een mooie basis voor het garanderen van een bapaalde mate van service kwaliteit, echter dit regime verplicht slecht 99% beschikbaarheid (http://wiki.geonovum.nl/index.php?title=Quality_of_Services), wat op jaarbasis neerkomt op zo'n 5000 minuten ongestraft offline zijn

Bovendien staat Inspire toe dat er periodes van onderhoud plaats vinden, die vallen dan buiten het inspire regime, deze onderhouds periodes worden aangekondigd op https://www.pdok.nl/nl/actueel

Op die pagina worden ook storingen weergegeven, van buitenaf gezien lijkt dit echter geen geautomatiseerd proces, zoals Simeon hier voorstelt, het lijkt me daarom een goed voorstel, mogelijkerwijs op te pakken samen met pdok (en/of andere Inspire providers; provincies, waterschappen, rivm, tno, knmi, rdw, dienst hydrografie, rce, etc).

Mogelijke libraries http://nagios.org, http://zabbix.org, http://boundlessgeo.com/solutions/mapmeter, http://mmonit.com/monit

mprins commented 9 years ago

de wiki van geonovum is onvolledig (en verouderd); de huidige TG voor view en discovery service zegt:

The availability shall be based on a time frame of one year meaning a maximum unplanned downtime of 3.63 days per year. Periods of planned downtime e.g. because of system maintenance, shall not be included in the measure. Downtime is considered planned when notified to the community well in advance (minimum 1 week), e.g. via notifications to registered users or on portals

dat is idd ruim 5000min. op jaarbasis, maar spoed onderhoud (<1week notificatie) is dus gewone ("onverwachtte") downtime en van invloed op de beschikbaarheid.

ter voorbeeld: het komende onderhoud van komende vrijdag 12/12 stond zondag ( na een halve dag storing waarover nog niets te vinden is op de pdok site) nog niet op de site en valt dus onder niet gepland...

zie oa. http://inspire.jrc.ec.europa.eu/documents/Network_Services/TechnicalGuidance_DiscoveryServices_v3.1.pdf en http://inspire.ec.europa.eu/documents/Network_Services/TechnicalGuidance_ViewServices_v3.11.pdf

overigens al eens een monitor in elkaar gezet: http://www.geodienstencentrum.nl/blog/monitoring/performance/2011-09-06/performance-and-uptime-monitoring-inspire-view-service.html

ndkv commented 9 years ago

De services worden nu door pingdom gepolst http://stats.pingdom.com/v3zazpflx3jc /ht @emacgillavry

@mprins Bedankt voor link naar je monitor, ik neem het mee.

mprins commented 9 years ago

wat wordt er dan getest door pingdom? een werkelijk getmap of getcapabilities request? en wordt de inhoud dan ook geparsed? want de WMS/WFS geven ook een 200 OK http status voor foutmeldingen (en niet een 500 Error).