luclecq / metadatakwaliteit

Automatisering van de controle op metadatakwaliteit voor het Overijsselse geoportaal
0 stars 0 forks source link

Controleren op verboden karakters in titel en samenvatting #11

Closed luclecq closed 5 years ago

gerardnienhuis commented 5 years ago

Dit heeft veel voordelen voor de controle van metadata. We hebben een schrijfwijzer (invulinstructie) opgesteld, waarin de verboden karakters staan vermeld. Mijn voorstel is om dit in 2 controles uit te voeren: verboden tekens in titel en verboden tekens in samenvatting. De tekst in het veld "controle_totaal" wordt dan "fout teken in titel" of "fout teken in samenvatting".

gerardnienhuis commented 5 years ago

Eerst graag kijken titel en samenvatting. Overwegen tzt om alle vrije velden te controleren, dus ook organisatienaam enz. Nu niet uitvoeren. Wordt opgenomen in issue ...

luclecq commented 5 years ago

Eerst graag kijken titel en samenvatting. Overwegen tzt om alle vrije velden te controleren, dus ook organisatienaam enz. Nu niet uitvoeren. Wordt opgenomen in issue ...

Het vervolg hierop is #25.

luclecq commented 5 years ago

Deze wens is toegevoegd, zie release 0.5.

luclecq commented 5 years ago

Na testen blijken datasets soms onterecht de melding "fout teken in titel" te krijgen, omdat er geen rekening wordt gehouden met de context waarin verboden karakters voorkomen. Dit strookt niet met de uitzondering in de invulinstructie, namelijk dat een dubbele punt is toegestaan bij bestanden waar dat gebruikelijk is (vb. topografische schaal 1 : 10 000).

In overleg aanmaken van nieuw issue, of accepteren dat deze analyse soms foutpositief is.

gerardnienhuis commented 5 years ago

blijkt goed te werken, er staat aangegeven met x dat er een verboden teken is. Steeksproefsgewijs getest, klopt ook echt. issue kan gesloten.

extra wensen opgenomen hierover bij https://github.com/luclecq/metadatakwaliteit/issues/28