erfgoed-en-locatie / place-identificator

MIT License
1 stars 1 forks source link

Bevindingen Inge #61

Closed phpetra closed 8 years ago

phpetra commented 9 years ago

Dag Monika en Ralph,

Ik ben nog even met mijn datasets aan de slag gegaan. Mijn bevindingen hieronder.

Eerste dataset – volledige thesaurus

Er worden 832 termen gestandaardiseerd, 1078 hebben meerdere resultaten en 13584 hebben geen resultaten. Het grote deel zonder resultaat is verklaarbaar door de wereldwijde scope van onze thesaurus.

Om deze matches verder te evalueren zou ik ze willen exporteren. Ik krijg echter dezelfde foutmelding als tijdens de workshop:

“Notice: Undefined index: gg-geometry in /var/www/www-root/locatienaaruri/src/Pid/Mapper/Provider/DataSetControllerProvider.php on line 390 We are sorry, but something went terribly wrong.”

Ik heb daarom de gemeentegeschiedenis uitgezet; de export werkte toen wel. Vandaag wilde ik een andere set exporteren: hierbij hetzelfde probleem, maar dit keer wilde de TGN-data niet meewerken en kon ik dus alleen de Geonames-set exporteren.

Tweede dataset – Broader term = “Nederland”

De totale dataset bestaat uit 4046 termen. Na uploaden zijn hiervan plusminus 600 termen behandeld. Dit is ook het geval bij een tweede keer uploaden van dezelfde set. Ik ben vervolgens eerst langs de Gestandaardiseerde termen gelopen, vervolgens langs de Meerdere resultaten en als laatste door de Geen resultaten. Wat me hierbij opviel:

Deze dataset heb ik geëxporteerd – alleen de Geonamesinfo lukte. Er bleven 99 termen over waar de coördinaten voor beschikbaar waren. Dit is wat mij betreft een beetje een teleurstellend resultaat – in dezelfde tijd had ik deze termen met de hand van coördinaten kunnen voorzien. Voor mij is het nu belangrijk om een export kunnen maken van de TGN-gegevens en natuurlijk het verwerken van de hele dataset in plaats van een deel daarvan.


phpetra commented 9 years ago

Eén ding kan ik wel al verklaren: waarom het niet lukt om die TGN-gebieden op te slaan: deze applicatie is (vooralsnog) bedoeld voor het standaardiseren van plaatsen of gemeentes.... niet voor gebieden. Op het moment dat je een willekeurige TGN uri invoert, doet het systeem een call naar TGN om aanvullende gegevens (met name de geometrie) op te halen. Als die geometrie ontbreekt, wordt het resultaat genegeerd. Je kunt het verschil zien met bijvoorbeeld: http://vocab.getty.edu/tgn/7003616 (klik bij beide eens op de waarde achter foaf:focus (helemaal onderaan).

wires commented 9 years ago

Mooie feedback dit! (even wat leesbaarder gemaakt)

phpetra commented 8 years ago

Punten zijn met de rewrite verholpen. Tijd voor nieuwe testronde.