Informatievlaanderen / OSLO-toolchain

2 stars 0 forks source link

Foutieve bestandsnaam voor .ttl bestand (en .rdf, .nt) in geval van vocabularium #72

Open mvanbrab opened 3 years ago

mvanbrab commented 3 years ago

Link naar een voorbeeld waar het probleem zichtbaar is https://test.data.vlaanderen.be/ns/cultureel-erfgoed-voc.ttl (fout) https://data.vlaanderen.be/ns/cultureel-erfgoed.ttl (goed, na manuele ingreep)

Omschrijving van het probleem In een geval zoals dit (inhoud gehaald uit publication.json):

  {
    "urlref": "/ns/cultureel-erfgoed",
    "seealso": "/doc/vocabularium/cultureel-erfgoed/kandidaatstandaard/2020-07-17",
    "type": "voc"
  },
  {
    "urlref": "/doc/vocabularium/cultureel-erfgoed/kandidaatstandaard/2020-07-17",
    "repository": "https://github.com/Informatievlaanderen/OSLOthema-cultureelErfgoed",
    "branchtag": "kandidaat-2020-07-17",
    "name": "cultureel-erfgoed-voc",
    "filename": "config/cultureel-erfgoed-voc.json",
    "navigation": {
      "prev": "/doc/vocabularium/cultureel-erfgoed/ontwerpstandaard/2020-07-02"
    }
  },

wordt de bestandsnaam van het .ttl bestand (en gelijkaardig voor .rdf en .nt) bepaald door de waarde van de entry "name".

Een mogelijke workaround zou kunnen zijn om "name" in het voorbeeld gelijk te zetten aan "cultureel-erfgoed", maar dat vereist aanpassing in de configuratiebestanden van alle gelijkaardige situaties (en er is er meer dan één) en is dus niet gewenst.

Omschrijving van een mogelijke oplossing Bepaal de bestandsnaam op basis van "urlref".

bertvannuffelen commented 3 years ago

De oplossing is eigenlijk omgekeerd: de interpretatie van het url veld is complexer. Dat betekent parsing en afspraken over de waarde in het url veld, versus de afspraak dat name = aan het betekenisvolle onderdeel in een de url.

mvanbrab commented 3 years ago

De bestandsnaam bepalen op basis van het eerste pad element na "ns" of "vocabularium" is toch niet zo complex?

Als je dat niet aanpast, moet dat ook als dusdanig gedocumenteerd worden en neemt dat flexibiliteit in de configuratiebestanden weg.

We moeten het dan ook retroactief overal waar nodig gaan aanpassen. Ik maak alvast nota van alle voorkomende gevallen in het overzicht van de vergelijking die ik aan het maken ben, zodat we dan kunnen beslissen als we de koppen bij elkaar steken.

mvanbrab commented 3 years ago

Een verdere motivatie om de bestandsnaam (en het pad!) te bepalen op basis van "urlref" is het geval met een prefix, zoals in het geval van https://data.vlaanderen.be/ns/mobiliteit/trips-en-aanbod.

In dat geval wordt het .ttl bestand immers logischerwijze verwacht op https://data.vlaanderen.be/ns/mobiliteit/trips-en-aanbod.ttl (baseURI + .ttl) en niet zoals het nu (na manuele interventie) te vinden is op https://data.vlaanderen.be/ns/mobiliteit-trips-en-aanbod.ttl (met een - in plaats van een / tussen mobiliteit en trips)