diggsweden / DCAT-AP-SE

Projekt för DCAT-AP-SE.
https://docs.dataportal.se/dcat/
Creative Commons Attribution 4.0 International
14 stars 3 forks source link

Ta fram en rekommendation för lämplig uppdateringsfrekvens för datamängdsserier #111

Closed matthiaspalmer closed 1 month ago

matthiaspalmer commented 2 months ago

Contact Details

No response

What benefits does the suggestion solve?

Det ska vara tydligt för dataportalen om den kan förväntas sig några tiotal datamängder i en datamängdsserie eller om det kan vara tusentals.

Feature suggestion description

Tydliggör när det är lämpligt att förvalta data i en datamängdsserie:

Ett förslag är att det ska vara behovsdrivet, men inte mer än 100 datamängder i en dataserie. Beskriv också i rekommendationen vad man gör om man har behov som inte passar i en datamängdsserie, hur man går till väga då. T.ex:

Alternative solutions

No response

Additional information

No response

matthiaspalmer commented 2 months ago

Förslag:

Vi rekommenderar att om man har en datamängdsserie som i huvudsak har en temporal dimension att man inte har en uppdateringsfrekvens som är mer frekvent än en gång i månaden. Dvs man inte lägger till nya datamängder till serien oftare än en gång i månaden.

salgo60 commented 2 months ago

Blir det inte bara konstigt att hitta på generella regler... är det Riksbankens styrränta skall saker uppdateras direkt gissar jag... gissar att hela tanken med en dataportal är lite föråldrat om man strävar efter att jobba datadrivet....

matthiaspalmer commented 1 month ago

Nu är två rekommendationer framtagna som är relevanta för denna issue:

Rekommendation 17 - Antalet datamängder i en datamängdsserie och Rekommendation 19 - Alternativ till datamängdsserier

salgo60 commented 1 month ago

Fundering: Är det inte mer dataportal produktens begränsningar som styr än vad som skapar bra data?

image

Borde vara enkelt att ställa en SPARQL fråga som hämtar allt som har

matthiaspalmer commented 1 month ago

@salgo60 Naturligtvis finns komplexiteten hos dataportalen med som en aspekt, det är ju punkt 2. Det finns ingen bakomliggande komersiell produkt som står för begränsningarna i dataportalens gränssnitt då det är en produkt som utvecklas av DIGG som öppen källkod.

Men en minst lika viktig aspekt är hur lätt informationen är att ta emot av de som besöker portalen, punkt 1 i rekommendation 17. En datamängdsserie med tusentals datamängder i sig är svår att få översikt över. I referensgruppen diskuterades denna aspekt och slutsatsen var att man bör fundera över mottagaren, hur ger man bäst tillgång till data. Att ha tusentals datamängder i en datamängdsserie låter som ett dåligt beslut. Det är därför som rekommendation 19 finns.

salgo60 commented 1 month ago

Att ha tusentals datamängder i en datamängdsserie låter som ett dåligt beslut. Det är därför som rekommendation 19 finns.

Tackar för svar förstår inte hur ni resonerar...

Gissat att med ett vettigt frågespråk som SPARQL så kan alla datamängder hämtas....

Vore kanske bättre att jobba på ett Change stream API modell det Wikidata har

image image