diggsweden / persistent-identifiers-investigation

5 stars 2 forks source link

Guidelines Hantera persistenta identifierare för dataset som laddas upp på flera ställen #21

Open salgo60 opened 9 months ago

salgo60 commented 9 months ago

IA

Contact Details

salgo60@msn.com

What benefits does the suggestion solve?

Idag laddas ett dataset upp ofta på massa olika ställen, samma dataset bör ha EN persistent identifierare så att konsumenten ser att det är samma data på alla olika ställena se hur svenska dataportalen och edp inte verkar utbyta persistenta identifierare och inte heller den enskilda kommunen /myndigheten #82 Persistenta identifierare för dataset - ekosystem --> att jag som konsument omöjligen kan avgöra om det är "samma" data

Se "Building Google Dataset Search and Fostering an Open Data Ecosystem"

Connecting Replicas of Datasets "It is very common for a dataset, in particular a popular one, to be present in more than one repository. We use a variety of signals to determine when two datasets are replicas of each other. For example, schema.org has a way to specify the connection explicitly, through schema.org/sameAs, which is the best way to link different replicas together and to point to the canonical source of a dataset. Other signals include two datasets descriptions pointing to the same canonical page, having the same Digital Object Identifier (DOI), sharing links for downloading the dataset, or having a large overlap in other metadata fields. None of these signals are perfect in isolation, therefore we combine them to get the strongest possible indication of when two datasets are the same."

Feature suggestion description

En tydlighet i specifikationen om vikten av att ett datatset inte har olika persistenta identfierare på olika ställen eller som i fallet #82 att det enbart hos EDP verkar som de sätter en persistent identifierare och anger hur detta data skall citeras men detta sätt att citera datasetet delas inte av svenska dataportalen utan vi får 2 datasilos

Alternative solutions

schema.org/sameAs

Additional information

No response

salgo60 commented 9 months ago

Exempel hur konstigt dataverkstaden refererar till dataset/specifikation och länkröta skapas www.dataportal.se/sv/specifications/matsvinn...q=Matsvinn...spec_standard%24spec_profile...

Korrekt borde vara att dataverkstaden jobbar med persistenta identifierare och inte massa sköra websökningar, inget datum finns på dataportalens sida om Matsvinn men dagens hantering av att länka verkar bli fel redan efter några månader enl. troligen den spec matsvinn dom försöker länka så skapades den för 9 månader sedan = 28 mars 2023

salgo60 commented 9 months ago

liknande problem med dataportalen att identifiera organisation där organisationsnumret troligen är unikt men man geggar till det med en konstig url som pekar på en sida som inte finns hos KB...

organisationer identifieras med org nummer som pekar på en sida utan landningssida exempel sökning

image

fel hos dataportalen eller kb?

salgo60 commented 9 months ago

"Strings not things" dvs. här saknas persistenta identfierare eller peka med schema.org/sameAs och vi får gegga 3.0 för nyckelord

image
salgo60 commented 8 months ago

Verkar nu som svar skickas in i Google docs ;-) och saker stängs med motivering vi jobbar med det redan... jag vill se

image

En reality check är att

Är det mer ryggen fri än styra upp?

salgo60 commented 8 months ago
image