Open salgo60 opened 9 months ago
Exempel hur konstigt dataverkstaden refererar till dataset/specifikation och länkröta skapas www.dataportal.se/sv/specifications/matsvinn...q=Matsvinn...spec_standard%24spec_profile...
Korrekt borde vara att dataverkstaden jobbar med persistenta identifierare och inte massa sköra websökningar, inget datum finns på dataportalens sida om Matsvinn men dagens hantering av att länka verkar bli fel redan efter några månader enl. troligen den spec matsvinn dom försöker länka så skapades den för 9 månader sedan = 28 mars 2023
liknande problem med dataportalen att identifiera organisation där organisationsnumret troligen är unikt men man geggar till det med en konstig url som pekar på en sida som inte finns hos KB...
organisationer identifieras med org nummer som pekar på en sida utan landningssida exempel sökning
fel hos dataportalen eller kb?
"Strings not things" dvs. här saknas persistenta identfierare eller peka med schema.org/sameAs och vi får gegga 3.0 för nyckelord
Verkar nu som svar skickas in i Google docs ;-) och saker stängs med motivering vi jobbar med det redan... jag vill se
En reality check är att
IA
Contact Details
salgo60@msn.com
What benefits does the suggestion solve?
Idag laddas ett dataset upp ofta på massa olika ställen, samma dataset bör ha EN persistent identifierare så att konsumenten ser att det är samma data på alla olika ställena se hur svenska dataportalen och edp inte verkar utbyta persistenta identifierare och inte heller den enskilda kommunen /myndigheten #82 Persistenta identifierare för dataset - ekosystem --> att jag som konsument omöjligen kan avgöra om det är "samma" data
Se "Building Google Dataset Search and Fostering an Open Data Ecosystem"
Connecting Replicas of Datasets "It is very common for a dataset, in particular a popular one, to be present in more than one repository. We use a variety of signals to determine when two datasets are replicas of each other. For example, schema.org has a way to specify the connection explicitly, through schema.org/sameAs, which is the best way to link different replicas together and to point to the canonical source of a dataset. Other signals include two datasets descriptions pointing to the same canonical page, having the same Digital Object Identifier (DOI), sharing links for downloading the dataset, or having a large overlap in other metadata fields. None of these signals are perfect in isolation, therefore we combine them to get the strongest possible indication of when two datasets are the same."
Feature suggestion description
En tydlighet i specifikationen om vikten av att ett datatset inte har olika persistenta identfierare på olika ställen eller som i fallet #82 att det enbart hos EDP verkar som de sätter en persistent identifierare och anger hur detta data skall citeras men detta sätt att citera datasetet delas inte av svenska dataportalen utan vi får 2 datasilos
Alternative solutions
schema.org/sameAs
Additional information
No response