diggsweden / persistent-identifiers-investigation

5 stars 2 forks source link

Skapa "Best practices" #4

Closed salgo60 closed 1 year ago

salgo60 commented 1 year ago

Internet Archive

Contact Details salgo60@msn.com

What benefits does the suggestion solve? "best practice is a standard or set of guidelines that is known to produce good outcomes if followed."

Feature suggestion description Förslag skapa en checklista med saker som gör att löst kopplade organisationer kan jobba ihop med persistenta identifierare i ett ekosystem.... Skapa en dashboard med organisationer som har persistenta identifierare och vilka delar av denna "best practice" dom uppfyller se https://github.com/salgo60/SamlaLibris/issues/22#issuecomment-1461756236 Efter att ha jobbat med internationella banktransaktioner blev jag 2018 chockad över att myndigheter och arkiv inte rapporterar tillbaka ett helpdesk nummer se lista skapad 2018 där jag uppfattar en enorm omognad att jobba ihop och ha spårbarhet dvs. man befinner sig på nivå 1 i denna mognads modell 2018 och jag ser 2023 ingen skillnad... se även SFS 1999:175 ---> som 26 år senare inte levererat dvs. att skapa interoperabilitet mellan EN dokument typ för 100 myndigheter och är inte ens i mål idag 2023, det är så illa att inte ens https://github.com/salgo60/LagrummetLight/issues/3och efter 6 års funderande har dom ingen data att dela... --> skall PID:ar fungerar så måste ni vara extremt tydliga och våga peka på vad som skall levereras det känns troligare att vi om 26 år har ytterligare några PDF:er och inget fungerande EKO-system.

image

För att vara tydlig skapade jag 2020 "The Magnus List - One way to design a system to be a good external identifier in Wikidata" som sedan förklaras bra vid 27:50 min i en video från Stanford skapad 2021-09-07 "Keepin 'N Sync... with wikidata ... and ORCID...and GBIF"

image

Mitt förslag: Skapa liknande lista med saker som behövs för att vara en del av ett digitalt ekosystem... GUPRI #2 kan vara en del

Alternative solutions Skapa en "DIGG PID backlog" på GITHUB där jag som användare av PID:ar från andra organisationer kan logga saker som är fel hos andra.. de flesta myndigheter/arkiv museer jobbar idag i bästa fall med email kommunikation och inte helpdesknummer --> det skalar inte om 100 tals aktörer skall koppla "samma som" och fel/frågor skall skickas mellan tjänstemän via email utan helpdesknummer...

ett bra försök gjordes med handlingar.se men systemet kraschade och dom kunde inte återskapa det... kommunikation myndighet <-> medborgare lesson learned skall inte loggas av glada amatörer I Wikidata ser vi massa organisationer som inte kan hantera #metadatadebt, har versionshantering på objekt, att objekt nte kan kommenteras och har därför bl.a. skapat en produkt som Wikidata:Mismatch_Finder dvs. ett försök att kommunicera fel till organisationer som inte har en bra metadatadebt backlog

se exempel på skapade skuggbacklogar som jag skapat tills mottagaren har en publik backlog och ger mig helpdesknummer försök att hitta det enklaste datasettet som inte är hemligt, har princip ett namn och en koordinat GITHUB ProjectOutdoorGyms kommunikation med > 50 kommuner endast en handfull gav mig ärendenummer och i princip ingen gav mig öppen data som inte hade det innan, jag var den enda som hade en öppen backlog.... exempel hur galet det blir då saker skickas runt https://github.com/salgo60/ProjectOutdoorGyms/issues/106#issuecomment-1361147844 där svenska textsträngar skickas runt istället för THINGS med PID:ar och stöd för flera språk - Antipattern #77-4 https://github.com/salgo60/DiggUptime/issues/77#issuecomment-1308635367 bäst i klassen var Stockholms stad - video vad som kunde vara bättre vid 30 sekunder Stockholms stad har unika id:n för sina utegym men då dom skapar öppen data om badplatser och anger att ett utegym finns där så anger man inte det unika id:et utan textsträngen ---> ej 5-star data mogen organisation vid 6 min hur snyggt Wikidata och iNaturalist har unika id:n för arter och jobbar ihop Se min kommentar på SWIB 2019 i Bonn Communication communication communication

Additional information Min tro är att ni skall titta på hur Wikipedia jobbar med att knyta ihop alla wikipedier trots att man har > 300 språk osv,.. så överglänser vi helt det jag ser med

Riksdagens dokument - mycket "https://github.com/salgo60/DiggUptime/issues/77#issuecomment-1308635367" https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/148 https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/70 https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/78 dels hos EU och dels hos Riksdagen/myndigheter/kommuner https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/77 https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/93 https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/79 Hållbarhets mål finns via FN:s ontologi med persistenta identifierare men https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/61, finns även ett EU API SDGMapper för att göra detta https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/75 - när jag pratade med EU gubbarna visste dom inte vem dom skall prata med i Sverige - se workshop https://github.com/salgo60/DiggUptime/issues/82 https://github.com/salgo60/SamlaLibris/issues/22 https://github.com/salgo60/spa2Commons/issues/17 Riksarkivet https://github.com/Riksarkivet/dataplattform/issues/9#issuecomment-1337021733 https://github.com/Riksarkivet/dataplattform/issues/9#issuecomment-1294867649 "Det finns idag ingen entydig unik identifierare från myndigheterna som är upphov till dokumenten registrerad i arkivmetadata."... image

Bara det att kopplingen digitalt https://github.com/salgo60/Wikidata_riksdagen-corpus/issues/98 inte finns och skapa citation graphs måste vara ett underbetyg så vi startar med persistenta identifierare på ruta 0

Varning detta är inte lätt - 26 år har 100 myndigheter försökt skapa författningar med PID:ar och samma struktur - 0 leverans Dagens laguppställning har försökt under 26 år att skapa interoperabilitet för EN dokument typ se SFS 1999:175 och är inte ens i mål idag, det är så illa att

https://github.com/salgo60/LagrummetLight/issues/3 2013 trodde man några år - då hade man spenderat > 15 år sedan förarbetet Ds 1998:10 startades utmaningen är stor annan lag 2010:566 datalagen Syftet med denna lag är att främja utvecklingen av en informationsmarknad genom att underlätta enskildas användning av handlingar som tillhandahålls av myndigheter.

utfallet är en katastrof se status det är 2023 en katastrof se Myndigheter och kommuner i Sverige

utmaningen är stor och leveransen försumbar

matthiaspalmer commented 1 year ago

@salgo60 Det här ärendet är för långt och spretigt. Du får återkomma med en kortfattad beskrivning (typ högst två utgående länkar ut) om vad vilken typ av best practises du vill föreslå. Först därefter kan jag bemöta det. Annars kommer jag stänga ärendet utan åtgärd.

salgo60 commented 10 months ago

Best practice needed for understanding who is referencing my PID

One reason to have Persistent Identfiers is that other can reference your document (see go fair F1) --> if you know who is referencing your PID you can create graphs --> in current DIGG design I see

Loosely coupled system could implement the observer pattern --> we could do that in a way to also track the DOI that is "observing a PID"... compare the graphs we do today in Wikidata

image

Status 2023 that I see

salgo60 commented 10 months ago

see example with linkroot and httpcode 410

Best practice: Support depreciated and reason for deprecated rank in metadata

Example how this is done in Wikidata with multilingual support - Wikidata has a data model that is based on a EU project RENDER that

image

see example. Q28967664#P1260 - swedish / english

image image image
salgo60 commented 8 months ago

Fler tankar om vikten av "Best practices"

image

How to design, provision, and reuse persistent identifiers to maximize utility and impact of life science data

image
salgo60 commented 8 months ago

Best practices del 3

Jag skapade en lista 2021 The Magnus list" "One way to design a system to be a good external identifier in Wikidata" denna lista beskrevs av David Shorthouse vid 27:50 i Stanford videon - slides "Keepin 'N Sync... with wikidata ... and ORCID...and GBIF"

image image image