salgo60 / Svenskaforsamlingar

Svenska Församlingar a project creating linked data in Wikidata. Connecting Riksarkivet, SCB, Bygdeband etc.
https://salgo60.github.io/Svenskaforsamlingar/
2 stars 1 forks source link

SBL dataset släpps 2024 Strings not Things #53

Open salgo60 opened 4 months ago

salgo60 commented 4 months ago

Wikidata skapade för 8 år sedan 2016-sep-21 koppling till SBL - se blogpost 2017

image

Nytt dataset från SBL släpps 2024-maj där namn är textsträngar och yrken inte har HISCOkoder, där församlingar är icke unika textsträngar, inga källor kopplas till fakta, släktartiklar helt saknar metadata ocjh persistenta identifierare för personer....

image

Jupyter Notebook -> csv till pandas

image image

Postbeskrivning

image

Vad hände med hen som anställdes att skapa nya API:er - det blev en tummetott en csv fil

image

Uppenbara problem med Riksarkivets dataset

Känns som Riksarkivet inte jobbar ingenjörsmässigt utan det blir ostrukturerat och spretigt. 1) Textsträngar: hade varit bättre om Riksarkivet hämtat ut det data som finns i Wikidata så hade dom haft persistenta identifierar för församlingar, samma som Wikidata --> ha samma som SWERIK för Riksdagsmän...... 1) i Wikidata har ni även massa fall där SBL inte överensstämmer med kyrkböckerna se mer saker som jag tycker kan vara mera proffsigt #6 1) Vara kompatibla med andra dataset: Termer borde även det kopplas till andra termkataloger se bl.a. detta med yrken och HISCOkoder - det kommer aldrig gå att jobba digitalt om saker som detta levereras 1) Galet med egna _hittepå__ konstruktioner som "Prefix to year of death" / "Prefix to year of birth" .... hur skall svenskt kulturarv kunna koppla ihop sig om ni alla skapar silos med egna konstruktioner 1) Funder över att använda ex. SKOS se dialog med Skansen som inte heller dom är ingengörsmässiga 1) Arbeta aktivt med er metadatadebt se #29 1) Finns det tankar om change management hos Riksarkivet? Datasettet ovan heter SBL_2023.csv hur kommer dom hantera ändringar? 1) jag har tidigare saknat att Riksarkivet hantera felrapporteringen proffsigt #3 - gissar att dumpa nya dataset med ändringar utan versionshantering och källor blir för den som skall använda det ett Maintenance Hell jmf RAÄ 1) FAIRDATA F1 - alla personer yrken platser skall ha persistenta unika identifierare #7

image

Felaktigt data i SBL enl. Wikidata

salgo60 commented 4 months ago

Finns även lite tester med att lyfta in släktartiklarna till wikidata se https://github.com/salgo60/Svenskaforsamlingar/issues/7#issuecomment-1590563766

image

salgo60 commented 4 months ago

Wikidata - SBL P

SPARQL https://w.wiki/BuJ

Properties wd:Q19595382 --> Auktoritetsdata for people

image image
salgo60 commented 4 months ago

All External Properties https://w.wiki/A58D

image image image
salgo60 commented 4 months ago

All WD Properties for P3217 SBL https://w.wiki/A58M

image image image image
salgo60 commented 4 months ago

Pie Chart Properties https://w.wiki/A58Q

image
salgo60 commented 4 months ago

Tidslinje SBL Wikidata

image

Man / kvinna / trans

image
salgo60 commented 4 months ago

PROV

2024 bör metadata finnas med provenance PROV

Idag saknar jag tankar om provenance - PROV hos Riksarkivet se #50 och hur klassificering av # 139 politiska vildar i Riksdagen beskrivs olika av olika källor


RDF Triples for Political Figures:

<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> a foaf:Image ;
  dc:subject wd:Q4582704 ;
  foaf:depiction wd:Q4582704 ;
  rdfs:label "Scanned image of Adolf Hedin" .

wd:Q4582704 a foaf:Person ;
  foaf:name "Adolf Hedin" ;
  :politicalStatus "politisk vilde" ;
  :activePeriod "1893 - 1902" ;
  :depictedIn <http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> .

<http://example.org/book/1897> a bibo:Book ;
  dc:date "1897"^^xsd:gYear ;
  dc:title "Frihandelsvänlig vilde" ;
  foaf:depiction wd:Q4582704 .

PROV-O Statements for Provenance:

<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> prov:wasGeneratedBy :ScanningActivity ;
  prov:wasAttributedTo :DigitizationProject ;
  prov:generatedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime .

:ScanningActivity a prov:Activity ;
  prov:startedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime ;
  prov:used <http://example.org/book/1897> ;
  prov:wasAssociatedWith :DigitizationProject .

:DigitizationProject a prov:Organization ;
  prov:hadPrimarySource <http://example.org/book/1897> .

And for PROV-O, one could represent the provenance information like this:

:BookEarly1900s a prov:Entity ;
                prov:wasAttributedTo :Author1 ;
                prov:generatedAtTime "1900-01-01T00:00:00Z"^^xsd:dateTime .

:Book1985 a prov:Entity ;
          prov:wasAttributedTo :Author2 ;
          prov:generatedAtTime "1985-01-01T00:00:00Z"^^xsd:dateTime .

:ConceptOfVilde prov:wasDerivedFrom :BookEarly1900s ;
                prov:wasAlteredIn :Book1985 .

Scanned picture - frihandelsvänlig vilde wd Q118289007 - Porträttbok: Riksdagsmän 1897

image

Wikidata

image image image image

SPA has implemented very good data to track changes and who is doing what

SPA json sj9PGLAlnmUAAAAAABGeXw

image image
salgo60 commented 4 months ago

SBL personer i Svenska Riksdagen 1187

se mer kopplingar Riksdagsmän

image image

Problemet att få svenska museer koppla ihop sig digitalt för svenska Riksdagsmän

image
salgo60 commented 4 months ago
image image
salgo60 commented 4 months ago

FB fråga vad hände med tidplanen

image
salgo60 commented 3 months ago

SBL efter 100 år och SKBL efter 1 år

image image image