Open salgo60 opened 6 months ago
Finns även lite tester med att lyfta in släktartiklarna till wikidata se https://github.com/salgo60/Svenskaforsamlingar/issues/7#issuecomment-1590563766
Pie Chart Properties https://w.wiki/A58Q
Idag saknar jag tankar om provenance - PROV hos Riksarkivet se #50 och hur klassificering av # 139 politiska vildar i Riksdagen beskrivs olika av olika källor
RDF Triples for Political Figures:
<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> a foaf:Image ;
dc:subject wd:Q4582704 ;
foaf:depiction wd:Q4582704 ;
rdfs:label "Scanned image of Adolf Hedin" .
wd:Q4582704 a foaf:Person ;
foaf:name "Adolf Hedin" ;
:politicalStatus "politisk vilde" ;
:activePeriod "1893 - 1902" ;
:depictedIn <http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> .
<http://example.org/book/1897> a bibo:Book ;
dc:date "1897"^^xsd:gYear ;
dc:title "Frihandelsvänlig vilde" ;
foaf:depiction wd:Q4582704 .
PROV-O Statements for Provenance:
<http://commons.wikimedia.org/wiki/Special:FilePath/M131803697> prov:wasGeneratedBy :ScanningActivity ;
prov:wasAttributedTo :DigitizationProject ;
prov:generatedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime .
:ScanningActivity a prov:Activity ;
prov:startedAtTime "YYYY-MM-DDT00:00:00Z"^^xsd:dateTime ;
prov:used <http://example.org/book/1897> ;
prov:wasAssociatedWith :DigitizationProject .
:DigitizationProject a prov:Organization ;
prov:hadPrimarySource <http://example.org/book/1897> .
And for PROV-O, one could represent the provenance information like this:
:BookEarly1900s a prov:Entity ;
prov:wasAttributedTo :Author1 ;
prov:generatedAtTime "1900-01-01T00:00:00Z"^^xsd:dateTime .
:Book1985 a prov:Entity ;
prov:wasAttributedTo :Author2 ;
prov:generatedAtTime "1985-01-01T00:00:00Z"^^xsd:dateTime .
:ConceptOfVilde prov:wasDerivedFrom :BookEarly1900s ;
prov:wasAlteredIn :Book1985 .
se mer kopplingar Riksdagsmän
2024 blir det en csv fil från Riksarkivet SBL och bokstäverna T-Ö har inte levererats trots beslut att det skulle ha levererats för 30 år sedan
vi ser att Svenskt Kvinnobiografiskt Lexikon - SKBL
Wikidata skapade för 8 år sedan 2016-sep-21 koppling till SBL - se blogpost 2017
Nytt dataset från SBL släpps 2024-maj där namn är textsträngar och yrken inte har HISCOkoder, där församlingar är icke unika textsträngar, inga källor kopplas till fakta, släktartiklar helt saknar metadata ocjh persistenta identifierare för personer....
Jupyter Notebook -> csv till pandas
Postbeskrivning
Vad hände med hen som anställdes att skapa nya API:er - det blev en tummetott en csv fil
Uppenbara problem med Riksarkivets dataset
Känns som Riksarkivet inte jobbar ingenjörsmässigt utan det blir ostrukturerat och spretigt. 1) Textsträngar: hade varit bättre om Riksarkivet hämtat ut det data som finns i Wikidata så hade dom haft persistenta identifierar för församlingar, samma som Wikidata --> ha samma som SWERIK för Riksdagsmän...... 1) i Wikidata har ni även massa fall där SBL inte överensstämmer med kyrkböckerna se mer saker som jag tycker kan vara mera proffsigt #6 1) Vara kompatibla med andra dataset: Termer borde även det kopplas till andra termkataloger se bl.a. detta med yrken och HISCOkoder - det kommer aldrig gå att jobba digitalt om saker som detta levereras 1) Galet med egna _hittepå__ konstruktioner som "Prefix to year of death" / "Prefix to year of birth" .... hur skall svenskt kulturarv kunna koppla ihop sig om ni alla skapar silos med egna konstruktioner 1) Funder över att använda ex. SKOS se dialog med Skansen som inte heller dom är ingengörsmässiga 1) Arbeta aktivt med er metadatadebt se #29 1) Finns det tankar om change management hos Riksarkivet? Datasettet ovan heter SBL_2023.csv hur kommer dom hantera ändringar? 1) jag har tidigare saknat att Riksarkivet hantera felrapporteringen proffsigt #3 - gissar att dumpa nya dataset med ändringar utan versionshantering och källor blir för den som skall använda det ett Maintenance Hell jmf RAÄ 1) FAIRDATA F1 - alla personer yrken platser skall ha persistenta unika identifierare #7
Felaktigt data i SBL enl. Wikidata