salgo60 / Wikidata_riksdagen-corpus

repository for matching Wikidata with riksdagen-corpus
MIT License
12 stars 1 forks source link

Riksdagen Öppna data problem - backlog #50

Open salgo60 opened 1 year ago

salgo60 commented 1 year ago

DOI

I brist på att Riksdagens öppna data har en publik backlog så sparar jag problem vi hittar se även lista på saker vi ser behövs för att fungera bra i ett Wikidata ekosystem se även hur vi jobbar med Nobelprize.org och samma som, min vision 2018

Önskvärt

1) skall Linked data skala så bör vi hitta bra mönster att beskriva vilka värden en identifierare kan ha. I Wikidata använder vi regexp för detta - ett bra mönster som fångar många fel. ... se tankar

image
salgo60 commented 1 year ago

Intressanta siffror från DS 1998:10 vad kostar dagens tomteverkstad

Kostnaden av dålig data för Rättsinformation enl. DS 1998:10

12 Kostnader och vinster sid 153 - år 1998 bara för Rättsinformation..

image image image image
SchermanJ commented 1 year ago

Första motionen för 22/23 är nu importerad till wikidata. https://www.wikidata.org/wiki/Q114435219

salgo60 commented 1 year ago

Refererar denna lista från community.dataportal.se

SchermanJ commented 1 year ago

Den sedan tidigare konstaterade bristen av lagstiftande utskott kan i viss mån åtgärdas genom informationen i riksdagens protokoll, men det är ett stadigt manuellt arbete som behöver genomföras. https://www.riksdagen.se/sv/dokument-lagar/dokument/protokoll/riksdagens-protokoll-19848569_G80969

salgo60 commented 1 year ago

@SchermanJ har du exempel på dålig OCR så lägg gärna in dom här som en återkoppling till Riksdagen....

Målet tycker jag borde vara TEI Parla-Clarin men jag har noll koll på om Riksdagens öppna data och projektet Riksdagens Corpus "pratar med varandra" länk

image