Open danmichaelo opened 5 years ago
I utgangspunktet ønsker vi en slik modell:
der hver relasjon er mange-til-mange, slik at én kritikk kan omtale 0 eller flere verk (og et verk kan være omtalt i 0 eller flere kritikker), osv.
Ved en eventuell konvertering vil verkspostene få felt tittel
, forfatter
, dato
, utgivelssted
, sjanger
, språk
, kommentar
og fulltekst_url
.
Spørsmålet er om det er mulig å konvertere de eksisterende postene til en slik modell. Mange poster ser ut til å mangle nok informasjon til å opprette meningsfulle verksposter. Jeg har prøvd å dele disse inn i forskjellige typer.
1853 poster har ingen informasjon om omtalt verk. Det vil si, de mangler tittel
, forfatter
, dato
, utgivelssted
, sjanger
, språk
, kommentar
:
https://gist.github.com/danmichaelo/137058efcd50c9e5c26f2a05bdbcc47f
Eksempel: https://ub-baser.uio.no/norsk-litteraturkritikk/22659
Rent konverteringsmessig er disse forsåvidt greie. De vil ende opp som kritikker som omtaler 0 verk.
3575 poster har omtalt forfatter
, men mangler all annen verksinfo (tittel
, dato
, utgivelssted
, sjanger
, språk
, kommentar
):
https://gist.github.com/danmichaelo/2cace1c71f36534c6352183227c17639
Er det her hovedsakelig omtale av forfatterskap generelt? Disse postene bryter isåfall egentlig med modellen over fordi vi har en omtalt forfatter, men ikke omtalte verk.
En mulig løsning kan være å opprette pseudoverksposter for forfatterskap (én per forfatter).
572 poster har omtalt forfatter
og sjanger
, språk
eller kommentar
, men mangler grunnleggende verksinformasjon (tittel
, dato
, utgivelssted
):
https://gist.github.com/danmichaelo/3b29b7917f47e68f13abdf51d3e7b96c
Problemet med disse er at at kommentar
, sjanger
og/eller språk
ikke er nok til å opprette verksposter. Eller ønsker vi å opprette pseudoverksposter for disse også?
Denne vil da for eksempel gi tre pseudoverksposter: https://ub-baser.uio.no/norsk-litteraturkritikk/23496 for hhv. "lyrikk av Hofmo, Gunvor", "lyrikk av Øverland, Arnulf" og "lyrikk av Jonsson, Tor".
Mulig løsning: Rydde litt manuelt først, deretter opprette pseudoverksposter.
81 poster har sjanger
, språk
eller kommentar
, men mangler grunnleggende verksinformasjon (tittel
, dato
, utgivelssted
) og mangler forfatter
:
https://gist.github.com/danmichaelo/9544c7e9f900894a2c5e883725e0d089
Disse postene ser ut til å ikke vise til kritikk av bestemte verk, men til f.eks. "norsk lyrikk generelt"(?) som her: https://ub-baser.uio.no/norsk-litteraturkritikk/3241
Isåfall bryter de med modellen over. Ved en konvertering må vi ta stilling til: Ønsker vi å ta vare på verkskommentar, verkssjanger og verksspråk for disse? Isåfall hvordan? Vi kan ikke opprette verksposter basert på så lite informasjon. Kanskje kan informasjonen flyttes til kommentarfelt for kritikken? Lite antall poster, kan kanskje ryddes manuelt i forkant av en konvertering.
Forberedelser:
Vi tok opp tråden fra #11 på ny etter innspill fra Marte:
Det er enighet om at et verksregister vil heve basen.