KohaSuomi / Koha

(KOHA) Koha is a free software integrated library system (ILS). Koha is distributed under the GNU GPL version 3 or later. Note: this is a synced mirror of the official Koha repo.
https://koha-community.org/
GNU General Public License v3.0
7 stars 13 forks source link

RDA-konversio kaikkiin kimppoihin, joissa sitä ei ole tehty #834

Open AnneliO opened 8 months ago

AnneliO commented 8 months ago

Tukipyyntö

Kaikkiin kimppoihin, joihin ei vielä ole tehty RDA-konversiota, pitäisi tehdä sellainen.

Jotain muuta?

https://github.com/KohaSuomi/koha-suomi-marc-conversion-tool/wiki

No response

AnneliO commented 8 months ago

Liittyy tikettiin #390

johannaraisa commented 7 months ago

Tätin testillä on välivarastossa RDA-konvertoidut tietueet, sieltä voi käydä tarkastelemassa testikonversion tuloksia. Itse konversio meni suhteellisen nopeasti, siinä meni 3,5 tuntia, mutta tietueiden ajaminen välivarastoon kesti 39 tuntia.

AnneliO commented 7 months ago

MARC 21 ISBD -> MARC 21 RDA Kansalliskirjaston Kiwissä

johannaraisa commented 7 months ago

Nyt testillä on pienempi joukko, joille on tehty ensin isbd-konversio, jotta saadaan 336 ja 337 kentät, ja sitten rda-konversio. Hieman epäselvää mitä pitää ajaa ennen tuota rda-konversiota.

Kati-Helle commented 6 months ago

Katsoin täältä (olikohan oikea paikka?) kuva

dvd-tietuetta Shanghai nights (biblionumber 2533)

040-kenttä puuttuu https://wiki-emerita.it.helsinki.fi/pages/viewpage.action?pageId=400875270#id-01X04XNumerojakoodikent%C3%A4t-040

245h-kentän yleismääre poistunut - ok 300b-kentän lyhenne avattuna - ok 336-338-kentät muodostuneet - ok 700e-kentän termit avattuina - ok

Tietuevertailusivu testi-Tätissä https://tati-test.koha-suomi.fi/cgi-bin/koha/tools/showdiffmarc.pl?batchid=25349&importid=3233082&id=2533&type=biblio

AnttHeik commented 6 months ago

Tuo 040-kenttä jää pois (tai siis tarkemmin 040e), koska näistä tulee vain RDA-hybridejä. Tuolta Annelin linkkaamasta linkistä voi lukea mitä suunnilleen tapahtuu.

Kati-Helle commented 6 months ago

Tuo 040-kenttä jää pois (tai siis tarkemmin 040e), koska näistä tulee vain RDA-hybridejä. Tuolta Annelin linkkaamasta linkistä voi lukea mitä suunnilleen tapahtuu.

Tuota minäkin mietin... Tässä kommenttini ohjeessa https://wiki-emerita.it.helsinki.fi/pages/viewpage.action?pageId=400875270#id-01X04XNumerojakoodikent%C3%A4t-040 mainitaan näin

kuva

AnneliO commented 6 months ago

MARC 21 ISBD -> MARC 21 RDA Kansalliskirjaston Kiwissä

@Kati-Helle täältä näkee suunnilleen, mitä konversiossa tapahtuu. Säännöt eivät varmastikaan ole yhtä tarkat kuin varsinaiset RDA-kuvailusäännöt.

AnttHeik commented 6 months ago

Tuo 040-kenttä jää pois (tai siis tarkemmin 040e), koska näistä tulee vain RDA-hybridejä. Tuolta Annelin linkkaamasta linkistä voi lukea mitä suunnilleen tapahtuu.

Tuota minäkin mietin... Tässä kommenttini ohjeessa https://wiki-emerita.it.helsinki.fi/pages/viewpage.action?pageId=400875270#id-01X04XNumerojakoodikent%C3%A4t-040 mainitaan näin

Jeps, eli monta kertaa noita rda-hybridejä muokataan jälkeen päin käsin täydelliseksi rda:ksi, esim. kun vaihdetaan 260-kentän tiedot 264-kenttään ja ehkä kaikenlaista muuta lisäystä.

Kati-Helle commented 6 months ago

Helle-Kohan käyttöönoton RDA-konversio Kansalliskirjaston konversiosäännöin lisäsi tietueille 040b-kentän ja 040c-kentän. Johtuneeko sitten siitä, että tuossa oli kyse myös muutoksesta Finmarc -> Marc21.

Kati-Helle commented 6 months ago

Testi-TäTin välivaraston ruotsinkielinen RDA-konvertoitu tietue https://tati-test.koha-suomi.fi/cgi-bin/koha/tools/showdiffmarc.pl?batchid=25352&importid=3233458&id=399097&type=biblio

kuva

020-kenttä (hft.) -> häftad. lopun piste ylimääräinen, po. häftad

300a-kentässä s. -> sivua
po. sidor

300b-kenttä ill. -> ill. po. illustrationer

300c-kenttä 22 cm. -> 22 cm ok

336-338-kentät ovat muodostuneet, mutta:

336a-kenttä teksti po. text

337a-kenttä käytettävissä ilman laitetta po. omedierad

338a-kenttä nide po. volym

Kati-Helle commented 6 months ago

Lyhenne hft. ilman sulkumerkkejä konvertoituu oikein ilman loppupistettä (biblionnumber 67338) kuva

johannaraisa commented 5 months ago

Testi-TäTin välivaraston ruotsinkielinen RDA-konvertoitu tietue https://tati-test.koha-suomi.fi/cgi-bin/koha/tools/showdiffmarc.pl?batchid=25352&importid=3233458&id=399097&type=biblio

kuva

020-kenttä (hft.) -> häftad. lopun piste ylimääräinen, po. häftad

300a-kentässä s. -> sivua po. sidor

300b-kenttä ill. -> ill. po. illustrationer

300c-kenttä 22 cm. -> 22 cm ok

336-338-kentät ovat muodostuneet, mutta:

336a-kenttä teksti po. text

337a-kenttä käytettävissä ilman laitetta po. omedierad

338a-kenttä nide po. volym

Ajelin nyt Tätin testiin uudestaan noita ja erottelin ruotsinkieliset omiin tiedostoihin. Ei tuossa taida olla muuta hyvää tapaa kuin tarkastella teoksen pääkieltä, kuten Vaskissa olivat tehneet.

https://tati-test.koha-suomi.fi/cgi-bin/koha/tools/showdiffmarc.pl?batchid=25398&importid=3240185&id=399097&type=biblio

AnttHeik commented 5 months ago

Joo, näin se varmaankin on.

Näköjään tuo ruotsinkielinen konversio ei avaa 300a-kentän s. lyhennettä ollenkaan, mutta ymmärää kyllä suomenkieliset lyhenteet:

kuva

Onko noihin konversiosääntöihin mahdollista tehdä muutoksia niihin termeihin, jotka eivät avaudu oikein tai eivät avaudu ollenkaan, vai pitääkö siitä keskustella Kansalliskirjaston kanssa, että korjaisivat konversiosääntöjä?

Esim. nämä virheet:

300b-kenttä ill. -> ill. po. illustrationer 337a-kenttä oförmedlad-termi, oikea käännös pitäisi olla omedierad

AnttHeik commented 5 months ago

Toinen kysymys: Oliko noissa testi-tätin konvertoiduissa tietueissa mukana kaikki tietueet vai vain osa? En löytänyt sieltä ollenkaan videotallenteita (Blu-ray ja DVD) tai videopelejä, vaikka niitä testikannassa kyllä näyttää olevan. Olisi mukava katsoa myös noita TäTin tietueita, miten ne kääntyvät.

Kati-Helle commented 5 months ago

Ruotsinkielisessä tietueessa 300b-kentän arvo kart. lyhenne auennut oikein :) kuva

johannaraisa commented 5 months ago

Joo, näin se varmaankin on.

Näköjään tuo ruotsinkielinen konversio ei avaa 300a-kentän s. lyhennettä ollenkaan, mutta ymmärää kyllä suomenkieliset lyhenteet:

kuva

Onko noihin konversiosääntöihin mahdollista tehdä muutoksia niihin termeihin, jotka eivät avaudu oikein tai eivät avaudu ollenkaan, vai pitääkö siitä keskustella Kansalliskirjaston kanssa, että korjaisivat konversiosääntöjä?

Esim. nämä virheet:

300b-kenttä ill. -> ill. po. illustrationer 337a-kenttä oförmedlad-termi, oikea käännös pitäisi olla omedierad

Kyllähän noita konversiosääntöjä voi muokata. Ilmeisesti Kansalliskirjasto ei ole sitten ylläpitänyt noita sääntöjä tuolla Githubissa, jos termit on vaihtuneet.

AnttHeik commented 5 months ago

Kyllähän noita konversiosääntöjä voi muokata. Ilmeisesti Kansalliskirjasto ei ole sitten ylläpitänyt noita sääntöjä tuolla Githubissa, jos termit on vaihtuneet.

Joo, siltä vähän vaikuttaa. Taidan huvikseni kysyä tästä tuolla Kansalliskirjaston Slackin puolella.