KohaSuomi / Koha

(KOHA) Koha is a free software integrated library system (ILS). Koha is distributed under the GNU GPL version 3 or later. Note: this is a synced mirror of the official Koha repo.
https://koha-community.org/
GNU General Public License v3.0
7 stars 13 forks source link

RDA-konversion testaus #974

Open pknuuti opened 9 months ago

pknuuti commented 9 months ago

Tukipyyntö

Koha-Suomen kuvailuryhmän kokouksessa päätettiin tehdä tiketti, johon kimpat voivat ilmoittaa biblionumberit nimekkeistä, jotka halutaan kimpassa testiaineistoksi ISBD- ja RDA-konversiota varten. Testaukseen on syytä valita eri kielisiä nimekkeitä ja eri aineistotyyppejä, jotta saadaan käsitys miten konversio toimii kimpan aineistossa. Mukaan kannattaa ottaa vähän vanhempaa aineistoa, jonka kuvailutiedoissa voi olla puutteita, jonka vuoksi konversio ei välttämättä mene oikein. Aikatauluksi sovittiin, että viimeistään tammikuun alkupuolella testattavien listat pitäisi olla esillä.

Jotain muuta?

Testit tehty

AnttHeik commented 6 months ago

Hei @johannaraisa tai @emta001 olisiko mahdollista ajaa nuo OUTIn ruotsinkieliset testitietueet vielä suomenkielisillä konversiosäännöillä, niin katsoisin miten ne siinä käyttäytyvät?

emta001 commented 6 months ago

Hei @johannaraisa tai @emta001 olisiko mahdollista ajaa nuo OUTIn ruotsinkieliset testitietueet vielä suomenkielisillä konversiosäännöillä, niin katsoisin miten ne siinä käyttäytyvät?

Nämä on nyt ajattu OUTIin.

AnttHeik commented 4 months ago

Hei @johannaraisa ja @emta001 nyt kun Kansalliskirjasto on taas päivittänyt noita ISBD- ja RDA-konversio-ohjelmia, niin ehtisittekö jossain välissä ajaa nuo OUTIn esimerkkitietueet vielä uudestaan ja niiden lisäksi vielä nämä alla olevat tietueet?

1900903 2035797 1922402 1922401 1905182 2189685 1891818 1855300 2348620 2352483 1859948 1862726 1855421 1907021 1895040 1861138 1861403 2343846 1355514 1823489 1364764 1438742 1848511 1708732 1925243 1850201 2302770 1207908 1392240 1434060 2183413 2130263 2134300 1950082 1896234

johannaraisa commented 4 months ago

Hei @johannaraisa ja @emta001 nyt kun Kansalliskirjasto on taas päivittänyt noita ISBD- ja RDA-konversio-ohjelmia, niin ehtisittekö jossain välissä ajaa nuo OUTIn esimerkkitietueet vielä uudestaan ja niiden lisäksi vielä nämä alla olevat tietueet?

1900903 2035797 1922402 1922401 1905182 2189685 1891818 1855300 2348620 2352483 1859948 1862726 1855421 1907021 1895040 1861138 1861403 2343846 1355514 1823489 1364764 1438742 1848511 1708732 1925243 1850201 2302770 1207908 1392240 1434060 2183413 2130263 2134300 1950082 1896234

Joo, pitää vaan eka napata ne uudet säännöt meille matkaan. Katsotaan huomenna.

AnttHeik commented 4 months ago

Jes, hyvä juttu! :)

johannaraisa commented 4 months ago

Hei @johannaraisa ja @emta001 nyt kun Kansalliskirjasto on taas päivittänyt noita ISBD- ja RDA-konversio-ohjelmia, niin ehtisittekö jossain välissä ajaa nuo OUTIn esimerkkitietueet vielä uudestaan ja niiden lisäksi vielä nämä alla olevat tietueet? 1900903 2035797 1922402 1922401 1905182 2189685 1891818 1855300 2348620 2352483 1859948 1862726 1855421 1907021 1895040 1861138 1861403 2343846 1355514 1823489 1364764 1438742 1848511 1708732 1925243 1850201 2302770 1207908 1392240 1434060 2183413 2130263 2134300 1950082 1896234

Nyt löytyy uusi välivarastoitu tietue OUTIsta.

AnttHeik commented 4 months ago

Hei @johannaraisa ja @emta001 nyt kun Kansalliskirjasto on taas päivittänyt noita ISBD- ja RDA-konversio-ohjelmia, niin ehtisittekö jossain välissä ajaa nuo OUTIn esimerkkitietueet vielä uudestaan ja niiden lisäksi vielä nämä alla olevat tietueet? 1900903 2035797 1922402 1922401 1905182 2189685 1891818 1855300 2348620 2352483 1859948 1862726 1855421 1907021 1895040 1861138 1861403 2343846 1355514 1823489 1364764 1438742 1848511 1708732 1925243 1850201 2302770 1207908 1392240 1434060 2183413 2130263 2134300 1950082 1896234

Nyt löytyy uusi välivarastoitu tietue OUTIsta.

Jes, kiitokset! Minäpä käyn ne läpi.

AnttHeik commented 4 months ago

Hei @johannaraisa ja @emta001 nyt kun Kansalliskirjasto on taas päivittänyt noita ISBD- ja RDA-konversio-ohjelmia, niin ehtisittekö jossain välissä ajaa nuo OUTIn esimerkkitietueet vielä uudestaan ja niiden lisäksi vielä nämä alla olevat tietueet? 1900903 2035797 1922402 1922401 1905182 2189685 1891818 1855300 2348620 2352483 1859948 1862726 1855421 1907021 1895040 1861138 1861403 2343846 1355514 1823489 1364764 1438742 1848511 1708732 1925243 1850201 2302770 1207908 1392240 1434060 2183413 2130263 2134300 1950082 1896234

Nyt löytyy uusi välivarastoitu tietue OUTIsta.

Hei, voisitko ajaa vielä ne aiemmat OUTIn tietueet, kun niissä oli muutama sellainen tapaus, jotka piti korjaantua tässä, mutten ottanut sellaisia mukaan tuohon uuteen satsiin?

johannaraisa commented 4 months ago

Nyt ne on ajettu suomenkielisillä, en nyt enää muista pitikö erotella OUTIssa ruotsi.

AnttHeik commented 3 months ago

Nyt ne on ajettu suomenkielisillä, en nyt enää muista pitikö erotella OUTIssa ruotsi.

Jes, kiitokset. Tämä oli oikein hyvä, niin näki, miten ruotsinkieliset tietueet käyttäytyvät suomenkielisissä säännöissä. Voisitko kuitenkin ajaa nuo ruotsinkieliset vielä ruotsikielisellä ohjelmalla, niin näkee korjaantuiko niissä olleet viat? :)

johannaraisa commented 3 months ago

Nyt ne on ajettu suomenkielisillä, en nyt enää muista pitikö erotella OUTIssa ruotsi.

Jes, kiitokset. Tämä oli oikein hyvä, niin näki, miten ruotsinkieliset tietueet käyttäytyvät suomenkielisissä säännöissä. Voisitko kuitenkin ajaa nuo ruotsinkieliset vielä ruotsikielisellä ohjelmalla, niin näkee korjaantuiko niissä olleet viat? :)

Nyt on ajettu ruotsinkieliset.

johannaraisa commented 3 months ago

Ajelin OUTIssa testitietueille uudestaan konversiot päivitetyillä mäppäyksillä, niitä oli korjattu viime viikolla. Vielä puuttuu se tieto, miten erotellaan ruotsinkielinen kirja-aineisto, oliko siitä jo tiketti?

AnttHeik commented 3 months ago

Ajelin OUTIssa testitietueille uudestaan konversiot päivitetyillä mäppäyksillä, niitä oli korjattu viime viikolla. Vielä puuttuu se tieto, miten erotellaan ruotsinkielinen kirja-aineisto, oliko siitä jo tiketti?

Kiitokset, ne jutut oli korjaantuneet, mitä pitikin, mutta samalla oli tullut pari uutta bugia. Jostain syystä ruotsinkielinen konversio käyttää nyt enemmän suomen kieltä kuin aiemmin. Raportoin siitä eteenpäin.

Vielä ei ole tikettiä. Mietin, että olisiko tätä toista tikettiä pitänyt käyttää siihen, jos muokkaisi tuohon alkutekstiin sen ruotsinkielisen aineiston vai suljetaanko tämä ja tehdään toinen: https://github.com/KohaSuomi/Koha/issues/834 ?

johannaraisa commented 3 months ago

Ajelin OUTIssa testitietueille uudestaan konversiot päivitetyillä mäppäyksillä, niitä oli korjattu viime viikolla. Vielä puuttuu se tieto, miten erotellaan ruotsinkielinen kirja-aineisto, oliko siitä jo tiketti?

Kiitokset, ne jutut oli korjaantuneet, mitä pitikin, mutta samalla oli tullut pari uutta bugia. Jostain syystä ruotsinkielinen konversio käyttää nyt enemmän suomen kieltä kuin aiemmin. Raportoin siitä eteenpäin.

Vielä ei ole tikettiä. Mietin, että olisiko tätä toista tikettiä pitänyt käyttää siihen, jos muokkaisi tuohon alkutekstiin sen ruotsinkielisen aineiston vai suljetaanko tämä ja tehdään toinen: #834 ?

Tehdään vaan toinen.

johannaraisa commented 3 months ago

Taisin ajaa ruotsinkieliset väärällä init-tiedostolla, otetaas uusiksi ja katsotaan kohta.

johannaraisa commented 3 months ago

Taisin ajaa ruotsinkieliset väärällä init-tiedostolla, otetaas uusiksi ja katsotaan kohta.

Ei mitään, oli se oikein sittenkin, katsoin vaan väärin.

johannaraisa commented 3 months ago

Liittyyköhän se ruotsinkielisten ongelma tähän ehtoon? If (RegFind(@040$b, 'swe') >= 0) Then Table ('336_a_svenska.tbl') Else Table ('336_a.tbl')

johannaraisa commented 3 months ago

Liittyyköhän se ruotsinkielisten ongelma tähän ehtoon? If (RegFind(@040$b, 'swe') >= 0) Then Table ('336_a_svenska.tbl') Else Table ('336_a.tbl')

Ehkä ei, taitaa olla aikaisemmassakin versiossa.

AnttHeik commented 3 months ago

Liittyyköhän se ruotsinkielisten ongelma tähän ehtoon? If (RegFind(@040$b, 'swe') >= 0) Then Table ('336_a_svenska.tbl') Else Table ('336_a.tbl')

Ehkä ei, taitaa olla aikaisemmassakin versiossa.

Juu, ei varmaankaan, koska tässäkin on tuo 040b-kenttä, mutta siitä huolimatta kääntää 336-kentän suomeksi: kuva

johannaraisa commented 3 months ago

Viime viikolla oli tullut jotain korjauksia, ajetaanko tietueet uudestaan?

AnttHeik commented 3 months ago

Viime viikolla oli tullut jotain korjauksia, ajetaanko tietueet uudestaan?

Minäpä kysäisen varalta, onko nuo niitä korjauksia, joista ilmoiteltiin. Ainakaan mitään viestiä niiden korjaamisesta ei tullut.

AnttHeik commented 3 months ago

Viime viikolla oli tullut jotain korjauksia, ajetaanko tietueet uudestaan?

Minäpä kysäisen varalta, onko nuo niitä korjauksia, joista ilmoiteltiin. Ainakaan mitään viestiä niiden korjaamisesta ei tullut.

Kyseessä oli ollut vain jokin pikkubugin korjaus, joten ei varmaan kannata ajaa tässä välissä. Loppujen korjaaminen menee kuulemma ensi viikolle tai sitä seuraavalle muiden kiireiden takia.

johannaraisa commented 3 months ago

Viime viikolla oli tullut jotain korjauksia, ajetaanko tietueet uudestaan?

Minäpä kysäisen varalta, onko nuo niitä korjauksia, joista ilmoiteltiin. Ainakaan mitään viestiä niiden korjaamisesta ei tullut.

Kyseessä oli ollut vain jokin pikkubugin korjaus, joten ei varmaan kannata ajaa tässä välissä. Loppujen korjaaminen menee kuulemma ensi viikolle tai sitä seuraavalle muiden kiireiden takia.

Toivottavasti tulisi ennen kuin jään lomalle. Voisin tehdä valmiiksi sen miten erotellaan se ruotsinkielinen kirja-aineisto, ettei jää Emmille. Onko jo tikettiä?

AnttHeik commented 3 months ago

Viime viikolla oli tullut jotain korjauksia, ajetaanko tietueet uudestaan?

Minäpä kysäisen varalta, onko nuo niitä korjauksia, joista ilmoiteltiin. Ainakaan mitään viestiä niiden korjaamisesta ei tullut.

Kyseessä oli ollut vain jokin pikkubugin korjaus, joten ei varmaan kannata ajaa tässä välissä. Loppujen korjaaminen menee kuulemma ensi viikolle tai sitä seuraavalle muiden kiireiden takia.

Toivottavasti tulisi ennen kuin jään lomalle. Voisin tehdä valmiiksi sen miten erotellaan se ruotsinkielinen kirja-aineisto, ettei jää Emmille. Onko jo tikettiä?

Joo, niinpä. Toivoin vähän, että olisivat jo tälle viikolle ehtineet nuo korjaukset. Minä jään nyt huomisesta lomalle ja tuun takas 10.6. Nyt ei sitten ehdi itse testaamaan, jos korjauksia tulee sillä välin. Voisin melkein varalta listata ne tähän, jos jossakin toisessa kannassa voi testata sitten sillä välin tarvittaessa.

Ei ole vielä tikettiä, mutta pyysin tänään Päiviä tekemään tiketin noista ruotsinkielisistä.

AnttHeik commented 3 months ago

Kirjaan tähän vielä ylös edellisessä OUTIn testissä havaitut virheet, joista on tehty Kansalliskirjastolle korjauspyyntö:

Suomenkieliset konversiot:

Tekstiaineistoon muodostuu 337-kenttään vain arvo "määrittelemätön välittävä laite". Samoin jos 245a ja b-kenttiä erottaa = -merkki, niin niiden väliin lisätään kuitenkin vielä lisäksi kaksoispiste. Tässä tietueessa näkyy molemmat tapaukset: kuva

240o- ja m-kentistä katoaa nyt tiedot kokonaan ja niiden tilalla on RDA-tietueessa vain arvo 1: kuva kuva

710-kenttän loppuun tulee piste, vaikkei pitäisi: kuva

Jostakin syystä poistaa moniviestimiltä 336, 337, ja 338-kentistä 3-osakentät, vaikka niitä on käytetty ihan oikein: kuva

Moniviestimissä tietueeseen muodostuu 338-kenttä, jossa arvo ”äänilevy”, vaikkei sitä ole aineistossa ollenkaan: kuva

Moniviestimissä tietueeseen muodostuu 338-kenttä, jossa arvo ”äänilevy”, vaikka pitäisi olla ”äänikasetti”: kuva

Ruotsinkieliset konversiot:

338-kenttään muodostuu nyt suomenkielinen termi: kuva

336-kenttään muodostuu suomenkielinen termi: kuva

Toisen 336-kentän text kääntyy muotoon teksti: kuva

Tässä text-termi pysyy kuitenkin ruotsinkielisenä 336-kentässä, joten ei ihan yhtenäisesti mene tuon kentän konversio: kuva

AnttHeik commented 3 months ago

Noiden yllä olevien lisäksi kyselin erinäisiä korjauksia 336-, 337- ja 338-kenttien järjestyksiin ja termien kirjoitusvirheisiin tai niiden puuttumiseen liittyen. Konversio näyttää korjaavan niitä vähän epäloogisesti. Lisäksi kysyin, onko mahdollista tarkistaa osakenttien järjestys 336-, 337- ja 338-kentissä, ja jos se on väärä, niin vaihtaa se oikeaksi 3 a b 2. Tämä kuulemma on mahdollista.

johannaraisa commented 3 months ago

Katselin, että Kansalliskirjasto oli jotain korjauksia tehnyt eilen. Ajelin OUTIin tänään testit uusilla mäppäyksillä.

AnttHeik commented 3 months ago

Katselin, että Kansalliskirjasto oli jotain korjauksia tehnyt eilen. Ajelin OUTIin tänään testit uusilla mäppäyksillä.

Ok, hyvä homma. Kyselinkin eilen taas Nicholakselta noiden korjausten etenemisestä. Minäpä kattelen nuo läpi.

AnttHeik commented 3 months ago

Ei siellä kyllä hirveästi oltu vielä korjattu (muutamat välimerkki- ja termivirheet vasta), mutta Nicholas aikoi heittää Githubiin nyt lisää korjauksia ellei jo laittanutkin.

Ruotsinkielisen aineiston suhteen pitäisi nyt mennä niin, että jos 040b-kentässä on arvo swe, niin suomenkielinenkin konversio osaa pitää ruotsin kielen ruotsin kielenä. Ongelma on vain sitten ne tietueet, joissa tuota 040b-kenttää ei ole, ja jonkin verran ainakin OUTIsta löytyy ISBD-ajalta ruotsiksi kuvailtuja äänitteitä ja nuotteja. Mietin vähän, että noille voisi olla järkevintä tehdä niin, että jokainen hakee ne tietokannastaan 336a-kentän tietojen perusteella ja lisää tietueisiin 040b-kentän erämuokkauksella, jolloin tietueet pysyisivät oikein konversiossa. Tein parille OUTIn testitietueelle näin, joten katotaan ensin, miten ne käyttäytyvät nyt seuraavassa testiajossa.

johannaraisa commented 3 months ago

Nyt on taas uudet testit OUTIssa.

AnttHeik commented 3 months ago

Nyt näyttäs kaikki muuten hyvältä, paitsi jotkin moniviestimet bugittaa ja sitten nuo ruotsinkieliset, jotka menee edelleen vähän miten sattuu sekä ruotsinkielisessä että suomenkielisessä konversiossa. Pistän tuonne ruotsinkielisten tikettiin niistä oman kommenttinsa.

AnttHeik commented 3 weeks ago

@johannaraisa tai @emta001 Nyt on taas konversiosääntöjä päivitetty, joten jos ehditte jossain välissä, niin OUTIn testitietueet voisi ajaa taas läpi.

johannaraisa commented 3 weeks ago

Nyt on OUTIssa uudet tiedostot.

AnttHeik commented 3 weeks ago

Vielä tuli yhdet korjaukset sekä suomen- että ruotsinkielisiin sääntöihin, joten jos hurautetaan nuo OUTIn ja TäTin tietueet vielä kerran läpi :)

johannaraisa commented 3 weeks ago

Vielä tuli yhdet korjaukset sekä suomen- että ruotsinkielisiin sääntöihin, joten jos hurautetaan nuo OUTIn ja TäTin tietueet vielä kerran läpi :)

Nyt löytyy uudet, noissa ei ole sitä ruotsinkielisen tekstiaineiston erottelua, pitäisi palauttaa koodi sen osalta.

AnttHeik commented 3 weeks ago

Kiitokset, hyvältähän nuo nyt näyttää. Pitäiskö kuitenkin TäTin puolella palauttaa vielä tuo koodi päälle, siellä kun oli yks tietue, joka käyttäytyi suomenkielisessä ajossa epämääräisesti?

johannaraisa commented 3 weeks ago

Kiitokset, hyvältähän nuo nyt näyttää. Pitäiskö kuitenkin TäTin puolella palauttaa vielä tuo koodi päälle, siellä kun oli yks tietue, joka käyttäytyi suomenkielisessä ajossa epämääräisesti?

Nyt on uudet TäTissä.

AnttHeik commented 2 weeks ago

Hei, vielä tuli muutama korjaus sääntöihin, joten ainakin OUTIn ja TäTin tietueet voisi ajaa vielä uudestaan.

"Ainakin tuplasulkuja ei pitäisi enää tulla, ja yritin korjata myös tuota käännöspäätöslogiikkaa,

Samaten tuonne tuli muutama muu pieni muutos. Lähinnä 300$e-osakenttiä aukikirjoitetaan enempi (+ nuoteille parts muutetaan stemmoiksi). Sitten yksi 336$b puuttuminen lisätty/palautettu, 546$b Staff notation => Viivastonuottikirjoitus."

johannaraisa commented 2 weeks ago

Nyt on OUTIssa ja TäTissä uudet testitietueet.

AnttHeik commented 2 days ago

Hei, vieläkin saatiin parit korjaukset ja lisäykset noihin sääntöihin, joten josko vielä kerran voisi ajaa nuo OUTIn ja TäTin testitietueet läpi? :)

johannaraisa commented 2 days ago

Tuotannot in ns. jäädytetty, jos tuon sinne uutta koodia niin minun pitää muistaa sitten torstaina hakea ne uudestaan. Laitan jonnekin ylös, että muistan sitten torstaina.

johannaraisa commented 2 days ago

Tuotannot in ns. jäädytetty, jos tuon sinne uutta koodia niin minun pitää muistaa sitten torstaina hakea ne uudestaan. Laitan jonnekin ylös, että muistan sitten torstaina.

Tai tehdäänkö niin, että ajan nämä vasta huomenna, kun remontti on valmis?

AnttHeik commented 2 days ago

Tuotannot in ns. jäädytetty, jos tuon sinne uutta koodia niin minun pitää muistaa sitten torstaina hakea ne uudestaan. Laitan jonnekin ylös, että muistan sitten torstaina.

Tai tehdäänkö niin, että ajan nämä vasta huomenna, kun remontti on valmis?

Joo, tehdään vain noin.

johannaraisa commented 1 day ago

Nyt on TäTissä ja OUTIssa uudet testit.

AnttHeik commented 1 day ago

Kommenttina vielä, että hyvin meni viimeiset testit läpi. Nyt voi konvertoida TäTin :)