Tietoarkisto / metka

Metka-projekti
BSD 3-Clause "New" or "Revised" License
1 stars 3 forks source link

DDI import: aineiston kuvailun kenttien kopioitumisessa ongelmia #307

Open minna-aaltonen opened 9 years ago

minna-aaltonen commented 9 years ago

Aineistot | Kuvailu -välilehden kenttien englanninkielinen ja ruotsinkielinen DDI import ei tuo käännettyjä tietoja kenttiin lainkaan. Tein importin testiympäristöstä löytyvällä tiedostolla /tmp/test/DDI/id_28_revision_4_ddi_en.xml ja id_28_revision_4_ddi_sv.xml, kumpikin uuteen aineistoon, jolla oli vain nimi annettu.

Seuraavissa Aineistot | Kuvailu välilehden kentissä on myös suomenkielisessä DDI importissa on mahdollisesti jotain ongelmia:

Tekijät ja tuottajat:

Asiasanat ja tieteenalat:

Aineistonkeruu:

Muut materiaalit:

MetkaDev1 commented 9 years ago

Tähän olisi pitänyt tähdentää (ja ohjeisiin kirjoittaa) että kuvailuvälilehden tiedot tulevat importissa vain suomenkielelle, eli muunkielisten DDI-tiedostojen tietoja ei tuoda, ja vain jos välilehti on tyhjä. Tämä siitä syystä että DDI-tiedoston datan perusteella on täysin mahdotonta tuoda käännöksiä välilehdelle siten että ne ovat varmasti oikeilla tiedoilla (muunkieliset) ja siten että käyttäjän mahdollisesti tekemät muutokset jätettäisiin dataan (suomenkielinen, tästä syystä vain tyhjälle välilehdelle tuodaan tietoa). DDI-import on siis alkudatan tuontia aineistolle. Tarkemmin noihin virhetilanteisiin: sekä henkilö että organisaatiotekijöiden pitäisi kopioitua ja tarkalleen siten että ensin tulevat henkilötekijät ja sitten organisaatiotekijät. Tutkin asiaa. Muita tekijöitä ei voida tuoda koska tekijän tyyppiä ei voida päätellä DDI-tiedostosta. Tuottajien pitäisi kopioitua. Tutkin asiaa. Asiasanojen toteutus on tällä hetkellä väärin koska oletettiin näidenkin tulevan sanastosta. Korjataan asiasanojen toteutus ensin ja tarkistetaan sitten uudelleen. Kerääjät pitäisi kopioitua. Tutkin tätäkin. Myös linkit tietoarkiston ulkopuoliseen materiaaliin pitäisi kopioitua. Tarkistan tämänkin.

MetkaDev1 commented 9 years ago

Väliaikakommentti joka tuli vastaan kerääjiä testatessa. Pitää mainita myös jossain että organisaatio valinnat ja monet muut pudotusvalikkoarvot yritetään arvata tekstin perusteella (muuta tapaa ei importissa yleensä ole), eli jos esim. kahdella organisaatiolla on sama nimi niin näistä valitaan aina ensimmäinen vastaan tuleva (kuten meillä on demolla tapauksessa 'Testaus organisaatio')

MetkaDev1 commented 9 years ago

Nyt yllä mainitut ongelmakohdat korjattu.

LaKulmala commented 9 years ago

Dokumentaatioon lisätty DDI-importin yhteyteen seuraava selvennys:

DDI import: Sisältöön liittyvät erityisehdot ja mitä tietoja tuodaan: Kuvailu-välilehden tietojen tuontia varten välilehden tulee olla tyhjä. DDI:stä tuodaan kuvailutietoja vain suomenkielelle. Tekijöistä listataan ensin henkilötekijät ja sitten organisaatiotekijät. Pudotusvalikkojen tiedot tuodaan yleensä tekstin perusteella koska DDI ei sisällä järjestelmän käyttämiä arvoja. Näissä tapauksissa käytetään aina ensimmäistä vastaantullutta sopivaa tekstiä. Jos esimerkiksi kahdella organisaatiolla on sama nimi niin valitaan listalla ensin vastaan tuleva organisaatio.