aidiss / opendatagovlt

For open data in Lithuania
2 stars 1 forks source link

YAML, lietuvių kalba ir laukų pavadinimai #18

Open aidiss opened 9 years ago

aidiss commented 9 years ago

Aprašinėjant ŠMM programų aprašus kilo klausimas. Kaip daryti su laukų pavadinimais?

ŠMM naudojamų laukų pavadinimų pavyzdžiai: Programos valstybinis kodas Programos kodas pagal Tarptautinę standartizuotą švietimo klasifikaciją (ISCED) Programos studijų sritis

Du klausimai:

  1. Ar išlaikome lietuvių kalbą?
  2. Gal galime sukurti kažkokį algoritmą, kuris lietuviškus pavadinimus nulietuvintų (paverstų ascii(?)) ir sudėtų brūkšnius?
  3. Ar kažkur laikysime žodyną, kuriame nurodyta, kokie originalūs laukų pavadinimai ir kokius pavadinimus naudojame mes?
sirex commented 9 years ago

Reikėtų laikytis Data Cube reikalavimu, kuriais remiantis, pavyzdžiui laukas „Programos valstybinis kodas“ pirmiausia turi būti apibrėžtas atskirai:

eg:programPublicCode a rdf:Property, qb:DimensionProperty;
    rdfs:label "Programos valstybinis kodas"@lt
    .

Turint aprašytą savybę eg:programPublicCode, toliau duomenyse reikėtų naudoti tą savybės pavadinimą. Tokiu būdu, duomenys bus semantiškai susieti.

Čia, klausimas yra daugiau toks, kiek pats esi nusiteikęs leistis į semantines detales? Kadangi atskirai išrašyti savybes, susirasti ar tokios savybės nėra kas nors aprašęs yra gan sudėtingas darbas.

Todėl išvengiant to sudėtingo semantinio susiejimo, galima tiesiog turėti mintyje, kad tai yra siekiamybė, prie kurios gal būt anksčiau ar vėliau prieisime, o tuo tarpu, duomenis reikėtų aprašyti taip, kad vėliau nekiltų sunkumų pereiti prie semantinio susiejimo.

Todėl iš esmės reikėtų stengtis visada taikyti tą patį kodinį pavadinimą, vienai savybei. Šiuo atveju, jei eg:programPublicCode turėtų būti unikalus, tarp visų duomenų rinkmenų, visame pasaulyje (bent jau tokia būtų siekiamybė). O jei savybė jau yra apibrėžta vienoje iš žinomų ontologijų, vėl gi, reikėtų naudoti žinomos ontologijos savybę, nekuriant savo (čia taip pat būtų siekiamybė).

Kitas klausimas dėl vardų erdvės, mano pavyzdžiuose eg vardų erdvė yra paimta iš Data Cube pavyzdžių yra tai yra pavyzdinė vardų erdvė. Mums reikėtų naudoti savo vardų erdvę, gal būt galime naudoti trumpinį adlt, kuris reikštų AtviriDuomenys.LT, galutinis pilnas URI šios vardų erdvės tikriausiai bus http://atviriduomenys.lt/terms/ ar kažkas panašaus.

Na, žodžiu aprašiau, kaip duomenys turėtų būti aprašomi teisingai, tačiau, kaip ir minėjau tai yra tik siekiamybė.