atviriduomenys / katalogas

Lietuvos atvirų duomenų katalogas (data.gov.lt).
14 stars 2 forks source link

Duomenų rinkinių paklausos vertinimo tobulinimas (prioriteto balo formulės keitimas) #9

Open sirex opened 3 years ago

sirex commented 3 years ago

Esama situacija

Šiuo metu prioriteto nustatymas įgyvendintas taip:

Nustatant prioritetą, duomenų rinkiniams suteikiamas prioriteto balas, kuris gali būti nuo 0 iki 100.

Duomenų rinkinių prioritetų sistema nenumato jau atvertų rinkinių brandos lygio kėlimo galimybės. Jei duomenų rinkinys atvertas, tada jam suteikiamas maksimalus balas ir toliau jokie kriterijai nevertinami.

Jei duomenų rinkinys dar nėra atvertas, tada balai sumuojami taip:

Minėtos duomenų panaudojimo sritys, už kurias skiriama po 3 balus, jei pažymi įstaigos koordinatorius ir po 10 balų, jei pažymi bent vienas duomenų naudotojas poreikyje:

Trūkumai

Esamas prioriteto balo nustatymas turi šiuos trūkumus:

Sprendimas

Reikėtų atskirti prioriteto balą, nuo duomenų rinkinio atvėrimo ar sudėtingumo atverti būsenos.

Rinkiniams turėtu būti suteikiamas ne prioriteto, o paklausos balas. Tiek atverti, tiek planuojami atverti rinkiniai turėtu vienodą paklausos skaičiavimo metodiką.

Norint įvertinti, kokiu duomenų rinkinius atverti pirmiausia, paprasčiausiai juos reikėtų filtruoti, pagal būseną „Neatverti“ arba pagal brandos lygį.

Tada pagal paklausos rodiklį, būtų galima įvertinti, kuriuos duomenų rinkinius atverti, o kuriems pakelti brandos lygį.

Pats balas būtų skaičiuojamas pagal tokią formulę:

p = \frac{\frac{v}{V} * k_v + \frac{l}{L} * k_l + \frac{d}{D} * k_d + \frac{u}{U} * k_u)}{k_v + k_l + k_d + k_u} * 100

Tokių būdu, atvirų duomenų portalo lankytojai bus skatinami teikti panaudojimo atvejus, panaudojimo atvejus galėtų teikti ir pačių įstaigų koordinatoriai, tai pakeistų dabar naudojamas penkias panaudojimo atvejų sritis.

sirex commented 3 years ago

Išbandžiau, kaip tokia duomenų rinkinių paklausos formulė veiktų ant realių ADK duomenų:

dataset v l d u score
Neformaliojo vaikų švietimo programos 44 0 0 1 36.7737
Sugebėjimų duomenys 363 0 2 0 22.1333
Licencijuotų kelionių organizatorių sąrašas 3582 4 1 0 15.4412
Studentų skaičius 3 96 1 1 0 11.9682
Jungtinės klasės 91 1 1 0 11.9672
Ūkininkų ūkių žemėnaudų grupavimas pagal bendrą plotą 224 0 1 0 11.0754
Priimtų į pirmą kursą studentų skaičius 2 222 0 1 0 11.0750
Galvijų kraujo laipsnio duomenys 168 0 1 0 11.0639
Reikalavimai pašalinti pažeidimus R1 117 0 1 0 11.0534
Įmonių restruktūrizavimo ataskaitų duomenys 17 0 1 0 11.0329
sirex commented 3 years ago

In GitLab by @JuliusLADP on Aug 30, 2021, 14:26

Pridedu dokumentą, kuriame pateikiu savo komentarus ir pastabas dėl tų punktų, kurie negali būtų traktuojamai vienareikšmiškai taip kaip siūloma pateiktame dokumente. Informacija_portalo_naudotojo_sąsajų_pakeitimo_aptarimui.docx

sirex commented 3 years ago

marked this issue as related to #27

sirex commented 3 years ago

marked this issue as related to #26