Open sirex opened 3 years ago
Išbandžiau, kaip tokia duomenų rinkinių paklausos formulė veiktų ant realių ADK duomenų:
dataset | v | l | d | u | score |
---|---|---|---|---|---|
Neformaliojo vaikų švietimo programos | 44 | 0 | 0 | 1 | 36.7737 |
Sugebėjimų duomenys | 363 | 0 | 2 | 0 | 22.1333 |
Licencijuotų kelionių organizatorių sąrašas | 3582 | 4 | 1 | 0 | 15.4412 |
Studentų skaičius 3 | 96 | 1 | 1 | 0 | 11.9682 |
Jungtinės klasės | 91 | 1 | 1 | 0 | 11.9672 |
Ūkininkų ūkių žemėnaudų grupavimas pagal bendrą plotą | 224 | 0 | 1 | 0 | 11.0754 |
Priimtų į pirmą kursą studentų skaičius 2 | 222 | 0 | 1 | 0 | 11.0750 |
Galvijų kraujo laipsnio duomenys | 168 | 0 | 1 | 0 | 11.0639 |
Reikalavimai pašalinti pažeidimus R1 | 117 | 0 | 1 | 0 | 11.0534 |
Įmonių restruktūrizavimo ataskaitų duomenys | 17 | 0 | 1 | 0 | 11.0329 |
In GitLab by @JuliusLADP on Aug 30, 2021, 14:26
Pridedu dokumentą, kuriame pateikiu savo komentarus ir pastabas dėl tų punktų, kurie negali būtų traktuojamai vienareikšmiškai taip kaip siūloma pateiktame dokumente. Informacija_portalo_naudotojo_sąsajų_pakeitimo_aptarimui.docx
marked this issue as related to #27
marked this issue as related to #26
Esama situacija
Šiuo metu prioriteto nustatymas įgyvendintas taip:
Nustatant prioritetą, duomenų rinkiniams suteikiamas prioriteto balas, kuris gali būti nuo 0 iki 100.
Duomenų rinkinių prioritetų sistema nenumato jau atvertų rinkinių brandos lygio kėlimo galimybės. Jei duomenų rinkinys atvertas, tada jam suteikiamas maksimalus balas ir toliau jokie kriterijai nevertinami.
Jei duomenų rinkinys dar nėra atvertas, tada balai sumuojami taip:
Minėtos duomenų panaudojimo sritys, už kurias skiriama po 3 balus, jei pažymi įstaigos koordinatorius ir po 10 balų, jei pažymi bent vienas duomenų naudotojas poreikyje:
Trūkumai
Esamas prioriteto balo nustatymas turi šiuos trūkumus:
Neatsižvelgiama į tai, kad jau atvertam duomenų rinkiniui, gali būti keliamas brandos lygis. Todėl, net jei duomenų rinkinys jau atvertas, prioriteto balas turi būti nustatomas lygiai taip pat, kaip ir neatvertiems rinkiniams, tik šiuo atveju, prioritetas būtų nustatomas rinkinio brandos lygio kėlimui arba esamo rinkinio papildymui ar klaidų pataisymui.
Skaičiuojant balus suteikiamus už išreikštą poreikį, neatsižvelgiamą į:
Neatsižvelgiama, kad duomenų rinkinys ne būtinai gali būti atvertas pilna apimtimi, o už duomenų laukų skaičių ar sudėtingumą atverti atimami balai. Prioritetai turėtu būti nustatomi ne rinkinių, o duomenų laukų lygmeniu.
Prioritetų dalis labai retai pildoma, mažiau nei 5% duomenų rinkinių, turi pažymėtą bent vieną iš prioritetų nustatymo parametrų. Todėl, prioritetų nustatymas, kiek įmanoma turėtu būti automatizuotas.
Sprendimas
Reikėtų atskirti prioriteto balą, nuo duomenų rinkinio atvėrimo ar sudėtingumo atverti būsenos.
Rinkiniams turėtu būti suteikiamas ne prioriteto, o paklausos balas. Tiek atverti, tiek planuojami atverti rinkiniai turėtu vienodą paklausos skaičiavimo metodiką.
Norint įvertinti, kokiu duomenų rinkinius atverti pirmiausia, paprasčiausiai juos reikėtų filtruoti, pagal būseną „Neatverti“ arba pagal brandos lygį.
Tada pagal paklausos rodiklį, būtų galima įvertinti, kuriuos duomenų rinkinius atverti, o kuriems pakelti brandos lygį.
Pats balas būtų skaičiuojamas pagal tokią formulę:
p
$ - duomenų rinkinio paklausos balasv
$ - duomenų rinkinio peržiūrų skaičiusV
$ - didžiausias peržiūros skaičius iš visų rinkiniųk_v
$ - peržiūrų koeficientas, siūlyčiau naudoti $1
$.l
$ - duomenų rinkinio „patinka“ paspaudimų skaičiusL
$ - didžiausias „patinka“ paspaudimų skaičius iš visų rinkiniųk_l
$ - „patinka“ paspaudimų koeficientas, siūlyčiau naudoti $5
$.d
$ - duomenų rinkinio poreikių skaičiusD
$ - didžiausias poreikių skaičius iš visų rinkiniųk_d
$ - poreikių koeficientas, siūlyčiau naudoti $30
$.u
$ - duomenų rinkinio panaudojimo atvejų skaičiusU
$ - didžiausias panaudojimo atvejų skaičius iš visų rinkiniųk_u
$ - panaudojimo atvejų skaičiaus koeficientas, siūlyčiau naudoti $100
$.Tokių būdu, atvirų duomenų portalo lankytojai bus skatinami teikti panaudojimo atvejus, panaudojimo atvejus galėtų teikti ir pačių įstaigų koordinatoriai, tai pakeistų dabar naudojamas penkias panaudojimo atvejų sritis.