Closed BlazZupan closed 3 years ago
Za ta izroček smo se odločili implementirati skripte, ki znajo pridobiti podatke iz surovih datotek oziroma iz spletnih strani ter te predobdelati in zapisati v obliki, ki je primerna za shranjevanje v repozitoriju projekta. Ker so podatkovni viri različni, predvidevamo, da bo za vsak tip dokumentov oziroma za vsak projekt potrebno spisati svoj del kode za predobdelavo. Kot cilj tega izročka smo zato postavili izdelavo skript za branje spletnih podatkov o predlogih vladi in spletnih podatkov o zakonih.
Pripravili smo dve skripti, ki pridobita podatke iz interneta in jih pretvorita v primerno obliko za prenos v skladišče dokumentov:
Dela na tem izročku so zaključena.
Izroček 1.3: knjižnica za predobdelavo skladišča dokumentov v namen poenotenja zapisa dokumentov v enostavno berljivo tekstovno obliko.