anamariostarijas / APPR-2017

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2016/17
MIT License
0 stars 0 forks source link

Uvoz in poročilo #2

Open jaanos opened 7 years ago

jaanos commented 7 years ago

Pri uvozu iz HTML v html_rast_BDP.r ti številke uvozi kot faktorje - tako dobiš opozorilo pri uporabi funkcije melt, kasneje pa teh številk ne bi mogla prikazati na grafih. Zato bo najbolje, če hkrati z nadomeščanjem dvopičij z NA preostale vrednosti še pretvoriš v števila:

for (col in colnames(html.rast.BDP)[-1]) {
  html.rast.BDP[[col]] <- parse_number(html.rast.BDP[[col]], na = ":")
}

Posebnim znakom, kot je % (pa tudi šumnikom in presledkom) se izogibaj v imenih stolpcev. Tako lahko že pri funkciji melt podaš parameter value.name = "rast.BDP", da ne narediš stolpca z imenom % in tudi naknadno preimenovanje ni potrebno.

Poskrbi tudi za poročilo, da bo pripravljeno za ponedeljkovo predstavitev. Opiši torej svoj projekt in zbrane podatke ter izriši nekaj grafov in zemljevidov - za vsakega tudi napiši, kaj prikazuje. Poskrbi, da bo poročilo klicalo tvoje programe (torej zaenkrat uvoz/drzavna_poraba.r, uvoz/drzavna_poraba_delez_BDP.r, uvoz/html_rast_BDP.r in vizualizacija/grafi.r - pazi, da se velikosti črk ujemajo z imeni datotek!), da boš lahko grafe in zemljevide postavila na ustrezno mesto. Del poročila iz vzorca pobriši, da se ti bo lahko prevedlo. Da ti ne bo v poročilo izpisovalo opozoril, v glave blokov kode, kjer se pojavijo, dodaj parameter warning = FALSE - seveda pa se spodobi preveriti, zakaj dobivaš opozorila in jih odpraviti (npr. tako, da znakovne stolpce spremeniš v faktorje z istimi vrednostmi kot stolpec, s katerim združuješ).

anamariostarijas commented 7 years ago

Tudi ko uporabim zgornjo funkcijo, ki ste mi jo napisali, mi stolpec "leto" še vedno pusti v tipu factor. Poskusila sem ga še posebej spremeniti a mi iz nekega razloga ne deluje. Pri napaki mi napiše: not compatible with STRSXP.

jaanos commented 7 years ago

V html.rast.BDP nimaš stolpca leto (zato ti javi napako). Pretvorbo opravi na razpredelnici html.rast.BDP2, saj melt naredi faktor z imeni stolpcev iz originalne razpredelnice (v tvojem primeru torej faktor letnic). Zanka for poskrbi za pretvorbo vrednosti za vsako leto v števila.

Opozoril bi še, da se imena nekaterih držav v podatkih razlikujejo od imen v zemljevidu (konkretno to velja za Nemčijo in Češko). Imena držav lahko pregledaš z ukazoma

unique(evropa$name)
unique(drzavna.poraba.delez.BDP$drzava)

V podatkih potem spremeni imena držav tako, da se bodo ujemala z zemljevidom in bodo tako podatki prikazani za vse (evropske) države. Mimogrede lahko države v podatkih spremeniš v faktorje (pomagaj si s parse_factor), da ne boš dobivala opozoril ob združevanju.

V grafi.r grafov ne prikazuj - to naredi v poročilu (namesto, da še enkrat izrisuješ, lahko enostavno izrišeš že pripravljene grafe). Iz poročila tudi odstrani del iz vzorca (od analize naprej), da se ti bo prevedlo. Ko boš imela pripravljeno različico projekta za predstavitev, odpri issue na repozitoriju za zagovore, da dodam povezavo - tam si preberi natančnejša navodila.

jaanos commented 7 years ago

Še to: da ti v poročilo ne bo izpisovalo opozoril, lahko v glavo bloka kode, kjer se ta pojavijo, dodaš parameter warning = FALSE (še raje pa odpravi vzrok opozorila).