Open jaanos opened 7 years ago
Vidim, da ti zdaj prevede poročilo, tako da bom dodal povezavo do trenutnega commita dodal na repozitorij za zagovore. Če boš do predstavitve še kaj spreminjal, odpri issue na repozitoriju za zagovore, da posodobim povezavo - tam si preberi natančnejša navodila.
Imam sicer še nekaj pripomb:
Kot sem že napisal zgoraj, grafov ne izpisuj v vizualizacija.r
, pač pa za vsakega naredi svoj blok kode, npr.
```{r graf_a, echo=FALSE, fig.align='center', fig.cap='BDP izbranih držav skozi čas'}
a # seveda bi bilo kakšno bolj pomenljivo ime grafa boljše
(brez začetnega zamika). Tako boš lahko postavljal grafe, kamor želiš, in vmes še kaj dopisal.
Izogibaj se temu, da se ti na oseh oziroma legendah pojavijo števila v eksponentni notaciji - pri risanju grafa jih deli z ustreznim številom in v oznako osi napiši merilo, npr.
ggplot(mladi %>% filter(drzava == 'Hungary' | drzava == 'France' | drzava == 'Sweden' |
drzava == 'United Kingdom' | drzava == 'Italy' |
drzava == 'Slovenia' | drzava == 'Poland' |
drzava == 'Austria' | drzava == 'Croatia')) +
aes(x = leto, y = mladi/1000000, color = drzava) +
geom_line() + ggtitle("Mladi") + xlab("Leto") + ylab("Mladi (v milijonih)")
Seveda naj bo jasno, kaj natanko graf prikazuje - iz oznake Mladi
to namreč ni.
Graf Zaposlenost mladih
je prazen, ker je razpredelnica zaposlenost
prazna. Izgleda, da funkcija uvozi.zaposlenost
sicer deluje, tako da bo treba samo zapisati podatke v CSV, da se lahko uvozijo.
Ko imaš na osi x kategorične podatke (npr. države) bo bolje, če namesto točkovnega narediš stolpčni graf - geom_point()
nadomesti z geom_bar(stat = "identity")
.
Zemljevida ne filtriraj po državah, saj potem drugih držav ne bo prikazalo. Ko boš združeval s svojimi podatki, uporabi left_join
, da ti bo ohranilo vse države tudi po združevanju (tiste, za katere nimaš podatkov, bodo ostale sive). Da ti države pobarva (in ne samo obrobi), namesto color
podaj parameter fill.
Uvoz ti trenutno ne deluje, saj imaš v datoteki
yth_empl_010_1_Data.csv
nerazrešen konflikt - svetujem, da te podatke znova pridobiš in jih nadomestiš. Nerazrešen konflikt imaš tudi vREADME.md
.Sicer pa ti pri uvozu zgoraj omenjene datoteke javlja opozorilo, saj primerjaš vektorje različnih dolžin. Izpuščanje vrstic in stolpcev raje opravi s funkcijama
filter
oziromaselect
iz knjižnicedplyr
, npr.Funkcija
grepl
dela podobno kotgrep
, le da namesto vektorja indeksov vrne logični vektor. Drugod delaš podobno, tako da preveri, če si brisal prave stvari.Poskrbi tudi za poročilo, da bo pripravljeno za ponedeljkovo predstavitev. Opiši torej svoj projekt in zbrane podatke ter izriši svoje grafe in zemljevide - za vsakega tudi napiši, kaj prikazuje. Teh ne izrisuj s
print
vvizualizacija.r
, pač pa vsakega postavi v blok kode v poročilu na želenem mestu. Del poročila iz vzorca pobriši, da se ti bo lahko prevedlo.Še to: poimenovanje grafov z enočrkovnimi spremenljivkami ni priporočeno, saj tako povoziš nekatere osnovne R-jeve funkcije, kot so
c
(gradnja vektorja) int
(transpozicija matrike). Opozoril bi še na graff
- v razpredelnicizaposlenost
imaš za vsako državo in leto podatke po spolu, starosti in izobraženosti, tako da ti nariše več točk in graf tako ni berljiv. Namesto tega se bodisi omeji na eno kombinacijo teh parametrov, ali pa prikaži skupne podatke (npr. vsote ali povprečja - odvisno od tega, kakšne podatke imaš).