LeonHorvat / APPR-2017

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2016/17
MIT License
0 stars 0 forks source link

Uvoz in poročilo #2

Open jaanos opened 7 years ago

jaanos commented 7 years ago

Kot sem ti napisal že v #1, za branje datotek CSV uporabljaj funkcijo read_csv2 iz knjižnice readr, poleg tega pa ne pozabi vsakič nastaviti še kodiranja znakov, saj le tako poskrbiš, da bo program deloval na vseh sistemih. Pri meni se tako uvoz ustavi pri branju datoteke Prenocitvene_zmogljivosti1.csv. Ustrezen uvoz bi izgledal npr. tako:

zmogljivosti <- read_csv2("podatki/Prenocitvene_zmogljivosti1.csv",
                          na = c("-",""," ","..."),
                          col_names = stolpci2,
                          skip = 3,
                          locale = locale(encoding = "Windows-1250"))

Poskrbi tudi za poročilo, da bo pripravljeno za ponedeljkovo predstavitev. Opiši torej svoj projekt in zbrane podatke ter izriši nekaj grafov in zemljevidov. S številom grafov in zemljevidov seveda ni potrebno pretiravati - za vsakega pa napiši, kaj prikazuje in kaj si se iz njega naučil. Del poročila iz vzorca pobriši, da se ti bo lahko prevedlo (seveda poskrbi tudi, da se tvoji programi poženejo brez napak).

LeonHorvat commented 7 years ago

Če pri uvozu uporabim funkcijo locale oz. dodam locale = locale(encoding = "Windows-1250"), mi izpiše napako: Error in read.table(file = file, header = header, sep = sep, quote = quote, : unused argument (locale = list(date_names = list(mon = c("January", "February", "March", "April", "May", "June", "July", "August", "September", "October", "November", "December"), mon_ab = c("Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"), day = c("Sunday", "Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday"), day_ab = c("Sun", "Mon", "Tue", "Wed", "Thu", "Fri", "Sat"), am_pm = c("AM", "PM")), date_format = "%AD", time_format = "%AT", decimal_mark = ".", grouping_mark = ",", tz = "UTC", encoding = "Windows-1250"))

jaanos commented 7 years ago

locale deluje s funkcijo read_csv2 (s podčrtajem), in ne z read.csv2 (s piko).

jaanos commented 7 years ago

Vidim, da ti zdaj prevede poročilo, tako da bom dodal povezavo do trenutnega commita dodal na repozitorij za zagovore. Če boš do predstavitve še kaj spreminjal, odpri issue na repozitoriju za zagovore, da posodobim povezavo - tam si preberi natančnejša navodila.

read_csv2 ti javlja opozorila zaradi nepopolnih vrstic v podatkih. Tu ne gre za problem s samim programom, tako da lahko dodaš še parameter warning = FALSE v glavo bloka kode, kjer kličeš uvoz.r, pa se ta opozorila ne bodo izpisovala v poročilo.

Svetujem, da se v grafih izogibaš eksponentni notaciji v oznakah osi in legend - to lahko dosežeš tako, da podatke pri izrisovanju deliš z ustrezno vrednostjo - seveda naj oznaka osi pove, za kakšne vrednosti gre. Prvi graf lahko potem pripraviš npr. tako:

g1 <- ggplot(potniki_in_prihodi, aes(x = leto, y = stevilo/1e6, colour = meritev)) + 
  geom_line(size = 1.5) + theme_minimal() + xlab("Leto") + ylab("Milijoni")

Na koncu poročila pobriši še blok kode s Shiny aplikacijo, dokler je še nimaš.