nezahabjan / APPR-2017-18

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2017/18
MIT License
0 stars 1 forks source link

Uvoz in poročilo #3

Open jaanos opened 6 years ago

jaanos commented 6 years ago

Prosim poskrbi za svoje poročilo (projekt.Rmd), da boš lahko v četrtek predstavila svoj projekt. Vanj torej vnesi opis podatkov (lahko vzameš iz README.md) ter nariši nekaj zanimivih grafov oziroma zemljevidov. Del, ki je ostal iz vzorca, pobriši, da se ti bo poročilo prevedlo. Svetujem, da iz glave odstraniš vrstico runtime: shiny - po shranjevanju se bo pojavil gumb Knit, s katerim lahko poročilo prevedeš v obliko HTML.

Poleg tega ti tudi uvoz ne deluje. Prvi problem se pojavi pri preimenovanju stolpcev v razpredelnici tabelastarosti. Funkcija rename namreč sprejema poimenovane argumente kot spremenljivke, ne kot nize. Poleg tega bo potrebno poskrbeti za pretvorbo v obliko tidy data, npr.

tabelastarosti <- rename(tabelastarosti,
                         Drzava = `State/Territory`, `Both sexes` = Overall) %>%
  melt(id.vars = "Drzava", variable.name = "Spol", value.name = "Starost")

Sicer pa svetujem, da v imenih stolpcev ne uporabljaš šumnikov (pa tudi ne presledkov in drugih posebnih znakov) - take stolpce je namreč treba navajati med ``. Uporaba presledka pri Both sexes ni problematična, saj z melt to ime spraviš v vrednosti v stolpcu Spol (skupaj z obstoječima imenoma Male in Female).

S preimenovanjem kot zgoraj bo mogoče združevanje v razpredelnico nova4 - ker združuješ po stolpcih s skupnimi imeni Drzava in Spol (slednji ima potem tudi skupne vrednosti), parameter by pri inner_join ne bo potreben (prav tako ne potrebuješ copy - ta je relevanten samo, če delaš s podatki iz zunanjih virov, česar pa pri tem predmetu ne bomo počeli). Dobljena razpredelnica bo potem imela stolpce Drzava, Spol, Stevilo in Starost. Podobno lahko narediš tudi pri drugih združevanjih (če pa nimajo vsi ujemajoči stolpci enakih imen, lahko parametru by podaš poimenova vektor vseh stolpcev, po katerih združuješ).

Prosim poglej še, kaj se dogaja z uvozom iz JSON - sem napisal pri #1.

Problem se pojavi tudi pri vizualizacija.r - uvoz zemljevida se nanaša na spremenljivke iz vzorca in zato ne deluje. Zaenkrat ga torej pobriši ali zakomentiraj. Popraviti bo treba tudi grafa grafnova4 (priredi glede na popravljeno združevanje) in grafnova3 (odstrani scale_size_manual, ali pa ga nadomesti s scale_size_continuous). Grafa, tako kot sta, ne izgledata najbolj pregledna - premisli, kakšen bi bil najboljši način prikaza podatkov. Če se odločiš za trenutno obliko, ju vsekakor podrobno opiši v poročilu, da bo jasno, kaj natanko prikazujeta.

jaanos commented 6 years ago

Še to: problem se pojavi tudi pri uvozu podatkov iz datoteke kupnamoc.csv. Očitno je v tej datoteki prišlo do konflikta, ki ga nisi razrešila. Svetujem, da te podatke še enkrat pridobiš, da se bo uvoz pravilno izvedel.