jlenarcic / APPR-2014-15

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2014/15
MIT License
0 stars 0 forks source link

Glavni program, uvoz, grafi, poročilo #1

Closed jaanos closed 9 years ago

jaanos commented 9 years ago

V glavnem programu (projekt.r) kličeš vzorčna programa za naslednji dve fazi. Seveda ni smiselno, da ju sedaj kličeš, tako da ju zaenkrat zakomentiraj - v prihodnjih fazah boš seveda to vrnil (pa morda še kaj dodal).

Imena igralcev in ekip se ne ponavljajo, tako da jih lahko imaš za imena vrstic. Tako lahko podaš parameter row.names = 1 pri uvažanju iz CSV. Namesto, da pridružuješ z merge (kar ti bo premešalo vrstice), raje enostavno naredi novo razpredelnico z data.frame:

NBA <- data.frame(NBA1, OT)

Tako ne bo problemov z odvečnim prvim stolpcem in nepotrebnimi imeni. Mimogrede, pri spremenljivki z vrednostma da/ne ni ravno smiselno uvajati urejenosti.

Program naj ne izpisuje razpredelnic z View - to je sicer koristno, dokler delaš, a edini izhod naj bo graf (ali več njih) v datoteki PDF, ki ga boš vključil v poročilo.

Nikjer ne kličeš programa Grafi.R - to lahko narediš v glavnem programu (pazi na velikost črk!).

Ne pozabi vključiti grafov v poročilo. Seveda lahko vzorčna grafa pobrišeš.

jaanos commented 9 years ago

Pri drugem grafu v legendi izpišeš vsakič 82, kar ni zelo informativno. Bolje bo seveda, če so tam imena ekip. Trenutno podatke črpaš iz tretjega stolpca - ker hočeš prikazati število zmag, raje naredi

barplot(NBA1[1:5,"W"], ylim = c(0,82), ylab = "Število zmag", col = rainbow(5), xlab = "Ekipe", las = 2, main = "Število zmag v sezoni 2013/2014",
        cex.names = 0.8, legend.text = rownames(NBA1[1:5,]))

Tako boš podatke dobival iz primernega stolpca, tudi če se slučajno spremeni zaporedje stolpcev.

jlenarcic commented 9 years ago

Sedaj imam v tem grafu 5 ekip. Če bi jih dal več (npr. 15), bi se legenda prekrivala z grafom. Kako naj rešim tako situacijo?

jlenarcic commented 9 years ago

Pa še nekaj. V mojih tabelah imam v imenih stolpcev tudi znake kot so "/, %". Ko imam tabele v excelu je vse vredu, ko pa jih uvozim v r studio, pa te znake zamenjajo pike, pa tudi črke X. Mi lahko prosim poveste, kako naj odpravim to težavo?

jaanos commented 9 years ago

Ena možnost je, da razvrstiš ekipe od leve proti desni po številu zmag, tako da bodo desni stolpci nižji in bo tako več prostora za legendo. Morda tudi to ne bo dovolj, pa bi rad zožal graf. To lahko dosežeš tako, da ukazu barplot podaš parameter xlim = c(0, w), kjer večje vrednosti w pomenijo ožji graf (najdi primerno vrednost, da bo graf v PDF lepo izgledal). Glede na to, da za vsako ekipo prikazuješ en sam podatek, je seveda možnost tudi ta, da so imena ekip prikazana pod vsakim stolpcem (namesto legend.text podaš parameter names.arg). Imena ekip lahko seveda tudi skrajšaš; koristilo bo morda, da jih izpišeš navpično (parameter las = 2).

Kar se imen stolpcev, načeloma to ni problem, saj data.frame privzeto zamenja vse znake razen črk in številk s piko, pa doda X na začetek, če se ime stolpca začne s številko. Če želiš vseeno imeti lepa imena stolpcev, jih lahko nastaviš s colnames:

colnames(razpredelnica) <- c("Prvi stolpec", "Drugi stolpec", ...)
jlenarcic commented 9 years ago

Že prej popravil napake, sedaj pa zapiram issue.

jlenarcic commented 9 years ago

Kako bi ta dva zemljevida spravil na eno stran. Verjetno je treba zmanjšati velikost, vendar nimam ideje, kako bi to naredil. \includepdf[pages={1-2}]{../slike/USAstats.pdf}

Lep pozdrav, JL

jaanos commented 9 years ago

Če hočeš z \includepdf več grafov spraviti na eno stran, si pomagaš s parametrom nup, npr.

\includepdf[pages={1-2},nup=1x2]{../slike/USAstats.pdf}

ti postavi en zemljevid nad drugega.