nolimal / APPR-2014-15

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2014/15
MIT License
0 stars 0 forks source link

Glavni program in uvoz #1

Closed jaanos closed 9 years ago

jaanos commented 9 years ago

V glavnem programu (projekt.r) kličeš vzorčna programa za naslednji dve fazi. Seveda ni smiselno, da ju sedaj kličeš, tako da ju zaenkrat zakomentiraj - v prihodnjih fazah boš seveda to vrnil (pa morda še kaj dodala).

V razpredelnici AktivniSLO imaš podatke o regiji in spolu samo pri prvi pojavitvi vsakega. Smiselno bi bilo, da imaš to informacijo v vsaki vrstici. Tako lahko narediš

AktivniSLO$Regija <- c(rep("Slovenija", 18),
                       rep("Vzhodna Slovenija", 18),
                       rep("Zahodna Slovenija", 18))
AktivniSLO$Spol <- rep(c(rep("Skupaj", 6),
                         rep("Moški", 6),
                         rep("Ženske", 6)), 3)

Tako bo kasneje lažje filtrirati podatke.

V razpredelnici tabelaxml1 imaš v stolpcu "Razmerje Ž/M"številke z decimalno vejico, ki pa jo je treba pretvoriti v piko, da bo R lahko to razumel kot število. Tako lahko narediš

tabelaxml1$"Razmerje Ž/M"<-gsub(",", ".", tabelaxml1$"Razmerje Ž/M",)
tabelaxml1$"Razmerje Ž/M"<-as.numeric(tabelaxml1$"Razmerje Ž/M")

ignore.case=TRUE lahko izpustiš tudi pri drugih gsub-ih, saj ne zamenjuješ črk.

Še to: trenutno ti program prikaže uvožene razpredelnice z View. To je v redu, dokler preverjaš, če vse deluje, a končni program naj tega ne počne - njegov izhod bodo grafi v obliki PDF.

nolimal commented 9 years ago

Najlepša hvala za nasvete.

nolimal commented 9 years ago

Še to: trenutno ti program prikaže uvožene razpredelnice z View. To je v redu, dokler preverjaš, če vse deluje, a končni program naj tega ne počne - njegov izhod bodo grafi v obliki PDF.

Zanima me če moram potem View-e teh tabel zakomentirati in naj ne vrne ničesar razen grafe v grafi.pdf?

jaanos commented 9 years ago

Tako, View-e zakomentiraj. Program ti lahko npr. izpisuje v konzolo, kaj počne (tako kot je to v vzorcu), tabel in grafov v RStudiu pa naj ne prikazuje.

Datotek z grafi je seveda lahko tudi več - morda jih bo tako lažje vključiti v poročilo.

jaanos commented 9 years ago

V glavnem programu kličeš slike.r, a programu je ime slike.R, tako da to še popravi.

Za grafe si se potrudil, bi se pa dalo še kaj izboljšati. Tako je v legendah prvih dveh grafov odveč znak čez kvadratek z barvo, saj ga nikjer ne rabiš - znebiš se ga s pch = -1. Pri grafu plač po sektorjih se ti tudi ponovijo oznake pod stolpci in v legendi. Graf lahko v vsakem primeru razširiš na polno širino, saj se z legendo ne prekriva; potem lahko bodisi odstraniš oznake pod osmi, ali pa odstraniš legendo in nekoliko zmanjšaš oznake pod osmi (parameter cex.names).

Pri tortnem diagramu ti oznake odreže - tako lahko dodaš noter prelome vrstic, pa se malo poigraš z velikostjo in postavitvijo oznak ter rotacijo grafa. Tako npr. izgleda v redu:

lbls <- c("Skupaj","Javni\nsektor","Sektor\ndržava","Javne\ndružbe","Zasebni\nsektor")
pie3D(slices,labels=lbls,explode=0.15,start=1.5,labelrad=1.18,labelcex=1,
      main="Tortni diagram plač po sektorjih")

Pri zadnjem grafu seveda nima smisla, da imaš v legendi podčrtaje, ker bo lepše izgledalo s presledki.

Grafe rišeš dvakrat - enkrat v skupno datoteko, drugič vsakega posebej. Glede na to, da v poročilu uvažaš posamezne datoteke, se lahko risanja v skupno datoteko znebiš. Pazi še, da bodo PDF-ji v mapi slike (kot imaš v poročilu) - ukazu pdf torej podaj ustrezno pot datoteke, npr.

pdf("slike/grafsektorji.pdf")

V poročilu sta sedaj vključena samo dva grafa - seveda ju premakni pod drugi razdelek, pa vključi še ostala grafa. Grafi so trenutno preširoki, tako da bo potrebno podati še njihovo širino, npr.

\includegraphics[width=\textwidth]{../slike/grafplot.pdf}

Naslov svojega projekta imaš kar kot besedilo na začetku projekta - morda ga raje vključi v naslov, ali pa napiši kratek uvod (npr. en stavek), kjer poveš, kaj je tematika tvojega projekta. V besedilu imaš tudi imena datotek in spremenljivk - lepo bi bilo, če se ločijo od ostalega besedila, kar lahko dosežeš z ukazom \verb, npr.

\verb|ZaposlenostEU|

Tako se tudi znebiš problemov z morebitnimi posebnimi znaki. Znak | takoj za \verb služi kot oznaka za konec niza - po potrebi ga lahko zamenjaš (npr. \verb+|+ ti izpiše ravno ta znak). Druga možnost, primerna tudi za spletne naslove, je uporaba paketa url in ukaza \url.

Še to: LaTeX včasih ne zna prelomiti besed (posebno, če vsebujejo šumnike) in se tako včasih zgodi, da kaka beseda seže čez rob besedila. V tvojem primeru sicer rešiš problem tako, da pred oklepaji postavljaš presledke; v splošnem pa lahko z \- poveš, kje se lahko prelomi beseda, npr.

či\-šče\-nje
nolimal commented 9 years ago

Najlepša hvala za nasvete(te zadeve sem sedaj uredil). Zanima me, ali imam lahko takšno naslovno stran, kot sem jo naredil sedaj

jaanos commented 9 years ago

Lahko imaš tako naslovnico, seveda.

Še ena malenkost: pri legendi na grafu plač po poklicih lahko dodaš parameter bg = "white", da se ne bo videlo vodoravnih črt pod legendo.

Drugače je pa vse urejeno, tako da zapiram issue.