speladugar / APPR-2014-15

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2014/15
MIT License
0 stars 1 forks source link

Glavni program in uvoz #1

Closed jaanos closed 9 years ago

jaanos commented 9 years ago

V glavnem programu (projekt.r) kličeš vzorčna programa za naslednji dve fazi. Seveda ni smiselno, da ju sedaj kličeš, tako da ju zaenkrat zakomentiraj - v prihodnjih fazah boš seveda to vrnila (pa morda še kaj dodala). Ne pozabi klicati tudi programa "slike/grafi.R" (pazi na velikost črk!) - v njem sicer trenutno poskušaš risati iz razpredelnice r2013, ki pa je nimaš nikjer definirane.

Ko sem pognal uvoz iz XML, mi ni deloval - dobil sem tabelo s samimi NA-ji. Problem je očitno v tistih čudnih znakih, ki se pri meni pojavijo drugače. Glede na to, da imaš v tabeli sama števila, bo morda najlažje enostavno pobrati ven vse števke, ostalo pa pobrisati. Ker so imena stolpcev kar leta, jih lahko podaš eksplicitno, da ne bo problemov s pobiranjem iz XML (lahko se pa na isti način znebiš vseh neštevilskih znakov). Funkcijo uvozi.rodnostEU lahko torej zaključiš takole:

  colnames(matrika) <- 2002:2013
  imena <- gsub("\n", " ", stripByPath(tabele[[5]], ".//th"))

  return(
    data.frame(apply(gsub("[^0-9]", "", matrika),
                     2, as.numeric), row.names = imena)
    )

V funkciji stripByPath lahko tako izbrišeš niz "Â?" iz regularnega izraza, saj ga več ne potrebuješ. Poleg tega imaš na začetku funkcije uvozi.rodnostEU v drugi vrstici rererenco na url.obcine - seveda tukaj potrebuješ url.rodnostEU.

Potem lahko v uvoz.r enostavno kličeš

RodnostEU <- uvozi.rodnostEU()

Tega ne kliči v xml.r - razen tega, da se tako podvaja, je mapa lib mišljena za definicije funkcij, ki jih uporabiš drugje.

jaanos commented 9 years ago

To je urejeno, tako da zapiram.