LacenS / APPR-2014-15

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2014/15
MIT License
0 stars 0 forks source link

Glavni program in uvoz #2

Closed jaanos closed 9 years ago

jaanos commented 9 years ago

V glavnem programu (projekt.r) kličeš vzorčna programa za naslednji dve fazi. Seveda ni smiselno, da ju sedaj kličeš, tako da ju zaenkrat zakomentiraj - v prihodnjih fazah boš seveda to vrnila (pa morda še kaj dodala).

V datoteki uvoz.r imaš še vedno vzorčno kodo, ki je seveda ne potrebuješ, tako da jo lahko pobrišeš. Funkcijo uvoz_tabele2 imaš potem definirano, a je nikjer ne pokličeš, zato se ti uvoz ne izvede. Poleg tega številke vsebujejo vejice kot ločila tisočic in procente, zato se ti ne prevedejo v številke. Imena držav lahko uporabiš kot imena vrstic. V imenih stolpcev imaš odvečne presledke, ki se jih lahko znebiš. Tako lahko narediš nekaj takega:

uvoz_tabele2<-function(){
  u<-"http://www.internetlivestats.com/internet-users-by-country/"
  tables <- readHTMLTable(u)
  n.rows <- unlist(lapply(tables, function(t) dim(t)[1]))

  r <- tables[[which.max(n.rows)]]
  stolpci <- gsub("\\s+", " ", colnames(r))

  r <- data.frame(row.names = r$Country, r["Rank"],
                  apply(r[3:10], 2,
                        function(x) as.numeric(gsub("[,%]", "", x))))
  colnames(r) <- stolpci[-2]
  return(r)
}

uporabniki.interneta <- uvoz_tabele2()