Duzo12 / APPR-2018-19

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2018/19
MIT License
0 stars 0 forks source link

Problem #1

Closed Duzo12 closed 5 years ago

Duzo12 commented 5 years ago

Pošiljam Vam kodo, ki je ne znam razrešiti. S pomočjo rstudia sem prebral html, ter v njem želel izbrati odlomek ki se začne z izrazom ([\n ter konča z izrazom ]), vendar mi gsub natisne celoten html. Vsi znaki \ so napisani dvakrat, vendar ko pošljem komentar mi napiše samo enega.

link <- "https://www.numbeo.com/cost-of-living/country_price_rankings?displayCurrency=USD&itemId=105" stran <- html_session(link) %>% read_html() %>% as.character() stran1 <- gsub("^\(\[\n(.*)\]\)$", "\1", stran)

MarvinHerzog commented 5 years ago

Poskusi tako:

link <- "https://www.numbeo.com/cost-of-living/country_price_rankings?displayCurrency=USD&itemId=105"
stran <- html_session(link) %>% read_html() %>% as.character()
stran1 <- gsub("^.*\\(\\[(.*) \\]\\).*$", "\\1", stran)
stran1=strsplit(stran1,split="   ")[[1]]
drzave=gsub("^.*'(.*)'.*$", "\\1",stran1)
cifre=gsub("^.*, (.*)\\].*$", "\\1",stran1)

tabela = data.frame(drazve=drzave,vrednost=as.numeric(cifre))[seq(3,length(cifre)-2,2),]