jestebango / uoc

Prácticas de WEB SCRAPING de la asignatura TIPOLOGÍA DE DATOS
1 stars 2 forks source link

Tabla de la Wikipedia #7

Closed srodriguezcep closed 7 years ago

srodriguezcep commented 7 years ago

Mediante el siguiente código extraigo la tabla existente en la pagina web https://es.wikipedia.org/wiki/Anexo:Provincias_y_ciudades_aut%C3%B3nomas_de_Espa%C3%B1a

install.packages("xml2") library("xml2") library("rvest") url.provincias<- "https://es.wikipedia.org/wiki/Anexo:Provincias_y_ciudades_aut%C3%B3nomas_de_Espa%C3%B1a" tabla_temp<- read_html(url.provincias) tabla_temp <- html_nodes(tabla_temp, "table") tabla_temp length(tabla_temp) sapply(tabla_temp,class) html_table(tabla_temp,fill=TRUE)

sapply(tabla_temp, function(x) dim(html_table(x, header=false, fill = TRUE)))

provincias<- html_table(tabla_temp,fill=TRUE) provincias write.csv(provincias, file="provincias.csv") #guardamos en un archivo CSV.

srodriguezcep commented 7 years ago

Procedemos cerrar este hito