niesfutbol / ideas

0 stars 0 forks source link

Caliente Web Scrapping: Odds (version 1) #61

Open davidmacer opened 9 months ago

davidmacer commented 9 months ago

El siguiente código está extrayendo algunos elementos (main-area, mkt y table) del HTML de la página de caliente.mx.

Al final, extrae a mano los datos de la Liga MX y muestra las columnas seleccionadas.

¿Qué sigue?

library(rvest)
library(dplyr)

url <- "https://sports.caliente.mx/es_MX"
html <- read_html(url) # Lee el url para traer todos los elementos de la página

main_area <- html |>
  html_elements("#main-area") # Jala los elementos con id="main-area"
main_area |>
  html_text2() # Muestra como texto

mkt_elements <- html |>
  html_elements(".mkt") # Jala los elementos con clase class="mkt"
mkt_elements |>
  html_text2() # Muestra como texto

tabla <- html |>
  html_elements("table") # Jala los elementos con clase tabla (class="table")

# Jala (a mano) los datos de la Liga MX (que están en el elemento 3)
tabla_ligamx <- tabla[3] |> html_table() 
tabla_ligamx[[1]][, c("X5", "X6", "X7")] # Extrae las columnas señaladas

Pendientes

¿Cómo funcitona con las direcciones directas a cada una de las ligas de fútbol?