Closed nepito closed 1 year ago
En el archivo calculator-trs/src/plot_69.R
utilizamos los siguientes archivos:
matches <- read_csv("tests/data/season_2022.csv", show_col_types = FALSE)
seasons <- matches %>% select(c(id_match, date, league))
leagues <- read_csv("tests/data/league_2022.csv", show_col_types = FALSE)
names <- read_csv("tests/data/names_2022.csv", show_col_types = FALSE)
season_2022.csv
Este archivo tiene es el concatenado del calendario de la temporada de cada liga: Por ejemplo, en la figura de arriba podemos ver algunos partidos de la Premier League (los últmios) y los primeros de la Serie A. La flecha está señalando la cabecera de la tabla.
A estos datos les quitamos los primeros cuatro partidos:
cleaned_matches <- matches %>%
separate_wider_delim(round, " - ", names = c(NA, "round")) %>%
mutate(round = as.numeric(round)) %>%
filter(round > 4)
league_2022.csv
Este archivo es la concatenación de los archivos del tipo league_{league_id}_{season}.csv
:
Estos archivos son los que tienen toda la información de los partidos terminados.
names_2022.csv
Este es el archivo que tiene la relación entre nombres y el team_id
¿para qué ocupamos esto? (creo que los nombres de los equipos no los estamos utilizando).
No es necesario tener todos los partidos pasados, solo los partidos de esta semana y las recatas que delimitan las cuatro zonas. Además, es totalmente necesario poder distinguir los partidos que están en cada una de las zonas.
Ya tenemos las funciones que grafiquen la figura de la página 69. Pero ¿cuáles son los datos que necesitamos? ¿Cómo agregamos los partidos de esta semana? ¿Cómo podemos utilizarlo para apostar?