Closed utterances-bot closed 2 years ago
Bonjour, Je travaille sur un tableau de données de la Banque Mondiale qui contient les données sur le PIB par habitant pour l'ensemble des pays. Le tableau est en csv. En important le tableau, R reconnait les différentes variables comme des facteurs. La majorité des variables sont des chiffres représentant le PIB par habitant en US$ courant. Pour travailler sur le tableau, j'aimerais convertir les variables pour chacune des années en "numeric" afin de calculer la moyenne et autres fonctions similaires. Je peux modifier une variable à la fois en utilisant <- as.numeric(as.character(nom_data.frame$nom_de_la_variable)) Comment faire pour changer plusieurs variables à la fois avec la même fonction. J'ai fait plusieurs essais, notamment avec "lapply", mais cela ne semble pas fonctionner. Il me manque peut-être un détail. Merci.
Bonjour, Pour information, je visionne vos webinaires sur Youtube, en différé depuis Montréal au Québec. Je suis rendu au 5e webinaire. Très bien faits et éclairant.
Merci.
Avez vous regarder du côté de across de dplyr : https://dplyr.tidyverse.org/reference/across.html
Cela permet d'appliquer une fonction à plusieurs colonnes au sein d'un mutate. Pour sélectionner toutes les facteurs, vous pouvez utiliser un where
N hésitez pas à bien lire les exemples de la documentation
df %>% mutate(across(where(is.factor), ~ as.numeric(as.character(.x)) ))
Recodage de variables
https://larmarange.github.io/analyse-R/recodage.html