Open garaud opened 5 years ago
cc @armgilles ça fait longtemps que ça traine dans ma tête. Qu'en penses-tu ?
Comme la dernière partie de la descirption "à faire" le suggère, faudrait :
Quelques idées
Manipulation d'un bon gros JSON avec des lieux touristiques géolocalisées. À part faire quelques stats sur les différents types de lieux et un peu de carto, j'ai pas trop d'idées. Et le schéma du modèle de données (web sémantique, ontologie) a l'air bien velu :slightly_smiling_face:
J'ai trouvé des séries temporelles de capteurs de la qualité de l'air (géolocalisés) et aussi une liste de airbnb. Ça m'a donné une idée : "zone des logements Airbnb où la qualité de l'air est la meilleure". Ça n'a pas un très grand intérêt en soi mais je trouve ça fun !
Hello, J'ai pas mal de jeux de données ici des 'projects' de Datacamp, ils sont généralement utilisé pour apprendre à nettoyer et traiter des données. Exemple de projets réutilisable : https://github.com/Oysiyl/DataCamp_Solutions_Python/blob/master/A%20New%20Era%20of%20Data%20Analysis%20in%20Baseball/notebook.ipynb
@remic33 super !! Merci beaucoup pour ton lien. Une ressource intéressante en effet. J'ai parfois un peu de mal à trouver des jeux de données & des problématiques "fun" pour s'exercer. Ça a l'air d'être des bons exemples :slightly_smiling_face:
Yes j'en ai une vingtaine, ça peut aussi bien être du nettoyage que du traitement d'images et de la classifications. Je vais mettre sur github tous mes projects datacamp dans le week-end.
Pas de deep learning par contre... je suis en train de faire le programme fast.ai, quand j'aurais terminé je ferais quelques retours à ce sujet.
Merci pour ces infos et ces futurs retours.
J'ai jeté un oeil aux solutions DataCamp. C'est bien, il y a toujours les données associées au notebook. Par contre, il n'y a pas trop d'info sur la donnée (contenu, objectifs, etc.) à moins de lire le notebook et de voir assez vite ce qu'il en fait. Et dans ce cas, on perd un peu l'aspect exploratoire.
Atelier "Ramène ta #data"
En option, vous pouvez ajouter :
Description
Je propose de monter un atelier dont l'objectif est de manipuler de la donnée (de tout type) en Python.
La donnée est partout : industrie, e-commerce, capteurs, sur votre mobile, etc. Avant de pouvoir extraire une information utile et pertinente, il est nécessaire de la traiter de manière efficace. Dans la mouvance des hastags hype comme deep learning, machine learning, data mining et autres choses en ning, la donnée doit pouvoir être lue et traitée par ces algorithmes. C'est un travail fastidieux et néamoins intéressant !
Je vous propose de manipuler de la donnée (open data?) avec des boites à outil et autres bibliothèques Python populaires telles que pandas, matplotlib, jupyter, etc.
L'idée est de travailler ensemble sur un ou plusieurs sujets sélectionnés et de mettre les mains dans du code, produire de la donnée et des indicateurs à visualiser...
Tu as une idée ? Ramène ta data !
Mots-clés :
À faire :