pybdx / meetup-hub

Proposer, échanger, organiser le meetup Bordeaux Python
6 stars 0 forks source link

Atelier "Ramène ta #data" #8

Open garaud opened 5 years ago

garaud commented 5 years ago

Atelier "Ramène ta #data"

En option, vous pouvez ajouter :

Description

Je propose de monter un atelier dont l'objectif est de manipuler de la donnée (de tout type) en Python.

La donnée est partout : industrie, e-commerce, capteurs, sur votre mobile, etc. Avant de pouvoir extraire une information utile et pertinente, il est nécessaire de la traiter de manière efficace. Dans la mouvance des hastags hype comme deep learning, machine learning, data mining et autres choses en ning, la donnée doit pouvoir être lue et traitée par ces algorithmes. C'est un travail fastidieux et néamoins intéressant !

Je vous propose de manipuler de la donnée (open data?) avec des boites à outil et autres bibliothèques Python populaires telles que pandas, matplotlib, jupyter, etc.

L'idée est de travailler ensemble sur un ou plusieurs sujets sélectionnés et de mettre les mains dans du code, produire de la donnée et des indicateurs à visualiser...

Tu as une idée ? Ramène ta data !

Mots-clés :

À faire :

garaud commented 5 years ago

cc @armgilles ça fait longtemps que ça traine dans ma tête. Qu'en penses-tu ?

Comme la dernière partie de la descirption "à faire" le suggère, faudrait :

Quelques idées

Datatourisme

Manipulation d'un bon gros JSON avec des lieux touristiques géolocalisées. À part faire quelques stats sur les différents types de lieux et un peu de carto, j'ai pas trop d'idées. Et le schéma du modèle de données (web sémantique, ontologie) a l'air bien velu :slightly_smiling_face:

Airbnb & qualité air à Bordeaux

J'ai trouvé des séries temporelles de capteurs de la qualité de l'air (géolocalisés) et aussi une liste de airbnb. Ça m'a donné une idée : "zone des logements Airbnb où la qualité de l'air est la meilleure". Ça n'a pas un très grand intérêt en soi mais je trouve ça fun !

remic33 commented 5 years ago

Hello, J'ai pas mal de jeux de données ici des 'projects' de Datacamp, ils sont généralement utilisé pour apprendre à nettoyer et traiter des données. Exemple de projets réutilisable : https://github.com/Oysiyl/DataCamp_Solutions_Python/blob/master/A%20New%20Era%20of%20Data%20Analysis%20in%20Baseball/notebook.ipynb

garaud commented 5 years ago

@remic33 super !! Merci beaucoup pour ton lien. Une ressource intéressante en effet. J'ai parfois un peu de mal à trouver des jeux de données & des problématiques "fun" pour s'exercer. Ça a l'air d'être des bons exemples :slightly_smiling_face:

remic33 commented 5 years ago

Yes j'en ai une vingtaine, ça peut aussi bien être du nettoyage que du traitement d'images et de la classifications. Je vais mettre sur github tous mes projects datacamp dans le week-end.

Pas de deep learning par contre... je suis en train de faire le programme fast.ai, quand j'aurais terminé je ferais quelques retours à ce sujet.

garaud commented 5 years ago

Merci pour ces infos et ces futurs retours.

J'ai jeté un oeil aux solutions DataCamp. C'est bien, il y a toujours les données associées au notebook. Par contre, il n'y a pas trop d'info sur la donnée (contenu, objectifs, etc.) à moins de lire le notebook et de voir assez vite ce qu'il en fait. Et dans ce cas, on perd un peu l'aspect exploratoire.