OpenGeoScales / ogs-data-exploration

This repository contains all data exploration notebooks for OpenGeoScales project
MIT License
11 stars 0 forks source link

Explore CDP data #18

Open S-AI-F opened 3 years ago

S-AI-F commented 3 years ago

@KlrPi Hello Claire, Je t'ai assigné ce dataset a priori. Dis moi si ça t'intéresse de travailler dessus!

S-AI-F commented 3 years ago

Pour accéder aux infos sur les données: https://github.com/OpenGeoScales/ogs-data-exploration/tree/main/data/ghg-emissions/cdp

S-AI-F commented 3 years ago

@florestan92

Lien vers la description des données: https://github.com/OpenGeoScales/ogs-data-exploration/tree/main/data/ghg-emissions/cdp

L'objectif de l'exploration des différentes sources de données d'émissions consiste à mieux connaitre la structure et le contenu des différentes sources afin de sélectionner celles qui sont les plus pertinentes et les plus complètes, les référencer dans le datacatalog et anticiper les traitements nécessaires à appliquer sur les données pour les intégrer dans la base finale.

Parmi les informations à extraire lors de l'exploration, on peut citer:

Ceci n'est pas la liste exhaustive des analyses à faire. Essayer d'extraire le plus d'informations possibles sur les données que vous avez choisi!

IMPORTANT:

S-AI-F commented 3 years ago

Hello @florestan92 & @KlrPi Est-ce que vous pouvez pousser l'ajout des dataset dans le main svp avec un pull request! Pour le moment les donnés CDP sont seulement stockées dans votre branche.

@florestan92 Dans ton notebook, peux-tu changer les lignes de lecture de données en récupérant les données depuis le repos git au lieu de les récupérer en local?

@florestan92 & @KlrPi J'ai vu dans le portail CDP qu'il y a des données d'émissions pour différentes années 2013-2015-2017. Pourquoi le choix de seulement 2018-2019-2020?

Merci :)

florestan92 commented 3 years ago

Hey @S-AI-F , tu as raison il y a d'autres années ! Il y a quelques différences au niveau des colonnes disponibles selon les années. Je vais faire un mapping des colonnes pour ensuite les "stacker"

Merci