Identification des différentes bases de données contenant de log : Matomo, MongoDB, copie de MongoDB sur Metabase
Identification des actions front qui peuvent être identifiées grâce à des logs stockés dans MongoDB
installation de data.subvention en locale
découvert outil développement web
Log parsing
Mail envoyé à Chaib pour lui demander un peu de temps pour nous aider à comprendre la base de données Matomo plus demandes Marion. -> En attente réponse
PROCHAINES ETAPES PROPOSES :
débuter l'analyse avec les actions que nous avons via MongoDB
data preprocessing permettant d'obtenir un data set exploitable, exemples ci-dessous :
le log / document suite au log/etablissement => télechargement document sur l'établissement
le log/ document suite au log/associations => télechargement document sur l'asso
stocker quelques parts l'idéntifiant de l'asso et stocker le lien entre siren / rna de façon à pouvoir identifier s'il s'agit de la même asso ou pas lorsque on cherche par siren ou rna
feature engineering
Définir et construire les variables qui me permettent de caractériser le comportement de l'utilisateur ? Qui seront ensuite utilisées par un modèle pour faire du clustering.
comprendre et preprocess data permettant de décrire le profile de l'utilisateur (ex.role)
PROCHAINES ETAPES PROPOSES :