[x] a) Créer une fenêtre graphqiue comportant un canevas et trois boutons :
bouton « Tracer la droite » : lorsque l’on clique dessus, une ligne colorée apparaît dans le canevas.
bouton « Autre couleur » : si l’on actionne ce bouton, une nouvelle couleur est tirée au hasard dans une
série limitée. Cette couleur est celle qui s’appliquera aux tracés de droite suivants,
bouton « Quitter » : qui sert bien évidemment à terminer l’application en refermant la fenêtre.
[x] b) Mettre à jour votre fenêtre graphique (dimensions, boutons complémentaires, commandes...) et appeler
les fonctions des parties 1) et 2) précédentes pour :
créer un nuage de points aléatoire de 50 points et le représenter graphiquement
calculer le coefficient de corrélation des points de ce nuage (en prenant comme sérieX, la série des
abscisses des points du nuage, et comme série Y la série des ordonnées des points du nuage)
utiliser la fonction forte_correlation() pour décider s'il est pertinent de tracer la droite de régression de
ce nuage ou pas. Tracer cette droite à l'aide du bouton « Tracer la droite » si la corrélation est forte.
[x] c) Recommencer avec le fichier « exemple.txt » fourni.
[x] d) Mettre en place un mode « Dessin » permettant de dessiner un nuage de points à l'aide de la souris,
avec par exemple un bouton pour activer ce mode et un bouton pour le désactiver.
Un clic par la suite sur le bouton « Tracer la droite » permettra ainsi de tracer la droite de régression si le
coefficient de corrélation est proche de 1 ou de -1.
[x] e) En vous inspirant de l'activité détaillée au lien suivant :
https://www.isnbreizh.fr/nsi/activity/fichierCSVPython/pythonPandasCSV/index.html
écrire une fonction permettant d'extraire du fichier « villes_virgule.csv » fourni, les nombres d'habitants
« nb_hab_2010 » et « nb_hab_2012 » inférieurs ou égaux à 500 puis :
créer un nuage de points avec les n = 100 premières valeurs de « nb_hab_2010 » et « nb_hab_2012 »
le représenter graphiquement et calculer le coefficient de corrélation des points de ce nuage
utiliser la fonction forte_correlation() pour décider s'il est pertinent de tracer la droite de régression de
ce nuage ou pas et tracer la droite de régression si la corrélation est forte.
[x] f) Modifier le code pour que le nombre « n » de la question précédente soit rentré par l'utilisateur.
[x] g) Recommencer avec un fichier de données réelles de votre choix ; vous pouvez vous inspirez de vos
autres cours/TD/TP ou choisir un fichier accessible sur internet, genre :
[x] a) Créer une fenêtre graphqiue comportant un canevas et trois boutons :
bouton « Tracer la droite » : lorsque l’on clique dessus, une ligne colorée apparaît dans le canevas.
bouton « Autre couleur » : si l’on actionne ce bouton, une nouvelle couleur est tirée au hasard dans une série limitée. Cette couleur est celle qui s’appliquera aux tracés de droite suivants,
bouton « Quitter » : qui sert bien évidemment à terminer l’application en refermant la fenêtre.
[x] b) Mettre à jour votre fenêtre graphique (dimensions, boutons complémentaires, commandes...) et appeler les fonctions des parties 1) et 2) précédentes pour :
créer un nuage de points aléatoire de 50 points et le représenter graphiquement
calculer le coefficient de corrélation des points de ce nuage (en prenant comme sérieX, la série des abscisses des points du nuage, et comme série Y la série des ordonnées des points du nuage)
utiliser la fonction forte_correlation() pour décider s'il est pertinent de tracer la droite de régression de ce nuage ou pas. Tracer cette droite à l'aide du bouton « Tracer la droite » si la corrélation est forte.
[x] c) Recommencer avec le fichier « exemple.txt » fourni.
[x] d) Mettre en place un mode « Dessin » permettant de dessiner un nuage de points à l'aide de la souris, avec par exemple un bouton pour activer ce mode et un bouton pour le désactiver. Un clic par la suite sur le bouton « Tracer la droite » permettra ainsi de tracer la droite de régression si le coefficient de corrélation est proche de 1 ou de -1.
[x] e) En vous inspirant de l'activité détaillée au lien suivant : https://www.isnbreizh.fr/nsi/activity/fichierCSVPython/pythonPandasCSV/index.html écrire une fonction permettant d'extraire du fichier « villes_virgule.csv » fourni, les nombres d'habitants « nb_hab_2010 » et « nb_hab_2012 » inférieurs ou égaux à 500 puis :
créer un nuage de points avec les n = 100 premières valeurs de « nb_hab_2010 » et « nb_hab_2012 »
le représenter graphiquement et calculer le coefficient de corrélation des points de ce nuage
utiliser la fonction forte_correlation() pour décider s'il est pertinent de tracer la droite de régression de ce nuage ou pas et tracer la droite de régression si la corrélation est forte.
[x] f) Modifier le code pour que le nombre « n » de la question précédente soit rentré par l'utilisateur.
[x] g) Recommencer avec un fichier de données réelles de votre choix ; vous pouvez vous inspirez de vos autres cours/TD/TP ou choisir un fichier accessible sur internet, genre :
https://gilles-hunault.leria-info.univ-angers.fr/Datasets/datasets.htm https://www.stat4decision.com/fr/10-sites-de-reference-open-data/ https://www.data.gouv.fr/fr/organizations/institut-national-de-la-statistique-et-des-etudes-economiques-insee/ Pour aller plus loin : Faites preuve d'initiative en proposant d'autres fonctionnalités et améliorations : optimisation du code, possibilité de choisir une configuration dans une liste déroulante, sauvegarde de plusieurs configurations dans des fichiers... 4