Le script python semble avoir omis les doublons où deux entrées ont les mêmes valeurs sauf l'âge, ce qui fait qu'un athlète peut être présent deux fois :
Il faut refaire un clean de la base de données / du CSV
D'abord vérifier dans les csv si un nom est présent deux fois -> si oui clean le jeu de données en rejoignant ce qu'il y a à faire pour l'issue de l'âge des athlètes
Le script python semble avoir omis les doublons où deux entrées ont les mêmes valeurs sauf l'âge, ce qui fait qu'un athlète peut être présent deux fois :
{ "_id": "6646002eb1cf43590fd58104", "Nom": "Gustaf Adolf Boltenstern, Sr.", "Age": 51, "Taille": null, "Poids": null, "Sexe": "M", "Pays": "Sweden", "Sport": "Equestrianism" }, { "_id": "6646002eb1cf43590fd58125", "Nom": "Gustaf Adolf Boltenstern, Jr.", "Age": 52, "Taille": null, "Poids": null, "Sexe": "M", "Pays": "Sweden", "Sport": "Equestrianism" }