owkin / FLamby

Cross-silo Federated Learning playground in Python. Discover 7 real-world federated datasets to test your new FL strategies and try to beat the leaderboard.
https://owkin.github.io/FLamby/
MIT License
199 stars 23 forks source link

Potential issue with LIDC: incompatibility between train and test #180

Closed jeandut closed 2 years ago

jeandut commented 2 years ago

From @philipco "J'ai regardé la taille du train et du test dataset. Le nombre de features est différent entre les deux, et donc quand j'essaye de les concaténer pour les traiter ensemble, il y a une erreur qui est levée. Voilà ce que j'ai : Train data shape: (8, 4194304) Test data shape: (2, 56623104)

Je ne sais pas si c'est normal d'avoir un train et un test avec un input space de taille différente ? J'avais téléchargé une version debug de LIDC il y a un mois environ."

Aka Train and test data do not have the same shape in LIDC.

jeandut commented 2 years ago

This is probably normal because of the sampling step involved in training that are not reproduced when testing as testing should do a full pass on the CT-scans and training does 3D patch-sampling. But it remains to be investigated.