Open abouillon-ets opened 11 months ago
Pour les opérations de I/O la limitation provient de la vitesse de transfert entre S3 et Lambda. Pour les opérations sur la concaténation des DataFrame la limitation est sur Lambda (10 workers est le nombre que Lambda nous donnent un avertissement). Ceci réduit considérablement le temps d'exécution des fonctions (testé sur un autre compte)
Revoir la notion de MultiThread pour la récupération des fichiers dans S3, la récupération des "key" devraient aussi être fait en utilisant le MultiThread.
Mesurer le temps pour chaque processus pour déterminer d'où la lenteur provient.
Cette fonction devrait faire usage de