L'utilisation de pandas en lieu et place de pyspark a fait fait remonter le fait que la casse était prise en compte dans le filtrage des associations. Du coup le nombre d'associations à doubler. Le but de cette tâche c'est de réenrichier avec des liens qualifiés facebook et/ouhello oasso les associations restantes. La tâche consiste donc à:
[x] - Ré-executer le fichier etl/enrich_xxx.ipynb uniquement sur les nouvelles associations ( pas présente dans enrich-qualified)
[x] - Envoyer cette liste à un service style Fiverr/Upwork pour qu'ils la qualifient et ajoutent les élements s'ils existent
L'utilisation de pandas en lieu et place de pyspark a fait fait remonter le fait que la casse était prise en compte dans le filtrage des associations. Du coup le nombre d'associations à doubler. Le but de cette tâche c'est de réenrichier avec des liens qualifiés facebook et/ouhello oasso les associations restantes. La tâche consiste donc à:
etl/enrich_xxx.ipynb
uniquement sur les nouvelles associations ( pas présente dans enrich-qualified)