Closed annemarie35 closed 9 years ago
Idem pour les parser d'insertions dans la BDD car les tâches rakes sont longues du coup et ne vont pas forcement jusqu'au bout en prod
A voir car mieux vaut solliciter les serveurs de pole emploi une seule fois.
Alors, finalement, il y a trois scripts
parser/body_parser.rb
contient toutes les méthodes qui permettent d'analyser le code source d'une url et de récupérer le contenu des offres.parser/pole_emploi_parser.rb
récupère les urls depuis le site de pôle emploi (tous les départements pour une liste de métiers donnée)parser/insert_db.rb
traite les urls. Si l'url est valide, l'offre d'emploi est insérée dans la table job_offers
, le cas échéant, l'url est supprimée de la table parse
rake clean_db:delete_2_urls_from_parse
Script plus long qui nécessite l'analyse du contenu des offres (supprime les codes romes et adresses invalides ainsi que les offres non disponibles).--> le découper en trois fonctions distinctes