entrepreneur-interet-general / CIS-front

Site public du carrefour des innovations sociales
http://carrefourdesinnovationssociales.fr/
MIT License
7 stars 5 forks source link

Site BBZ mal scrappé : scrappe les titres de rubriques #164

Open Eliselalique opened 5 years ago

Eliselalique commented 5 years ago
capture d ecran 2018-11-23 a 15 29 31

-> Chaque description commence par le titre de la structure (déjà écris au dessus) : possibilité de scrapper après ce titre pour ne pas avoir la répétition ?

-> Dans le champs adresse, on scrappe tous les titres : adresse / code postal / ville / département : possibilité de ne scrapper que le contenu et pas les titres des champs ?

-> Pour certains champs, on ne scrappe d'adresse (elle est dispo sur le site sourceur) : exemple ci-dessus cf sceeshot projet ADIE Valenciennes

Eliselalique commented 5 years ago

-> Xpath des scrapers à régler