matthieu637 / cpp-2a-crawler

2 stars 0 forks source link

HtmlUnit Parser #55

Open matthieu637 opened 7 years ago

matthieu637 commented 7 years ago

Il arrive que des sites utilisent JavaScript pour modifier le contenu de pages web (c'est le cas lors d'une recherche Google). Ainsi parser seulement la première requête donnera des informations incomplètes.

Contrairement à JSoup, HtmlUnit permet de simuler le fonctionnement d'un navigateur et d’exécuter le JavaScript associé pour obtenir la page finale.

Objectif : créer une nouvelle classe HTMLUnitParser (qui descend de Parser)