SebGris / project-2-web-scraping

Programme d'extraction des prix du site "Books to Scrap"
0 stars 0 forks source link
webscraping

Logo Books Online

Books Online

Extraction des données du site "Books to Scrape"

Ce programme d'extraction est un script Python, exécutable à la demande, visant à récupérer les prix du site Books to Scrape au moment de son exécution.

❓ Caractéristiques du programme

🤔 Installation

Suiviez les 3 grandes étapes ci-dessous :

1e étape : Télécharger les fichiers du programme à partir de GitHub

  1. Cliquez sur le bouton en vert nommé "Code"
  2. Dans le menu déroulant, cliquez sur "Download ZIP"
  3. Créer un dossier "Scripts Python" dans votre dossier Windows "Documents"
  4. Extraire le fichier "project-2-web-scraping-main.zip" qui vient d'être téléchargé dans le dossier "Scripts Python"

2e étape : Lancer l'Invite de commandes de Windows

  1. Dans l'Explorateur de fichiers, ouvrir le dossier "Scripts Python" (précédemment créé dans le dossier "Documents")
  2. Dans la barre d'adresse de la fenêtre Explorateur de fichiers tapez cmd à la place de l'adresse C:\Users\votre_nom\Documents\Scripts Python puis validez par "Entrée"
  3. Une nouvelle fenêtre s'ouvre, c'est l'invite de commandes de Windows

3e étape : Installer les paquets Python

  1. Tapez le texte ci-dessous dans l'invite de commandes.
  cd project-2-web-scraping-main\project_web_scraping
  pip install -r requirements.txt

[!NOTE] La commande cd est utilisée pour modifier le répertoire de travail actuel. La commande pip demande à l'installateur de paquets pour Python d'installer les paquets listés dans le fichier requirements.txt.

📖 Utilisation du programme et résultat

Comment exécuter le script Python sous Windows ?

  1. Dans l'Explorateur de fichiers, ouvrir le dossier "Scripts Python"
  2. Dans la barre d'adresse de la fenêtre Explorateur de fichiers tapez cmd à la place de l'adresse C:\Users\votre_nom\Documents\Scripts Python puis validez par "Entrée"
  3. Tapez la texte ci-dessous dans l'invite de commandes.
  python project-2-web-scraping-main\project_web_scraping\WebScraping.py

Dans quels répertoires sont enregistrés les fichiers CSV et images ?

🧐 Exemple d'utilisation et résultat

Exemple d'utilisation

Cet exemple montre comment importer les livres des catégories Biography et Business.

Au démarrage, le script Python affiche une liste des catégories disponibles

![Screenshot utilisation liste des catégories disponibles](<docs/Use/2024-10-27 15_28_07-C__Windows_System32_cmd.exe - python project-2-web-scraping-main_project_web_sc.png>)

Utilisez l'ascenseur de la fenêtre pour afficher les numéros des catégories Biography et Business

![Screenshot utilisation catégories 6 et 7](<docs/Use/2024-10-27 15_59_36-C__Windows_System32_cmd.exe - python project-2-web-scraping-main_project_web_sc.png>)

Saisir les deux numéros des catégories 6 et 7 séparés par une virgule

![Screenshot utilisation saisie des catégories](<docs/Use/2024-10-27 16_03_26-C__Windows_System32_cmd.exe - python project-2-web-scraping-main_project_web_sc.png>)

Le script Python affiche un message "Fin du traitement"

![Screenshot utilisation fin du traitement](<docs/Use/2024-10-27 16_43_01-C__Windows_System32_cmd.exe.png>)

Exemple de résultat sur les catégories Biography et Business

Les dossiers catégories dans le dossier Books to Scrape

![Screenshot résultat Dossier Books to Scrape](<docs/Result/2024-10-27 16_49_30-Books to Scrape.png>)

Dossier de la catégorie des livres Business

![Screenshot résultat Dossier de la catégorie Business](<docs/Result/2024-10-27 16_50_06-Business.png>)

Dossier images des livres de la catégorie Business

![Screenshot résultat Dossier images des livres](<docs/Result/2024-10-27 16_51_50-images.png>)

Fichier CSV de la catégorie Business ouvert dans Excel

![Screenshot résultat Fichier CSV ouvert dans Excel](<docs/Result/2024-10-27 16_53_32-2024-10-27 Catégorie Business Information Livres.csv - Excel.png>)

📚 Liens utiles sur Python

📚 Liens utiles sur GitHub