Voici un README complet et détaillé pour votre projet de scraping d'hôtels sur Booking.com.
Ce projet est un script Python qui utilise Selenium et Tkinter pour extraire des informations d'hôtels depuis Booking.com. Il inclut une interface graphique pour faciliter la configuration des paramètres de recherche (destination, dates) et enregistre les résultats dans un fichier Excel. Ce script est utile pour collecter des informations telles que les prix, les étoiles, les avis, et calculer la distance entre chaque hôtel et un lieu spécifique.
hotels_booking.py
: Script principal pour le scraping d’hôtels.README.md
: Documentation du projet..gitignore
: Fichier pour ignorer les fichiers inutiles (comme .DS_Store
).requirements.txt
: Liste des bibliothèques Python nécessaires pour exécuter le script.Avant d'exécuter le script, assurez-vous d'avoir installé les éléments suivants :
selenium
webdriver_manager
pandas
geopy
tkinter
(inclus avec Python)Vous pouvez installer les dépendances en utilisant le fichier requirements.txt
.
Clonez ce dépôt sur votre machine :
git clone https://github.com/ALeterouin/Booking_scraper.git
cd Booking_scraper
Installez les bibliothèques nécessaires :
pip install -r requirements.txt
Lancez le script :
python hotels_booking.py
Entrez les informations de recherche :
YYYY-MM-DD
).Lancez le scraping :
extract_hotels(driver)
: Récupère les informations sur chaque hôtel affiché (nom, étoiles, prix, note, lien) depuis la page de résultats de Booking.com.fetch_details(driver, hotel_link)
: Accède à la page d’un hôtel pour récupérer l'adresse, la latitude et la longitude.calculate_distance(hotel_coords, event_coords)
: Utilise la bibliothèque geopy
pour calculer la distance entre l'hôtel et un lieu d'événement donné.run_scraping(destination, checkin_date, checkout_date)
: Fonction principale pour configurer le navigateur, exécuter le scraping et enregistrer les résultats dans un fichier Excel.on_submit()
: Fonction de rappel pour le bouton "Lancer le Scraping", qui récupère les informations entrées par l'utilisateur et lance le processus de scraping.L'interface graphique comporte trois champs d'entrée :
Un bouton "Lancer le Scraping" lance le processus et affiche les résultats dans une boîte de dialogue une fois terminé.
Les résultats sont enregistrés dans un fichier Excel nommé selon le modèle suivant :
Hotels - <destination> - <checkin_date> - <checkout_date>.xlsx
Chaque ligne du fichier contient des informations comme :
Ce projet est destiné à un usage éducatif uniquement. Le scraping de sites web comme Booking.com peut être contraire à leurs conditions d’utilisation. Utilisez ce projet de manière responsable, et respectez les règles d’utilisation du site.
Cela devrait fournir toutes les informations nécessaires aux utilisateurs pour comprendre, installer et exécuter votre projet !