JuanDDB / FincaRaiz-WE

Este proyecto consiste en una herramienta de web scraping para la extracción de información relevante de ofertas de propiedades en Finca Raiz.
4 stars 3 forks source link

FincaRaiz-WE

Este proyecto consiste en una herramienta de web scraping para la extracción de información relevante de ofertas de propiedades en Finca Raiz.

  1. Clona este repositorio en tu máquina local.
  2. Instala las dependencias necesarias utilizando pip install -r requirements.txt.
  3. Configura las URLs de las ofertas en el archivo links.py. Realiza la búsqueda según tus requerimientos, pega el link y elige el numero de paginas a realizar web scraping en el ciclo for.
  4. Ejecuta el script principal caracteristicas.py para realizar la extracción y almacenamiento de datos. (python caracteristicas.py). Al finalizar se generará un archivo csv en la carpeta de trabajo llamada "ofertas.csv" el cual tendrá las caracteristicas de los links.
  5. Encuentra los datos exportados en el archivo CSV ofertas.csv.

Opcional: El script imagenes.py permitirá extrear las imagenes de las ofertas extraidas, este generara una carpeta por cada oferta que almacenará las imagenes. Falta mejorar, en ofertas sin imagenes o imagenes corruptas este parará y tocará iniciarlo desde el punto en el cual quedó.

Comenta que se podría mejorar.

Existe una version .exe

image

En esta podrás ingresar una URL cualquiera de Finca Raiz y se extraerá en un archivo excel, se podrá extraer con o sin imagenes. Pesa mas de lo que puedo subir, escribir para solicitarlo.

Aquí podrás ver el funcionamiento del Script:

https://www.youtube.com/watch?v=ZBdHfcTrAsY&feature=youtu.be&ab_channel=JuanDallos