SandovalAguilar / mpExtractor

"mpExtractor" es un conjunto de scripts, escritos en python, que permiten obtener las calificaciones de maestros del sitio web "MisProfesores.com" en un dataframe o archivo csv.
MIT License
3 stars 0 forks source link

mpExtractor

"mpExtractor" es un conjunto de scripts, escritos en python, que permiten obtener las calificaciones de maestros del sitio web "MisProfesores.com" en un dataframe o archivo csv.

Instalación

Para utilizar los scripts "htmlToDataframe.py" y "dataAnalyzer" es necesario instalar las siguientes librerías a traves del gestor de paquetes pip.

pip install requests 
pip install beautifulsoup4
pip install pandas 

Si se desea exportar los resultados a un archivo PDF, es necesario instalar las siguientes librerías.

pip install dataframe-image
pip install fpdf

También es necesario tener Google Chrome instalado.

Uso

Únicamente ejecutar el script "mpExtractor" e introducir una URL válida del sitio MisProfesores.com que corresponda a una facultad o escuela. Por ejemplo:

https://www.misprofesores.com/escuelas/UANL-FCFM_2263

Posteriormente se desplegarán una serie de opciones como:

El orden toma en cuenta el número de reseñas de cada maestro: es decir, tiene más peso un maestro con 9 de calificación pero (por ejemplo) 20 reseñas, que uno con la misma calificación pero solo con 5 reseñas. Además, tambien se encuentra en una de las carpetas una Jupyter Notebook, por si se desea experimentar directamente con el dataset.

Notas adicionales

Este proyecto es un prototipo y podría contener errores. Además, también podría modificarse completamente en el futuro.

Contributing

Pull requests are welcome. For major changes, please open an issue first to discuss what you would like to change. Please make sure to update tests as appropriate.