RafaelAybar / qa-empleo

En este proyecto se medirá el índice de fiabilidad de una empresa, así como la calidad de las ofertas que publica
GNU Lesser General Public License v3.0
17 stars 9 forks source link

Plataforma para extensiones desde distintas fuentes de información #6

Open cmaureir opened 3 years ago

cmaureir commented 3 years ago

Luego de realizar una refactorización del código, se puede idear una forma de crear archivos dedicados que puedan extraer información de distintas páginas, no solo de linkedin.

Quizás una propuesta pueda ser:

├── addon
│   ├── facebook.py
│   ├── glassdoor.py
│   └── linkedin.py
└── main.py

Así cada archivo puede extraer información de algunos trabajos.

Para parsear sitios web, se pueden utilizar distintos modulos y combinaciones entre ellos, sin ninguna preferencia, acá una lista:

RafaelAybar commented 3 years ago

La idea es muy buena, habría que investigar qué herramientas tienen API y cuáles no