Open cmaureir opened 3 years ago
Luego de realizar una refactorización del código, se puede idear una forma de crear archivos dedicados que puedan extraer información de distintas páginas, no solo de linkedin.
Quizás una propuesta pueda ser:
├── addon │ ├── facebook.py │ ├── glassdoor.py │ └── linkedin.py └── main.py
Así cada archivo puede extraer información de algunos trabajos.
Para parsear sitios web, se pueden utilizar distintos modulos y combinaciones entre ellos, sin ninguna preferencia, acá una lista:
La idea es muy buena, habría que investigar qué herramientas tienen API y cuáles no
Luego de realizar una refactorización del código, se puede idear una forma de crear archivos dedicados que puedan extraer información de distintas páginas, no solo de linkedin.
Quizás una propuesta pueda ser:
Así cada archivo puede extraer información de algunos trabajos.
Para parsear sitios web, se pueden utilizar distintos modulos y combinaciones entre ellos, sin ninguna preferencia, acá una lista: