manolo-rocks / manolo_scraper

Scraper de registro de visitas online. Usa Scrapy.
http://manolo.rocks
22 stars 11 forks source link

Investigar Spiders Contracts para testar las Spiders. #24

Open matiskay opened 9 years ago

matiskay commented 9 years ago

Ahora que se esta en proceso de refactorizar las spiders y agregar items loaders para la recoleccion de datos. Nos vemos con la necesidad de testar las spider de una manera programatica.

Actualmente mi forma de testar una spider es:

Si es que spider contracts no funciona para nuestro caso la idea seria usar pytest conectado a la base de datos y verificar que los registros estan en la base de datos.

Creo que se va necesitar agregar una comando para hacer crawling de una fecha especifica.

Link: Spider Contracts: http://doc.scrapy.org/en/latest/topics/contracts.html

aniversarioperu commented 9 years ago

antes he usado un fake response from spider para testear los spiders de Scrapy.

también estuve testeando el pipeline https://github.com/proyectosdeley/proyectos_de_ley_scraper/tree/master/pdl_scraper

tener tests para manolo_scaper sería un golazo.

matiskay commented 9 years ago

@aniversarioperu, genial. Voy a revisar el fake response y proponer un metodo para testear las spider de manolo.

aniversarioperu commented 9 years ago

ok, si te encargas entonces me des-auto-asignaré :smile:

matiskay commented 9 years ago

@aniversarioperu, por ahora los unicos tests que tenemos son tests para los metodos parse de varias spiders. Hacer test para los otros metodos es mas complicado porque no solo lidiamos con paginas obtenidas por GET sino que la logica involucra parametros que se envian por POST.