Open matiskay opened 9 years ago
antes he usado un fake response from spider
para testear los spiders de Scrapy.
también estuve testeando el pipeline https://github.com/proyectosdeley/proyectos_de_ley_scraper/tree/master/pdl_scraper
tener tests para manolo_scaper sería un golazo.
@aniversarioperu, genial. Voy a revisar el fake response y proponer un metodo para testear las spider de manolo.
ok, si te encargas entonces me des-auto-asignaré :smile:
@aniversarioperu, por ahora los unicos tests que tenemos son tests para los metodos parse
de varias spiders. Hacer test para los otros metodos es mas complicado porque no solo lidiamos con paginas obtenidas por GET sino que la logica involucra parametros que se envian por POST.
Ahora que se esta en proceso de refactorizar las spiders y agregar items loaders para la recoleccion de datos. Nos vemos con la necesidad de testar las spider de una manera programatica.
Actualmente mi forma de testar una spider es:
Escoger un item de la pagina final y buscar este elemento en la base de datos.
Cosas interesantes sobre los registros de visitas.
Si es que spider contracts no funciona para nuestro caso la idea seria usar pytest conectado a la base de datos y verificar que los registros estan en la base de datos.
Creo que se va necesitar agregar una comando para hacer crawling de una fecha especifica.
Link: Spider Contracts: http://doc.scrapy.org/en/latest/topics/contracts.html