CodeandoMexico / los-scrapers

Recopilación de web scrapers para mejorar al gobierno (A collection of web-scrapers to extract government data)
12 stars 13 forks source link

Diario oficial de la federación #16

Open defvol opened 10 years ago

defvol commented 10 years ago

Estaría cool hacer algo de scraping del Diario Oficial de la Federación, porque es una fuente de datos muy valiosa pero en formatos no abiertos.

Tener un newsfeed de lo que se publica oficialmente ahí, con alertas sobre licitaciones o algún otro elemento de nuestro interés. Por lo menos un re-diseño a la información no le caería nada mal.

Por un momento pensé que tenían resuelto eso con su RSS, pero al parecer está roto http://dof.gob.mx/sumario.xml

Estaría bueno hacer un scraper y exponer todo vía un API REST para bajar estos anuncios del DOF.

defvol commented 10 years ago

Hey @HackerOfDreams tu ya tienes un scraper del DOF no? nos podrías hacer un pull-request? lo queremos calar y hacerlo API, cómo ves?

@urkonn y yo lo vamos a hacer.

ElHacker commented 10 years ago

Simon bro. Si ocupan yo les ayudo con el API!.

2013/11/17 Rod Wilhelmy notifications@github.com

Hey @HackerOfDreams https://github.com/HackerOfDreams tu ya tienes un scraper del DOF no? nos podrías hacer un pull-request? lo queremos calar y hacerlo API, cómo ves?

@urkonn https://github.com/urkonn y yo lo vamos a hacer.

— Reply to this email directly or view it on GitHubhttps://github.com/CodeandoMexico/los-scrapers/issues/16#issuecomment-28663570 .

defvol commented 10 years ago

gracias @HackerOfDreams

hey @urkonn acá está el scraper https://github.com/CodeandoMexico/web-scraping