pombreda / amcat

Automatically exported from code.google.com/p/amcat
0 stars 0 forks source link

Archive Newspapers #590

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
Al browsend kwam ik dit tegen:
http://www.volkskrant.nl/vk/nl/2/archief/integration/nmc/frameset/archive/archiv
eYear.dhtml?archiveYear=1994

en ook dit:

https://itunes.apple.com/nl/app/telegraaf-archief/id584369761?l=en&mt=8

http://archief.nrc.nl/?modus=w

http://www.trouw.nl/tr/nl/4864/archief/integration/nmc/frameset/archive/archiveY
ear.dhtml?archiveYear=2013

http://www.ad.nl/ad/nl/1401/archief/integration/nmc/frameset/archive/archiveYear
.dhtml?archiveYear=2005

Lijkt mij mooi om die archieven leeg te trekken!

Groet,
Nel

Original issue reported on code.google.com by nelruig...@nieuwsmonitor.net on 20 Sep 2013 at 11:10

GoogleCodeExporter commented 9 years ago
Die van de Telegraaf gaat niet, da's een app, maar voor de rest kunnen de 
scrapers dat prima fixen! 

Ik zet ze straks allemaal aan. Dat zal even duren, morgen kunnen we ontdubbelen 
en controleren.

Original comment by Toon.Alfrink@gmail.com on 24 Sep 2013 at 10:54

GoogleCodeExporter commented 9 years ago
Inmiddels is de AD scraper bij 2006, VK nog bij 1995, Trouw bij 1997, en nrc 
bij 1996. Er crasht af en toe wat maar ik zet het dagelijks weer aan, geef het 
nog een dag of 3. 

Original comment by Toon.Alfrink@gmail.com on 18 Oct 2013 at 5:07

GoogleCodeExporter commented 9 years ago
Da's allemaal vanaf 1990.

Original comment by Toon.Alfrink@gmail.com on 18 Oct 2013 at 5:07

GoogleCodeExporter commented 9 years ago
Ok prima toon, we zien het wel vollopen.

Original comment by vanatteveldt@gmail.com on 18 Oct 2013 at 9:52