pombreda / amcat

Automatically exported from code.google.com/p/amcat
0 stars 0 forks source link

New scrapers newspaper internet polls #473

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
Ha Toon,

Ik heb een verzoekje voor nieuwe data die we dagelijks gescraped willen hebben. 
Het gaat om de peilingen die de kranten op hun website houden. Het gaat om de 
volgende websites:

http://www.telegraaf.nl/watuzegt/
http://www.volkskrant.nl/vk/nl/3184/opinie/poll/detail/3448323/Het-is-goed-dat-d
at-het-makkelijker-wordt-om-wapens-te-leveren-aan-Syrische-rebellen-vanuit-Europ
a.dhtml
http://www.trouw.nl/tr/nl/4492/De-Gedachte/poll/detail/3447238/Het-zijn-vooral-d
e-rijke-ouderen-die-profiteren-van-65-plus-kortingen-zeggen-de-economen-Barbara-
Baarsma-en-Henriette-Prast-Moeten-we-alle-kortingskaarten-voor-ouderen-afschaffe
n.dhtml
http://www.ad.nl/

Trouw, AD en VK hebben de poll op de homepage staan, Telegraaf op de 
watuzegt-pagina. Ik weet niet welke url het handigst is om te scrapen, maar we 
willen de volgende informatie: Stelling, resultaat (alle antwoordopties en 
percentage meenemen), aantal stemmen in totaal, bijbehorende artikel en 
reacties (indien die mogelijkheid wordt geboden).

Kan dat?

Groeten,

Joep

Original issue reported on code.google.com by joepscha...@nieuwsmonitor.net on 28 May 2013 at 2:54

GoogleCodeExporter commented 9 years ago
Nog even een toevoeging: review van scrapers-issue gaat voor. Als je hiermee 
aan de slag gaat en het lukt, geef even een seintje dan kan ik even checken of 
de data er handig uit ziet.

Thanks!

Original comment by joepscha...@nieuwsmonitor.net on 28 May 2013 at 2:58

GoogleCodeExporter commented 9 years ago
Prima!

Original comment by Toon.Alfrink@gmail.com on 28 May 2013 at 3:01

GoogleCodeExporter commented 9 years ago
Top, hoe staat het ervoor?

Original comment by joepscha...@nieuwsmonitor.net on 12 Jun 2013 at 9:39

GoogleCodeExporter commented 9 years ago
Sorry, examens, nog niet aan begonnen.

Volgende week kom ik hier waarschijnlijk aan toe

Original comment by Toon.Alfrink@gmail.com on 13 Jun 2013 at 4:54

GoogleCodeExporter commented 9 years ago
Sorry, deze is langs me heen geglipt, ga ik straks maken.
Waar wil je het resultaat? In de metadata of in de tekst?

Original comment by Toon.Alfrink@gmail.com on 21 Jul 2013 at 9:58

GoogleCodeExporter commented 9 years ago
In de tekst

-- 
Joep Schaper | Researcher

E:  joepschaper@nieuwsmonitor.net
T:  +31 20 598 31 91
M: +31 6 533 55 865

W: www.nieuwsmonitor.net
F:  www.facebook.com/NederlandseNieuwsmonitor
T:  @nieuwsmonitor

Original comment by joepscha...@nieuwsmonitor.net on 22 Jul 2013 at 10:24

GoogleCodeExporter commented 9 years ago
Duurt toch wat langer dan gedacht, maar ik verwacht het vandaag af te hebben

Original comment by Toon.Alfrink@gmail.com on 23 Jul 2013 at 8:09

GoogleCodeExporter commented 9 years ago
Is klaar! 
http://amcat-production.labs.vu.nl/navigator/project/10/articleset/3743

Original comment by Toon.Alfrink@gmail.com on 23 Jul 2013 at 11:55

GoogleCodeExporter commented 9 years ago
Dit gaat nog niet helemaal goed, de scraper is gecrashed.

Original comment by Toon.Alfrink@gmail.com on 15 Aug 2013 at 11:44