Open ipsilio opened 4 years ago
Hi Julian, taucht der Fehler konsistent auf, also kannst du ihn verlässlich reproduzieren, z.B. beim crawlen der gleichen Seite? Kannst du außerdem Probleme mit der Internetverbindung ausschließen? Mir ist noch nicht ganz klar ob das Problem im OWS-scrapy-wrapper liegt oder in scrapy selbst, und ob wir dann überhaupt genug in scrapy eingreifen können um den Fehler (wenn überhaupt einer vorliegt) zu beheben.
Kannst du feststellen ob dadurch Inhalte "übersprungen" werden, also in den crawldaten am Ende fehlen, oder handelt es sich mehr oder weniger nur um eine Pausierung?
Grüße, Max
Hallo Max,
habe gerade (erneut) festgestellt, dass der Crawler manchmal am Ende des Crawls festhängt und wiederholt die Info bzgl. der "Crawled x pages (x pages/min)" ausgibt. Anbei eine Kopie des Logs. Grundsätzlich nicht tragisch, da der Crawl danach weitergeht, allerdings hat es in diesem Fall z.B. 10 Minuten gedauert.
Viele Grüße Julian