NewsDiffs newsdiffs issues

NewsDiffs / newsdiffs

Automatic scraper that tracks changes in news articles over time.

Other

1 stars 0 forks source link

issues

Newest

Newest Most commented Recently updated Oldest Least commented Least recently updated

Support multiple URL versions per article

#15 carlgieringer opened 6 years ago
0
Address BeautifulSoup warnings

#14 carlgieringer opened 6 years ago
0
Provide some means of a user verifying the scraped contents

#13 carlgieringer opened 6 years ago
0
Update scraping to support checking high frequency articles before completing entire job

#12 carlgieringer opened 6 years ago
0
Indicate article scrape frequency and next scrape threshold

#11 carlgieringer opened 6 years ago
0
Enable users to browse past first page

#10 carlgieringer opened 6 years ago
0
Ensure unicode is used for article text throughout

#9 carlgieringer opened 6 years ago
0
Changes to headline are not tracked correctly

#8 carlgieringer opened 6 years ago
0
OperationalError: (1203, "User newsdiffs already has more than 'max_user_connections' active connections")

#7 carlgieringer opened 6 years ago
0
OSError: [Errno 11] Resource temporarily unavailable: '/afs/sipb.mit.edu/contrib/newsdiffs/web_scripts/articles/2016-05'

#6 carlgieringer opened 6 years ago
0
OSError: [Errno 110] Connection timed out: '/afs/sipb.mit.edu/contrib/newsdiffs/web_scripts/articles/old'

#5 carlgieringer opened 6 years ago
0
Email scraper errors to admins

#4 carlgieringer opened 6 years ago
1
Malformed URL while viewing article history

#3 carlgieringer opened 6 years ago
0
Too many attempts to download http://www.bbc.co.uk/news/stories?print=true

#2 carlgieringer opened 6 years ago
1
scraper creates "https/" articles directory

#1 carlgieringer opened 6 years ago
1