[x] Find og download evt. testdata mens web scraperen bliver bygget (puttes i separat folder, ala /tweets/test_tweets)
[x] lav en funktion der kan kigge efter tweets i en specifik folder og loade dataen ind.
lavet i app.py.
[x] dataen skal kigges igennem for stop-words og evt. andre forstyrrende elementer (emojis, tegnsætning osv) og det skal fjernes fra data'en. Se evt. link i readme
den tilpassede data gemmes i en ny folder (/training/hashtag)
[ ] lav evt. test for at se om dataen er rengjort korrekt
Added later
[x] include assosciated_hashtags (search for #), assosciated_persons (search for @), assosciated_urls (?) to be displayed at a later point
many users add subjects themselves to their tweets- can we find correlations?
example:
TASKS
app.py
.den tilpassede data gemmes i en ny folder (/training/hashtag)