Preprocessing - Githubissues

TASKS

[x] Find og download evt. testdata mens web scraperen bliver bygget (puttes i separat folder, ala /tweets/test_tweets)
[x] lav en funktion der kan kigge efter tweets i en specifik folder og loade dataen ind. lavet i app.py.
- [x] dataen skal kigges igennem for stop-words og evt. andre forstyrrende elementer (emojis, tegnsætning osv) og det skal fjernes fra data'en. Se evt. link i readme
- ~~den tilpassede data gemmes i en ny folder (/training/hashtag)~~
[ ] lav evt. test for at se om dataen er rengjort korrekt Added later
[x] include assosciated_hashtags (search for #), assosciated_persons (search for @), assosciated_urls (?) to be displayed at a later point many users add subjects themselves to their tweets- can we find correlations? example:

Hold-Krykke / PythonExam