Closed sonrisa0 closed 1 month ago
Die Problemstellung gehört grundsätzlich zur Sentiment Analysis. Nach entsprechender Vorverarbeitung (Stop words, Stemming, Tokenization usw.) der Daten sind die bekannten ML-Modelle sowie RNN mit LSTM-Layern anwendbar.
Auf dem develop-Branch habe ich schon mal ein paar Ansätze dafür erstellt. Grundsätzlich sind die Daten für "Hate-Speech Erkennung" vollkommen ungeeignet, da die Label nur grob klassifizieren und der Inhalt der Tweets auch nicht nach Hate-Speech aussieht. Eine binäre Klassifikation (negativ <-> alles andere) oder multi-class (positiv,negativ,neutral,irrelevant) ist aber problemlos möglich.
Ihr seid ja schon richtig fleißig. Ein paar Gedanken von mir:
Fragen
Und für den Termin am Donnerstag eine Listen der Aufgaben die wir mMn verteilen können (noch nicht alle müssen am Donnerstag verteilt werden), gerne ergänzen. Und eine Liste der next steps (auch gerne ergänzen).
Aufgaben
Next Steps:
Knowledge.docx Hier mal eine gute Zusammenfassung
Entwicklung von Ideen bzgl. Problemstellung und geeigneter Methoden