netGed / WebScience24

1 stars 0 forks source link

Einarbeitung in Datensatz + Entwicklung Ideen bzgl. Problemstellung und geeigneter Methoden #1

Closed sonrisa0 closed 1 month ago

sonrisa0 commented 1 month ago

Entwicklung von Ideen bzgl. Problemstellung und geeigneter Methoden

netGed commented 1 month ago

Die Problemstellung gehört grundsätzlich zur Sentiment Analysis. Nach entsprechender Vorverarbeitung (Stop words, Stemming, Tokenization usw.) der Daten sind die bekannten ML-Modelle sowie RNN mit LSTM-Layern anwendbar.

Auf dem develop-Branch habe ich schon mal ein paar Ansätze dafür erstellt. Grundsätzlich sind die Daten für "Hate-Speech Erkennung" vollkommen ungeeignet, da die Label nur grob klassifizieren und der Inhalt der Tweets auch nicht nach Hate-Speech aussieht. Eine binäre Klassifikation (negativ <-> alles andere) oder multi-class (positiv,negativ,neutral,irrelevant) ist aber problemlos möglich.

svole1 commented 1 month ago

Ihr seid ja schon richtig fleißig. Ein paar Gedanken von mir:

Fragen

Und für den Termin am Donnerstag eine Listen der Aufgaben die wir mMn verteilen können (noch nicht alle müssen am Donnerstag verteilt werden), gerne ergänzen. Und eine Liste der next steps (auch gerne ergänzen).

Aufgaben

Next Steps:

Imran1221 commented 1 month ago

Knowledge.docx Hier mal eine gute Zusammenfassung