cbiehl / wwi20dsa-nlp

Natural Language Processing Lecture Repo Topics Resources
6 stars 0 forks source link

Textanalyse von Wahlprogrammen in Deutschland #1

Open NamelessW0lf opened 1 year ago

NamelessW0lf commented 1 year ago

Gruppe:

Ziel & Vorgehensweise:

NICFRU commented 1 year ago

https://github.com/NICFRU/NLP

NICFRU commented 1 year ago

Hallo Herr Biehl (@cbiehl ), im Rahmen der Klassifikation der Wahlprogramme sind wir auf ein Problem gestoßen. Wir wollen die Themen für die Texte, die Sentiment Analysis und ggf. eine Untersuchung der Rationalität auf den Texten durchführen. Jedoch sind unsere Daten nicht kategorisiert, weshalb wir uns überlegt haben basierend auf Hand-crafted Features die Themen zu filtern. Haben Sie eine Idee, wie anderweitig wir vorgehen sollten? Wir würden zwar ein LDA machen, welche hoffentlich die Themen identifizieren kann, jedoch entspricht unseren Ansätzen sonst immer ein unstrukturierte Vorgehensweise. Alternativ ist der Vergleich von bereits trainierten Modellen mit diesen Ansatz einen Möglichkeit, siehe "zero-shot-classification" oder "sentiment_analysis_generic_dataset"

cbiehl commented 1 year ago

Was genau ist mit "Klassifikation der Wahlprogramme" gemeint? Ich hatte verstanden dass es zum einen um eine explorative Extraktion von Themen und Schlüsselwörtern geht und zum anderen um Sentiment Analyse. Für Letzteres ist es sicher möglich andere Datensätze (für Englisch z.B. SST) oder bereits trainierte Modelle einzubeziehen. Ich bin nicht sicher was genau mit "Untersuchung der Rationalität" gemeint ist. Vielleicht besprechen wir es morgen vor Ort.