Open NamelessW0lf opened 1 year ago
Hallo Herr Biehl (@cbiehl ), im Rahmen der Klassifikation der Wahlprogramme sind wir auf ein Problem gestoßen. Wir wollen die Themen für die Texte, die Sentiment Analysis und ggf. eine Untersuchung der Rationalität auf den Texten durchführen. Jedoch sind unsere Daten nicht kategorisiert, weshalb wir uns überlegt haben basierend auf Hand-crafted Features die Themen zu filtern. Haben Sie eine Idee, wie anderweitig wir vorgehen sollten? Wir würden zwar ein LDA machen, welche hoffentlich die Themen identifizieren kann, jedoch entspricht unseren Ansätzen sonst immer ein unstrukturierte Vorgehensweise. Alternativ ist der Vergleich von bereits trainierten Modellen mit diesen Ansatz einen Möglichkeit, siehe "zero-shot-classification" oder "sentiment_analysis_generic_dataset"
Was genau ist mit "Klassifikation der Wahlprogramme" gemeint? Ich hatte verstanden dass es zum einen um eine explorative Extraktion von Themen und Schlüsselwörtern geht und zum anderen um Sentiment Analyse. Für Letzteres ist es sicher möglich andere Datensätze (für Englisch z.B. SST) oder bereits trainierte Modelle einzubeziehen. Ich bin nicht sicher was genau mit "Untersuchung der Rationalität" gemeint ist. Vielleicht besprechen wir es morgen vor Ort.
Gruppe:
Ziel & Vorgehensweise: