cbiehl / wwi20dsb-nlp

Natural Language Processing Lecture Repo
1 stars 0 forks source link

Themenvorschlag Hate busters #2

Open Lugeder opened 2 years ago

Lugeder commented 2 years ago

Textzusammenfassung von Daten, die wir noch finden müssen (Ideen von kaggle: Filmhandlungen auf Wikipedia, aber da müssen wir noch gucken, wie das mit den Labels aussieht, BBC)

Gruppe: Zabiullah Salehi, Philipp Dingfelder, Thi Quynh Anh Vu, Jana Lugeder, Nils-Jannik Klink

Lugeder commented 2 years ago

Neues Thema wegen zu starker Ähnlichkeiten zu anderen Gruppen:

Hate speech detection

Gruppe: Zabiullah Salehi, Philipp Dingfelder, Thi Quynh Anh Vu, Jana Lugeder, Nils-Jannik Klink

Unser Github repository: https://github.com/Lugeder/NLP

Motivation: Ziel von Kommunikationsplattformen wie Facebook oder Instagram ist ein Austausch von Personen über verschiedene Thematiken. Insbesondere wenn Thematiken vorliegen, die Personen persönlich sehr wichtig sind, können negative Kommentare, Bedrohung, Aufrufe zu Gewalt oder Missbrauch im Internet dazu führen, dass Menschen aufhören, sich zu äußern. Ein freier und ungezwungener Meinungsaustausch sinkt. Daher ist es wichtig, toxische Kommentare frühzeitig zu erkennen. Dieses Vorgehen wird als Hate Speech Detection bezeichnet.

Die Aktualität der Hate Speech Detection zeigt sich auch an der Zunahme an Posts, die beispielsweise der Meta-Konzern löschen muss. Belief sich die Anzahl im letzten Quartal 2019 noch auf 645.000 gelöschte Beiträge, hat sie sich innerhalb eines Jahres auf 6.5 Millionen Beiträge in den letzten drei Monaten des Jahres 2020 verzehnfacht (Vgl. Facebook says AI has fueled a hate speech crackdown - The Verge).

Bei dieser enormen Anzahl ist ein manuelles Moderieren schwierig und unwirtschaftlich, wodurch AI-Verfahren in den Fokus rücken.

Ziel: Ein Modell hierfür soll im Rahmen des Projekts entwickelt werden, welches negative Online-Verhaltensweisen klassifiziert. Schwerpunktmäßig werden Hassreden (Hate Speech), beleidigende Ausdrucksweisen (Offensive Language) und angebrachte Ausdrucksweisen (Normal) anhand des 1. Datensatzes klassifiziert.

Weitere zielführende Datensätze sind der 2. und 3. Datensatz.

Datensätze:

  1. Datensatz: https://www.kaggle.com/datasets/mrmorj/hate-speech-and-offensive-language-dataset
  2. Datensatz: https://github.com/zeeraktalat/hatespeech
  3. Datensatz (optional): https://www.kaggle.com/competitions/jigsaw-toxic-comment-classification-challenge/data

Wissenschaftliche Artikel: