ftn-ai-lab / ori-2021-siit

0 stars 0 forks source link

Prepoznavanje spam komenara na Youtube-u #17

Open FickosOP opened 3 years ago

FickosOP commented 3 years ago

Članovi tima

Asistent

Problem koji se rešava

Kreira se program koji će omogućiti proveru da li je komentar spam ili ne.

Algoritmi Pretprocesiranje teksta se vrši na sledeći način:

Kako na značaj određene reči ne bi uticao samo broj ponavljanja u jednom komentaru koristiće se ТF-IDF.

  1. Random forest
  2. Naive Bayes

Podaci koji se koriste

Podaci su preuzeti sa sajta http://archive.ics.uci.edu/ml/machine-learning-databases/00380/. Komentari su podeljeni u 5 grupa u zavisnosti od videa sa kojeg su preuzeti. Jedan komentar je predstavljen sledećim atributima:

Metrika za merenje performansi

Performanse se mere procentom ispravno klasifikovanih komentara.

Validacija rešenja

Dataset delimo na sledeće skupove:

milica-skipina commented 3 years ago

Tema nije odobrena, budući da je jedan kolega prije Vas prijavio identičan projekat. Imate mogućnost da prijavite novu temu ili da radite kolokvijum.

milica-skipina commented 3 years ago

Tema odobrena. Ostavite link ka GitHub repozitorijumu projekta. Srećan rad.

FickosOP commented 3 years ago

Link ka repozitorijumu: https://github.com/FickosOP/ORI-spam-ham_comments