Open FickosOP opened 3 years ago
Tema nije odobrena, budući da je jedan kolega prije Vas prijavio identičan projekat. Imate mogućnost da prijavite novu temu ili da radite kolokvijum.
Tema odobrena. Ostavite link ka GitHub repozitorijumu projekta. Srećan rad.
Link ka repozitorijumu: https://github.com/FickosOP/ORI-spam-ham_comments
Članovi tima
Asistent
Problem koji se rešava
Kreira se program koji će omogućiti proveru da li je komentar spam ili ne.
Algoritmi Pretprocesiranje teksta se vrši na sledeći način:
Kako na značaj određene reči ne bi uticao samo broj ponavljanja u jednom komentaru koristiće se ТF-IDF.
Podaci koji se koriste
Podaci su preuzeti sa sajta http://archive.ics.uci.edu/ml/machine-learning-databases/00380/. Komentari su podeljeni u 5 grupa u zavisnosti od videa sa kojeg su preuzeti. Jedan komentar je predstavljen sledećim atributima:
Metrika za merenje performansi
Performanse se mere procentom ispravno klasifikovanih komentara.
Validacija rešenja
Dataset delimo na sledeće skupove: