Klasifikacija vesti: "real" vs. "fake" news

milomilo33 commented 3 years ago

Članovi tima

Asistent

Problem koji se rešava

Klasifikacija vesti na "real" ili "fake" vesti na osnovu njihovog naslova i sadržaja.

Algoritmi

U postupku pretprocesiranja će se ukloniti tzv. stop reči, vršiće se lematizacija sa politikom koja bude davala najbolje rezultate na datom problemu (npr. lematizacija samo određenih vrsta reči) i sl. sa ciljem poboljšanja tačnosti klasifikacije. Tokenizacija će, pored pojedinačnih reči, tokenizovati i susedne reči u jedan token, sa istim ciljem. Na osnovu dataset-a će se obučavati sledeći modeli:
1. Naive Bayes
2. Long short-term memory (LSTM)
3. i/ili potencijalno drugi modeli.

Podaci koji se koriste

Metrika za merenje performansi

Validacija rešenja

Dataset će se podeliti u 3 skupa: skup za obučavanje (najveći udeo početnog dataset-a), validacioni i test skup. Tačni procenti za svaki skup će biti naknadno određeni.

bandjeo commented 3 years ago

Tema odobrena, ostavite link ka repozitorijumu. Srećan rad.

milomilo33 commented 3 years ago

ftn-ai-lab / ori-2021-siit